欢迎来我Python萌新的小站

标签:PIL库

Python 实例

Python实例:利用pytesseract库进行图片文字识别(二)

之前写过一篇关于《利用pytesseract库进行图片文字识别》的文章,那篇文章中,仅仅是做一个简单的demo,用于演示图片文字识别的功能。但是那时候挖了一个坑。在面对验证码的时候,图片的噪点对识别准确性影响很大。今天,针对这个问题,对要识别的图片做一个简单的处理。 之前的代码:...

松鼠男 10个月前 (02-08) 15109℃ 4评论 10喜欢

Python 实例

Python实例:通过selenium模拟登陆豆瓣

前几天写的《Python实例:分析豆瓣影片评论Ver 1.0版本》文章中,关于爬取数据过频繁导致IP被封禁的事情让我对豆瓣数据的爬取中断了。忽然想到之前有写过关于关于使用selenium库的webdriver来模拟用户的操作。那今天不妨试试使用selenium来模拟用户使用浏览...

松鼠男 1年前 (2017-08-25) 7688℃ 0评论 0喜欢

Python 实例

Python实例:利用pytesseract库进行图片文字识别

在做爬虫的时候经常遇到图片验证码。这是一个很蛋疼的东西,我每次都得自己去手动输入抓取的图片验证码。有没有办法可以通过OCR来进行处理图片中的文字呢? 有! 嘛,不过今天这个pytesseract库只是一个基础的文字识别库。 首先当然是需要安装pytesseract库还有图像处理的...

松鼠男 1年前 (2017-08-23) 43638℃ 4评论 8喜欢