欢迎来我Python萌新的小站

标签:PIL库

Python 实例

Python实例:利用pytesseract库进行图片文字识别(二)

之前写过一篇关于《利用pytesseract库进行图片文字识别》的文章,那篇文章中,仅仅是做一个简单的demo,用于演示图片文字识别的功能。但是那时候挖了一个坑。在面对验证码的时候,图片的噪点对识别准确性影响很大。今天,针对这个问题,对要识别的图片做一个简单的处理。 之前的代码:...

松鼠男 5年前 (2018-02-08) 184777℃ 6评论 33喜欢

Python 实例

Python实例:通过selenium模拟登陆豆瓣

前几天写的《Python实例:分析豆瓣影片评论Ver 1.0版本》文章中,关于爬取数据过频繁导致IP被封禁的事情让我对豆瓣数据的爬取中断了。忽然想到之前有写过关于关于使用selenium库的webdriver来模拟用户的操作。那今天不妨试试使用selenium来模拟用户使用浏览...

松鼠男 6年前 (2017-08-25) 23351℃ 0评论 3喜欢

Python 实例

Python实例:利用pytesseract库进行图片文字识别

在做爬虫的时候经常遇到图片验证码。这是一个很蛋疼的东西,我每次都得自己去手动输入抓取的图片验证码。有没有办法可以通过OCR来进行处理图片中的文字呢? 有! 嘛,不过今天这个pytesseract库只是一个基础的文字识别库。 首先当然是需要安装pytesseract库还有图像处理的...

松鼠男 6年前 (2017-08-23) 126076℃ 4评论 25喜欢