之前写过一篇关于《利用pytesseract库进行图片文字识别》的文章,那篇文章中,仅仅是做一个简单的demo,用于演示图片文字识别的功能。但是那时候挖了一个坑。在面对验证码的时候,图片的噪点对识别准确性影响很大。今天,针对这个问题,对要识别的图片做一个简单的处理。
之前的代码:...
松鼠男
5年前 (2018-02-08) 173448℃ 6评论
33喜欢
在做爬虫的时候经常遇到图片验证码。这是一个很蛋疼的东西,我每次都得自己去手动输入抓取的图片验证码。有没有办法可以通过OCR来进行处理图片中的文字呢?
有!
嘛,不过今天这个pytesseract库只是一个基础的文字识别库。
首先当然是需要安装pytesseract库还有图像处理的...
松鼠男
6年前 (2017-08-23) 125524℃ 4评论
25喜欢