欢迎来我Python萌新的小站

 分类:Python 实例

用Python实现汉明码生成及校验

最近正好公司有个项目需要将现有编码转为汉明码进行数据传输,闲来无事,就简单写了一个demo实现汉明码的输出和校验。 汉明码(Hamming Code)是广泛用于内存和磁盘纠错的编码。汉明码不仅可以用来检测转移数据时发生的错误,还可以用来修正错误。(要注意的是,汉明码只能发现和修正...

松鼠男 4个月前 (08-14) 690℃ 0评论 1喜欢

Python实例:利用pytesseract库进行图片文字识别(二)

之前写过一篇关于《利用pytesseract库进行图片文字识别》的文章,那篇文章中,仅仅是做一个简单的demo,用于演示图片文字识别的功能。但是那时候挖了一个坑。在面对验证码的时候,图片的噪点对识别准确性影响很大。今天,针对这个问题,对要识别的图片做一个简单的处理。 之前的代码:...

松鼠男 10个月前 (02-08) 15109℃ 4评论 10喜欢

Python实例:利用pytesseract库进行图片文字识别

在做爬虫的时候经常遇到图片验证码。这是一个很蛋疼的东西,我每次都得自己去手动输入抓取的图片验证码。有没有办法可以通过OCR来进行处理图片中的文字呢? 有! 嘛,不过今天这个pytesseract库只是一个基础的文字识别库。 首先当然是需要安装pytesseract库还有图像处理的...

松鼠男 1年前 (2017-08-23) 43638℃ 4评论 8喜欢

Python实例:JS爬虫之爬取淘宝淘女郎图库

看到网上很多教程教大家爬取淘宝的淘女郎图库。看来美女对程序猿们的吸引力不可谓不大啊。于是乎,根据昨晚学习的经历(详见《Python实例:JS爬虫,抓取今日头条“街拍”图库》),自己也写一个爬取淘宝淘女郎图库的代码。 大概看了下网上的教程,很多教程都是通过PhantomJS来爬取...

松鼠男 2年前 (2017-06-03) 1730℃ 0评论 2喜欢

Python实例:JS爬虫,抓取今日头条“街拍”图库

今日头条上搜索“街拍”(http://www.toutiao.com/search/?keyword=街拍)页面后,会出现一系列街拍的图片。 而这些数据如果用之前的爬取静态页面的爬虫是抓取不到数据的。因为今日头条用的是js代码把数据传到前端。那么要如何分析和抓取数据呢? 首先我...

松鼠男 2年前 (2017-06-03) 2013℃ 0评论 0喜欢

Python实例:爬取电子课本封面

因为工作的需要,我需要下载现有学校各个版本的电子课本的封面拿来给到我们的UI设计师做参考设计。但是那么多出版社那么多个版本的电子课本,一张一张图片下载耗时不说,也实在是让人闹心。 前几天写了一个图片下载的爬虫《Python实例:一个简单的图片小爬虫》,想着修改一下用来下载电子课本...

松鼠男 2年前 (2017-05-25) 1649℃ 0评论 1喜欢

Python实例:爬取暴走漫画文字频道热门数据

之前做过爬取百度贴吧指定帖子下的所有图片:《Python实例:一个简单的图片小爬虫》。 今天想着爬取一下文字方面的内容以巩固爬虫基础。 想着那就爬取一下暴走漫画文字频道的数据吧。首先,打开暴走漫画文字频道页面:http://baozoumanhua.com/text/。 分析它...

松鼠男 2年前 (2017-05-24) 1239℃ 0评论 0喜欢