前两天和朋友聊天,说最近每次回家做饭都不知道要吃什么,好苦恼。
对于选择这种事情,不能因为这个浪费了人生啊,对吧。
基于对好友的“体贴”(我也是够无聊的),就搞一个随机生成菜单的脚本吧!
我们就让Python这个好朋友帮我们来选择一下——今天吃什么~
基本逻辑
1、自己选择想要...
松鼠男
4年前 (2019-05-13) 28924℃ 4评论
16喜欢
最近正好公司有个项目需要将现有编码转为汉明码进行数据传输,闲来无事,就简单写了一个demo实现汉明码的输出和校验。
汉明码(Hamming Code)是广泛用于内存和磁盘纠错的编码。汉明码不仅可以用来检测转移数据时发生的错误,还可以用来修正错误。(要注意的是,汉明码只能发现和修正...
松鼠男
5年前 (2018-08-14) 12757℃ 2评论
10喜欢
之前写过一篇关于《利用pytesseract库进行图片文字识别》的文章,那篇文章中,仅仅是做一个简单的demo,用于演示图片文字识别的功能。但是那时候挖了一个坑。在面对验证码的时候,图片的噪点对识别准确性影响很大。今天,针对这个问题,对要识别的图片做一个简单的处理。
之前的代码:...
松鼠男
5年前 (2018-02-08) 173448℃ 6评论
33喜欢
前几天写的《Python实例:分析豆瓣影片评论Ver 1.0版本》文章中,关于爬取数据过频繁导致IP被封禁的事情让我对豆瓣数据的爬取中断了。忽然想到之前有写过关于关于使用selenium库的webdriver来模拟用户的操作。那今天不妨试试使用selenium来模拟用户使用浏览...
松鼠男
6年前 (2017-08-25) 23161℃ 0评论
3喜欢
在做爬虫的时候经常遇到图片验证码。这是一个很蛋疼的东西,我每次都得自己去手动输入抓取的图片验证码。有没有办法可以通过OCR来进行处理图片中的文字呢?
有!
嘛,不过今天这个pytesseract库只是一个基础的文字识别库。
首先当然是需要安装pytesseract库还有图像处理的...
松鼠男
6年前 (2017-08-23) 125524℃ 4评论
25喜欢
呼,好久没来写博客了、差点真的变成从入门到放弃了呢。不过讲真,这段时间真是荒废了好一阵呢。嘛,月初看了《战狼》,爽爽的。然后看到网上好多做战狼评论分析的文章。忍不住自己也弄了个。
好吧。Talk is cheap, show me the code…
首先当然是要导...
松鼠男
6年前 (2017-08-22) 302104℃ 1评论
3喜欢
看到网上很多教程教大家爬取淘宝的淘女郎图库。看来美女对程序猿们的吸引力不可谓不大啊。于是乎,根据昨晚学习的经历(详见《Python实例:JS爬虫,抓取今日头条“街拍”图库》),自己也写一个爬取淘宝淘女郎图库的代码。
大概看了下网上的教程,很多教程都是通过PhantomJS来爬取...
松鼠男
6年前 (2017-06-03) 5289℃ 0评论
3喜欢
今日头条上搜索“街拍”(http://www.toutiao.com/search/?keyword=街拍)页面后,会出现一系列街拍的图片。
而这些数据如果用之前的爬取静态页面的爬虫是抓取不到数据的。因为今日头条用的是js代码把数据传到前端。那么要如何分析和抓取数据呢?
首先我...
松鼠男
6年前 (2017-06-03) 6041℃ 0评论
0喜欢
因为工作的需要,我需要下载现有学校各个版本的电子课本的封面拿来给到我们的UI设计师做参考设计。但是那么多出版社那么多个版本的电子课本,一张一张图片下载耗时不说,也实在是让人闹心。
前几天写了一个图片下载的爬虫《Python实例:一个简单的图片小爬虫》,想着修改一下用来下载电子课本...
松鼠男
6年前 (2017-05-25) 5395℃ 0评论
3喜欢
之前做过爬取百度贴吧指定帖子下的所有图片:《Python实例:一个简单的图片小爬虫》。
今天想着爬取一下文字方面的内容以巩固爬虫基础。
想着那就爬取一下暴走漫画文字频道的数据吧。首先,打开暴走漫画文字频道页面:http://baozoumanhua.com/text/。
分析它...
松鼠男
6年前 (2017-05-24) 4836℃ 0评论
0喜欢