看到网上很多教程教大家爬取淘宝的淘女郎图库。看来美女对程序猿们的吸引力不可谓不大啊。于是乎,根据昨晚学习的经历(详见《Python实例:JS爬虫,抓取今日头条“街拍”图库》),自己也写一个爬取淘宝淘女郎图库的代码。
大概看了下网上的教程,很多教程都是通过PhantomJS来爬取...
松鼠男
6年前 (2017-06-03) 5381℃ 0评论
3喜欢
今日头条上搜索“街拍”(http://www.toutiao.com/search/?keyword=街拍)页面后,会出现一系列街拍的图片。
而这些数据如果用之前的爬取静态页面的爬虫是抓取不到数据的。因为今日头条用的是js代码把数据传到前端。那么要如何分析和抓取数据呢?
首先我...
松鼠男
6年前 (2017-06-03) 6150℃ 0评论
0喜欢
因为工作的需要,我需要下载现有学校各个版本的电子课本的封面拿来给到我们的UI设计师做参考设计。但是那么多出版社那么多个版本的电子课本,一张一张图片下载耗时不说,也实在是让人闹心。
前几天写了一个图片下载的爬虫《Python实例:一个简单的图片小爬虫》,想着修改一下用来下载电子课本...
松鼠男
6年前 (2017-05-25) 5469℃ 0评论
3喜欢