欢迎来我Python萌新的小站

标签:urllib库

Python 实例

Python实例:通过selenium模拟登陆豆瓣

前几天写的《Python实例:分析豆瓣影片评论Ver 1.0版本》文章中,关于爬取数据过频繁导致IP被封禁的事情让我对豆瓣数据的爬取中断了。忽然想到之前有写过关于关于使用selenium库的webdriver来模拟用户的操作。那今天不妨试试使用selenium来模拟用户使用浏览...

松鼠男 1年前 (2017-08-25) 7690℃ 0评论 0喜欢

Python 实例

Python实例:分析豆瓣影片评论Ver 1.0版本

呼,好久没来写博客了、差点真的变成从入门到放弃了呢。不过讲真,这段时间真是荒废了好一阵呢。嘛,月初看了《战狼》,爽爽的。然后看到网上好多做战狼评论分析的文章。忍不住自己也弄了个。 好吧。Talk is cheap, show me the code… 首先当然是要导...

松鼠男 1年前 (2017-08-22) 5993℃ 1评论 1喜欢

Python 实例

Python实例:JS爬虫之爬取淘宝淘女郎图库

看到网上很多教程教大家爬取淘宝的淘女郎图库。看来美女对程序猿们的吸引力不可谓不大啊。于是乎,根据昨晚学习的经历(详见《Python实例:JS爬虫,抓取今日头条“街拍”图库》),自己也写一个爬取淘宝淘女郎图库的代码。 大概看了下网上的教程,很多教程都是通过PhantomJS来爬取...

松鼠男 2年前 (2017-06-03) 1730℃ 0评论 2喜欢

Python 实例

Python实例:JS爬虫,抓取今日头条“街拍”图库

今日头条上搜索“街拍”(http://www.toutiao.com/search/?keyword=街拍)页面后,会出现一系列街拍的图片。 而这些数据如果用之前的爬取静态页面的爬虫是抓取不到数据的。因为今日头条用的是js代码把数据传到前端。那么要如何分析和抓取数据呢? 首先我...

松鼠男 2年前 (2017-06-03) 2014℃ 0评论 0喜欢

Python 实例

Python实例:爬取电子课本封面

因为工作的需要,我需要下载现有学校各个版本的电子课本的封面拿来给到我们的UI设计师做参考设计。但是那么多出版社那么多个版本的电子课本,一张一张图片下载耗时不说,也实在是让人闹心。 前几天写了一个图片下载的爬虫《Python实例:一个简单的图片小爬虫》,想着修改一下用来下载电子课本...

松鼠男 2年前 (2017-05-25) 1649℃ 0评论 1喜欢