前两天和朋友聊天,说最近每次回家做饭都不知道要吃什么,好苦恼。
对于选择这种事情,不能因为这个浪费了人生啊,对吧。
基于对好友的“体贴”(我也是够无聊的),就搞一个随机生成菜单的脚本吧!
我们就让Python这个好朋友帮我们来选择一下——今天吃什么~
基本逻辑
1、自己选择想要...
松鼠男
4年前 (2019-05-13) 28924℃ 4评论
16喜欢
前几天写的《Python实例:分析豆瓣影片评论Ver 1.0版本》文章中,关于爬取数据过频繁导致IP被封禁的事情让我对豆瓣数据的爬取中断了。忽然想到之前有写过关于关于使用selenium库的webdriver来模拟用户的操作。那今天不妨试试使用selenium来模拟用户使用浏览...
松鼠男
6年前 (2017-08-25) 23161℃ 0评论
3喜欢
呼,好久没来写博客了、差点真的变成从入门到放弃了呢。不过讲真,这段时间真是荒废了好一阵呢。嘛,月初看了《战狼》,爽爽的。然后看到网上好多做战狼评论分析的文章。忍不住自己也弄了个。
好吧。Talk is cheap, show me the code…
首先当然是要导...
松鼠男
6年前 (2017-08-22) 302114℃ 1评论
3喜欢
看到网上很多教程教大家爬取淘宝的淘女郎图库。看来美女对程序猿们的吸引力不可谓不大啊。于是乎,根据昨晚学习的经历(详见《Python实例:JS爬虫,抓取今日头条“街拍”图库》),自己也写一个爬取淘宝淘女郎图库的代码。
大概看了下网上的教程,很多教程都是通过PhantomJS来爬取...
松鼠男
6年前 (2017-06-03) 5291℃ 0评论
3喜欢
今日头条上搜索“街拍”(http://www.toutiao.com/search/?keyword=街拍)页面后,会出现一系列街拍的图片。
而这些数据如果用之前的爬取静态页面的爬虫是抓取不到数据的。因为今日头条用的是js代码把数据传到前端。那么要如何分析和抓取数据呢?
首先我...
松鼠男
6年前 (2017-06-03) 6041℃ 0评论
0喜欢
因为工作的需要,我需要下载现有学校各个版本的电子课本的封面拿来给到我们的UI设计师做参考设计。但是那么多出版社那么多个版本的电子课本,一张一张图片下载耗时不说,也实在是让人闹心。
前几天写了一个图片下载的爬虫《Python实例:一个简单的图片小爬虫》,想着修改一下用来下载电子课本...
松鼠男
6年前 (2017-05-25) 5395℃ 0评论
3喜欢
之前做过爬取百度贴吧指定帖子下的所有图片:《Python实例:一个简单的图片小爬虫》。
今天想着爬取一下文字方面的内容以巩固爬虫基础。
想着那就爬取一下暴走漫画文字频道的数据吧。首先,打开暴走漫画文字频道页面:http://baozoumanhua.com/text/。
分析它...
松鼠男
6年前 (2017-05-24) 4836℃ 0评论
0喜欢
心血来潮,来折腾一个利用有道翻译页面爬取返回翻译结果的代码。首先使用自带的urllib库实现:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# 输入英文,从有道词典返回中文翻译
import ...
松鼠男
6年前 (2017-05-24) 5864℃ 0评论
2喜欢
看了网易云课堂的视频之后写了一个简单的小爬虫demo,爬取百度贴吧中
https://tieba.baidu.com/p/5124919640 页面的图片。
#!/usr/bin/env python3
# -*- coding: utf-...
松鼠男
6年前 (2017-05-21) 6541℃ 1评论
2喜欢
编译
频繁使用的正则表达式可以通过编译的方式方便调用。
import re
r1 = r"\d{3,4}-?\d{7,8}$"
p_tel = re.compile(r1)
p_tel.findall("010-12345678")
...
松鼠男
6年前 (2017-05-20) 5580℃ 0评论
1喜欢