欢迎来我Python萌新的小站

Python笔记:BeautifulSoup库的安装和使用

安装BeautifulSoup

首先,从 https://pypi.python.org/pypi/beautifulsoup4 上下载最新版本BeautifulSoup4

然后使用命令行安装python setup.py install

等安装完成后可以测试一下安装是否成功,进入IDLE,输入  from bs4 import BeautifulSoup ,如果没有报错即为安装成功。

BeautifulSoup常用操作

首先来一个传送门:BeautifulSoup官方文档: 英文最新文档    中文版文档

首先我们需要引入BeautifulSoup库

我们创建一个字符串,后面的例子我们便会用它来演示

创建 beautifulsoup 对象

下面我们来打印一下 soup 对象的内容,格式化输出

5. 四大对象种类

Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种:

  • Tag
  • NavigableString
  • BeautifulSoup
  • Comment

下面我们进行一一介绍

(1)Tag

Tag 是什么?通俗点讲就是 HTML 中的一个个标签,例如  <title>The Dormouse's story</title> 、 <a class="sister" href="http://example.com/elsie" id="link1">Elsie</a> 。

下面每一段代码中注释部分即为运行结果

喜欢 (0)分享 (0)
发表我的评论
取消评论
友情提示:插入代码时请使用:  <pre>要插入的代码</pre>   以达到最佳效果!

表情     7 + 8 = ? (必填)

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址