Python 是一门简单易学且功能强大的编程语言,无需繁琐的配置,掌握基本语法,了解基本库函数,就可以通过调用海量的现有工具包编写自己的程序,轻松实现批量自动化操作,可以极大提高办公和学习效率。Python爬虫可以批量获取网页上的数据。
Python的环境配置
1. 代码编辑器 Pycharm community
2. 代码解释器 Python 3.7.6
3. 在Pycharm中创建项目并配置Python环境
4. 安装工具包的两种方式
4399小游戏爬虫实战
1、爬虫的基本步骤
使用requests下载网页
使用BeautifulSoup将requests下载的内容解析为DOM (文档对象模型)
通过DOM获取所需要的数据
2、4399小游戏的本地运行
支持下载到本地的游戏 : 以 .swf 为扩展名的游戏
游戏主体页的的src属性可以得到绝对地址
游戏信息页可以获取相对地址: 在