• 欢迎光临~

爬虫

开发技术 开发技术 2022-07-25 次浏览

一、urllib(urllib.request)

https://docs.python.org/zh-cn/3.7/library/urllib.html

 

urllib 是一个收集了多个用到 URL 的模块的包:

  • urllib.request 打开和读取 URL
  • urllib.error 包含 urllib.request 抛出的异常
  • urllib.parse 用于解析 URL
  • urllib.robotparser 用于解析 robots.txt 文件

二、requests

 

三、BeautifulSoup4

 

程序员灯塔
转载请注明原文链接:爬虫
喜欢 (0)