导入爬虫的基本库函数
##了解一下我们的Request headers: 包含更多有关要获取的资源或客户端本身信息的消息头。
import requests # 常用的爬虫库
引入一个库来使用我们相关的请求消息头
from fake_useragent import UserAgent
这个需要安装相关的包,使用命令如下:
pip3 install fake-useragent
接下来就是如何使用的阶段了!
import requests from fake_useragent import UserAgent def getHtml(url): try: ua = UserAgent() # 随机UA headers = {'user-agent': ua.random} r = requests.get(url, headers=headers) r.raise_for_status() print("爬取成功!") print(r.text) except Exception: print("爬取失败!") url = "https://www.xmaven.cn" getHtml(url)
评论区