侧边栏壁纸
博主头像
Epoch

Java开发、Python爬虫、微服务、分布式、前端

  • 累计撰写 94 篇文章
  • 累计创建 111 个标签
  • 累计收到 8 条评论

目 录CONTENT

文章目录

Python 爬虫——随机UA

Epoch
2020-06-03 / 0 评论 / 0 点赞 / 380 阅读 / 177 字 / 正在检测是否收录...

导入爬虫的基本库函数

##了解一下我们的Request headers: 包含更多有关要获取的资源或客户端本身信息的消息头。

import requests  # 常用的爬虫库

引入一个库来使用我们相关的请求消息头

from fake_useragent import UserAgent

这个需要安装相关的包,使用命令如下:

pip3  install fake-useragent

接下来就是如何使用的阶段了!

import requests
from fake_useragent import UserAgent

def getHtml(url):
    try:
        ua = UserAgent()
        # 随机UA
        headers = {'user-agent': ua.random}
        r = requests.get(url, headers=headers)
        r.raise_for_status()
        print("爬取成功!")
        print(r.text)
    except Exception:
        print("爬取失败!")

url = "https://www.xmaven.cn"
getHtml(url)

展示结果如下:

JOLJMR.png

0

评论区