当前位置: 首页 > news >正文

教育云平台网站建设seo公司彼亿营销

教育云平台网站建设,seo公司彼亿营销,用github做网站,更新公司网站内容需要目录三、Python爬虫的构建User-Agnet代理池3.1 自定义UA代理池3.2 模块随机获取UA三、Python爬虫的构建User-Agnet代理池 在编写爬虫程序时,一般都会构建一个 User-Agent (用户代理)池,就是把多个浏览器的 UA 信息放进列表中&…

目录

  • 三、Python爬虫的构建User-Agnet代理池
    • 3.1 自定义UA代理池
    • 3.2 模块随机获取UA

三、Python爬虫的构建User-Agnet代理池

在编写爬虫程序时,一般都会构建一个 User-Agent (用户代理)池,就是把多个浏览器的 UA 信息放进列表中,然后再从中随机选择。构建用户代理池,能够避免总是使用一个 UA 来访问网站,因为短时间内总使用一个 UA 高频率访问的网站,可能会引起网站的警觉,从而封杀掉 IP。

3.1 自定义UA代理池

构建代理池的方法也非常简单,在您的 Pycharm 工作目录中定义一个 ua_info.py 文件,并将以下 UA 信息以列表的形式粘贴到该文件中,如下所示:

ua_list = ['Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0','Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11','User-Agent:Opera/9.80 (Windows NT 6.1; U; en) Presto/2.8.131 Version/11.11','Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1','Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50','Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0',' Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1','Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1',' Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:2.0.1) Gecko/20100101 Firefox/4.0.1',
]

经过上述操作,用户代理池就构建成功。

3.2 模块随机获取UA

您也可以使用专门第三方的模块来随机获取浏览器 UA 信息,不过该模块需要单独安装,安装方式如下:

pip install fake-useragent

下载安装成功后,演示如下代码:

from fake_useragent import UserAgent# 实例化一个对象
ua = UserAgent()
# 随机获取一个ie浏览器ua
print(ua.ie)
print(ua.ie)
# 随机获取一个火狐浏览器ua
print(ua.firefox)
print(ua.firefox)

上面代码运行结果如下 -

Mozilla/4.0 (compatible; MSIE 6.0b; Windows NT 4.0)
Mozilla/4.0 (compatible; MSIE 6.0b; Windows NT 5.0; YComp 5.0.0.0) (Compatible;  ;  ; Trident/4.0)
Mozilla/5.0 (Windows; U; Windows NT 5.1; sv-SE; rv:1.8.1.17) Gecko/20080829 Firefox/2.0.0.17
Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:14.0) Gecko/20120405 Firefox/14.0a1
http://www.yidumall.com/news/86657.html

相关文章:

  • 深圳ui设计师招聘宁波seo网页怎么优化
  • 任何用c语言做网站网络营销策划书
  • wordpress图片属性添加图片不显示北京网站优化推广方案
  • 国外网站排名 top100北京高端网站建设
  • 建设通网站上的业绩能否有用亚马逊关键词优化软件
  • 网站上的销售怎么做百度图片识别在线识图
  • 网站建设销售发展前景百度seo软件
  • 做图片视频的网站有哪些问题吗域名查询 ip
  • 网站建设 预算网奇seo培训官网
  • 云服务器 部署网站赤峰seo
  • 用什么做响应式网站百度推广优化怎么做
  • 网站增加网页百度图片识别在线使用
  • 2017年最新网站设计风格杭州搜索引擎排名
  • 开车小视频素材安卓优化大师下载安装
  • 中国建设银行预约网站首页关键路径
  • c2c网站有哪些?网站建设制作模板
  • web网站开发的流程图小程序开发公司前十名
  • wordpress图片特效插件下载东莞网站seo公司
  • 四川炜航建筑公司网站推广页面
  • 创意产品设计获奖作品太原关键词优化服务
  • 六安网站优化关键词搜索点击软件
  • 做网站的电话号码国内搜索网站排名
  • 做网站公司用盗版代码给客户起诉了seo入门培训学校
  • 网站自然排名怎么做济南最新消息今天
  • 购买域名网站网络营销公司全网推广公司
  • 小型网站网站建设需要采集站seo提高收录
  • 东营seo网站建设费用提高工作效率
  • 网站建设动画代码常州网站建设
  • 企业网站备个人怎么安装百度
  • 用git 做网站最热门的短期培训课程