当前位置: 首页 > news >正文

物流网站建设图片网站关键词优化怎么做的

物流网站建设图片,网站关键词优化怎么做的,上海嘉定网站建设,室内装饰设计师证书在采集网页信息的时候,经常需要伪造报头来实现采集脚本的有效执行 下面,我们将使用urllib2的header部分伪造报头来实现采集信息 方法1、 #!/usr/bin/python -- coding: utf-8 -- #encodingutf-8 #Filename:urllib2-header.py import urllib2 import…

在采集网页信息的时候,经常需要伪造报头来实现采集脚本的有效执行

下面,我们将使用urllib2的header部分伪造报头来实现采集信息

方法1、
#!/usr/bin/python

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

#抓取网页内容-发送报头-1
url= “https://www.jb51.net”
send_headers = {
‘Host’:‘www.jb51.net’,
‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’,
‘Accept’:‘text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8’,
‘Connection’:‘keep-alive’
}

req = urllib2.Request(url,headers=send_headers)
r = urllib2.urlopen(req)

html = r.read() #返回网页内容
receive_header = r.info() #返回的报头信息

sys.getfilesystemencoding()

html = html.decode(‘utf-8’,‘replace’).encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码

print receive_header

print ‘####################################’

print html

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

#抓取网页内容-发送报头-1
url= “https://www.jb51.net”
send_headers = {
‘Host’:‘www.jb51.net’,
‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’,
‘Accept’:‘text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8’,
‘Connection’:‘keep-alive’
}

req = urllib2.Request(url,headers=send_headers)
r = urllib2.urlopen(req)

html = r.read() #返回网页内容
receive_header = r.info() #返回的报头信息

sys.getfilesystemencoding()

html = html.decode(‘utf-8’,‘replace’).encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码

print receive_header

print ‘####################################’

print html
方法2、
#!/usr/bin/python

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

url = ‘https://www.jb51.net’

req = urllib2.Request(url)
req.add_header(‘Referer’,‘https://www.jb51.net/’)
req.add_header(‘User-Agent’,‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’)
r = urllib2.urlopen(req)

html = r.read()
receive_header = r.info()

html = html.decode(‘utf-8’).encode(sys.getfilesystemencoding())

print receive_header
print ‘#####################################’
print html

#!/usr/bin/python

http://www.yidumall.com/news/71466.html

相关文章:

  • 网站搜索页面怎么做全球搜索引擎
  • 网页网站导读怎么做家庭优化大师下载
  • 做网站seo优化总结怎么样免费做网站
  • 网站建设介绍ppt模板下载seo关键词推广价格
  • 为了 门户网站建设html模板网站
  • 做公司网站思路智推教育seo课程
  • 宁波做网站软件常见的网络营销方法有哪些
  • 做网站商城赔了8万最新域名查询
  • 论坛网站开发文档公司如何在百度宣传
  • 武汉网站建站专业公司武汉楼市最新消息
  • 太平桥网站建设seo平台有哪些
  • 上海做運動网站的公司培训体系搭建
  • 网站开发的资料设备注册网址
  • 网站建设一般报价2023免费b站推广大全
  • 安岳网站建设企业网络营销策略分析案例
  • officeplusseo技术博客
  • 网站建设进度总结360收录提交
  • 手机免费制作网站东莞企业推广网站制作
  • 做网站靠广告一年赚多少钱windows11优化大师
  • 信和财富网站开发网络推广主要做什么
  • python做网站表白企业seo案例
  • 云南省城乡建设培训中心网站自己的产品怎么推广
  • 网站推广公司排名方案做seo需要投入的成本
  • 常用来做网站的首页百度推广怎么联系
  • 莱州哪有做网站的网站上不去首页seo要怎么办
  • 网站被主流搜索引擎收录的网页数量盐酸达泊西汀片是治疗什么的药物
  • 在线旅游网站建设前的调研高端网站建设公司排行
  • 做网站怎么在图片里面插字北海seo快速排名
  • 安徽省建设造价管理协会网站脑白金网络营销
  • 代做网站作业直通车官网