当前位置: 首页 > news >正文

官方网站开发哪家便宜百度收录链接提交入口

官方网站开发哪家便宜,百度收录链接提交入口,如何给网站死链接做404,推荐网站建设推广Flask框架小程序后端分离开发学习笔记《4》向服务器端发送模拟请求-爬虫 Flask是使用python的后端,由于小程序需要后端开发,遂学习一下后端开发。 下面代码,是一个比较老的版本了,可以借鉴一下。 import socket import ssldef p…

Flask框架小程序后端分离开发学习笔记《4》向服务器端发送模拟请求-爬虫

Flask是使用python的后端,由于小程序需要后端开发,遂学习一下后端开发。
下面代码,是一个比较老的版本了,可以借鉴一下。

import socket
import ssldef parsed_url(url):#检查协议protocol = 'http'if url[:7] == 'http://':u = url.split('://')[1]elif url[:8] == 'https://':protocol = 'https'u = url.split('://')[1]else:#':/l '定位然后取第一个/的位置来切片u = url# 经过这样,url中的协议被切掉了,注意切片后数组下标由0开始# 例如 https://www.baidu.com:2024/apple# 切除后 www.baidu.com:2024/apple# 检查默认pathi = u.find('/')if i == -1:host = upath ='/'else:host = u[:i]path = u[i:]# 这一步处理过后# host = www.baidu.com:2024# path = apple# 检查端口# 默认端口port_dict = {'http': 80,'https': 443,}# 非默认端口port = port_dict[protocol]if ':' in host:h = host.split(':')# print(h)  测试用,当控制台说哪有问题,阔以尝试使用打印大法,看看是啥问题host = h[0]port = int(h[1])return protocol, host, port, path#以下test开头的函数是单元测试
def test_parsed_url():#parsed_url函数很容易出错,所以我们写测试函数来运行看检测是否正确运mhttp = 'http'https = 'https'host = 'g.cn'path = '/'test_items = [('http://g.cn', (http,host,80,path)),('http://g.cn/', (http,host,80,path)),('http://g.cn:90',(http, host,90,path)),('http://g.cn:90/', (http,host, 90,path)),# 这里面的都是典型测试用例即可('https://g.cn', (https,host,443,path)),('https://g.cn:233/',(https,host,233,path)),]for t in test_items:url, expected = tu = parsed_url(url)# assert是一个语句,名字叫断言# 如果断言成功,条件成立,则通过测试,否则为测试失败,中断程序报错e = "parsed_url ERROR,{}{}{}".format(url,u,expected)assert u == expected, e    # 如果u == expected为true,就没问题,继续;否则就会中断,然后打印e# print("test_parsed_url测试通过!")def socket_by_protocol(protocol,host):# 根据协议返回一个socket实例s = socket.socket()if protocol == 'https':# 创建一个默认的SSL上下文环境context = ssl.create_default_context()# 使用SSL上下文环境来包装socket对象s = context.wrap_socket(s, server_hostname=host)return sdef response_by_socket(s):# 持续接收响应,返回响应的byte型# 参数是一个socket实例# 返回这个socket读取的所有数据response = b''buffer_size = 1024while True:r = s.recv(buffer_size)if len(r) == 0:breakresponse += rreturn responsedef parsed_response(r):# 把response解析出状态码headers body返回# 状态码是int# headers 是dict# body是strheader, body = r.split('\r\n\r\n',1)     # \r\n\r\n是其分界线h = header.split('\r\n')   # 就会切分很多行  例如:HTTP/1.1 301 Moved Permanentlystatus_code = h[0].split()[1]   # h[0]就是响应行 status_code=301  按照空格切分status_code = int(status_code)headers = {}for line in h[1:]:   # 把响应Header部分每一行都存成字典k, v = line.split(': ')headers[k] = vreturn status_code, headers, bodydef get(url):# 用GET请求url并返回响应protocol,host,port,path= parsed_url(url)# 因为协议不一样,socket实例构建方式不同s = socket_by_protocol(protocol,host)s.connect((host,port))request = 'GET HTTP/1.1\r\nhost: {}\r\nconnectibn: close\r\n\r\n'.format(path,host)encoding = 'utf-8's.send(request.encode(encoding))response = response_by_socket(s)r = response.decode(encoding)# 利用parsed_response处理接收到的响应,分别得到想要的东西status_code, headers, body = parsed_response(r)if status_code in [301, 302]:     # 301、302说明是需要重定向url = headers['Location']return get(url)return status_code, headers, bodydef test_get():# 测试是否能正确处理HTTP和HTTPSurls = ['http://movie.douban.com/top250','https://movie.douban.com/top250',]# 这里就直接调用了get如果出错就会挂,测试得比较简单for u in urls:status_code, headers, body = get(u)print(status_code,headers,body)def test():# 用于测试的主函数test_parsed_url()test_get()# test_parsed_response()if __name__ == '__main__':test()# main()# 代码注意模块化,写what不写how,不写具体怎么实现,具体怎么实现就封装起来

最后尝试请求豆瓣的网页,并未得到,我怀疑是有反爬手段,我们的请求数据还有很多东西没加进去,所以看起来不像是浏览器发送的请求,后续会继续学习,解决这个问题。

http://www.yidumall.com/news/94224.html

相关文章:

  • 哈尔滨做网站的公司培训网站源码
  • 平台网站开发风险如何做一个自己的网页
  • 云服务器里面做网站播放器网络营销比较好的企业
  • 个人做的网站百度搜索不到网站备案
  • 找人做网站被骗了属于诈骗吗营销型网站
  • wordpress最热门免费主题快速优化seo
  • 个人房产网签查询系统手机优化什么意思
  • 可以做外链视频的网站湖南靠谱关键词优化
  • 如何做好网站关键词布局杭州优化外包
  • 深圳住房和建设局网站预约放号百度注册入口
  • 网站到期域名怎么解决办法怎么自己做一个网站
  • 南阳网站建站公司百度统计怎么使用
  • 萝岗网站建设优化百度关键词优化公司哪家好
  • 视频涉台互联网网站怎么做如何在百度发布信息推广
  • 网站注销怎么做消注册公司网站
  • 杭州市钱江新城投资集团有限公司征集网站建设合作单位的公告怎么查搜索关键词排名
  • 上海闵行区网站制作公司推广平台有哪些?
  • 怎样学好动漫制作专业长沙seo优化
  • 中国建设承包商网站正规百度推广
  • 做网站信科网站建设海南seo快速排名优化多少钱
  • 食品网站建设策划方案seo页面优化公司
  • 建立自己的网站需要服务器吗杭州seo公司服务
  • 基于安卓系统的app开发百度seo招聘
  • aspx网站架设搜索引擎优化是什么意思啊
  • 网页制作指南手机优化软件哪个好用
  • 影响网站pr的主要因素有哪些百度关键词查询工具免费
  • 头像代做网站成功营销案例100例
  • 网站上传系统中国最新疫情最新消息
  • 湖南做网站公司有哪些百度软件
  • 电商型企业网站建设黄山搜索引擎优化