当前位置: 首页 > news >正文

介绍一个软件的步骤seo外包优化

介绍一个软件的步骤,seo外包优化,公司网站内容编辑,网站关键词不收录目录 HTTP请求HTTP响应获得页面响应伪装用户访问打包数据爬取豆瓣top250 HTTP请求 HTTP:HypertextTransferProtcol 超文本传输协议 1、请求行 POST/user/info?new_usertrue HTTP/1.1#资源了路径user/info 查询参数new_usertrue 协议版本HTTP/1.1 2、请求头 Ho…

目录

    • HTTP请求
    • HTTP响应
    • 获得页面响应
    • 伪装用户访问
    • 打包数据
    • 爬取豆瓣top250

HTTP请求

HTTP:HypertextTransferProtcol 超文本传输协议

1、请求行

POST/user/info?new_user=true HTTP/1.1

#资源了路径user/info 查询参数new_user=true 协议版本HTTP/1.1

2、请求头

Host:www.example.com
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; ×64)

#host指主机域名

User-Agent:curl/7.77.0

#告知服务器客户端的相关信息

Accept:*/*

#客户端想接受的响应数据是什么类型
3、请求体

{"username":"刘威","email":"liuwei@hotmail.com"}

HTTP响应

# 状态行
HTTP/1.1 200 OK
# 响应头
Date:Fri,27Jan 2023 02:10:50 GMT
Content-Type:text/html;charset=utf-8
# 响应体
<!DOCTYPE html><head><title>首页</title></head><body><h1>hello world!</h1></body>
</html>

在这里插入图片描述

获得页面响应

pip install requests

import requests
head = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; ×64)" }
response=requests.get("http://books.toscrape.com")
if response.ok:print(response.text)
else:print("error")

伪装用户访问

在这里插入图片描述

import requests
headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36 Core/1.94.184.400 QQBrowser/11.3.5190.400"
}
response=requests.get("https://movie.douban.com/top250",headers=headers)
print(response.text)

打包数据

pip install bs4

from bs4 import BeautifulSoup
import requestscontent=requests.get("https://movie.douban.com/top250").text
# 传入BeautifulSoup的构造函数里
# 解析器
soup=BeautifulSoup(content,"html.parser")
# 能根据标签、属性等找出所有符合要求的元素
all_prices=soup.findAll("span",attrs={"class","title"})
for price in all_prices:print(price.string) #会把标签包围的文字返回给我们

爬取豆瓣top250

from bs4 import BeautifulSoup
import requests
# 伪装用户访问
headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36 Core/1.94.184.400 QQBrowser/11.3.5190.400"
}
# 根据url格式进行自动翻页
for start_num in range(0,250,25):   response=requests.get(f"https://movie.douban.com/top250?start={start_num}",headers=headers) #我们就可以用f字符串去格式化html=response.text	#打包htmlsoup=BeautifulSoup(html,"html.parser")	#用html方式解析all_title=soup.findAll("span",attrs={"class":"title"})	#限制特定条件for title in all_title:	#遍历所需内容title_string=title.stringif "/" not in title_string:	#限制内容显示print(title_string)
http://www.yidumall.com/news/67844.html

相关文章:

  • 西安做网站的公司维护信息流优化师培训机构
  • 自己做的手工放在哪个网站卖百度咨询电话 人工客服
  • 做网站好赚钱产品推广软文300字
  • 论坛网站用的虚拟主机洛阳seo博客
  • 黄冈商城网站建设哪家好宁波seo教程推广平台
  • 关于蚌埠政府网站建设软文推广策划方案
  • 网站开发合同编号如何编写网站建设费用多少钱
  • 引流用的电影网站怎么做制作一个网站的流程有哪些
  • 怎么建设只要注册就赚钱的网站网站建设设计
  • b站入口2024永不关闭百度收录查询工具官网
  • 免备案建网站短视频推广引流
  • 做网站什么样的域名好如何做网站搜索引擎优化
  • 360建站abc淘宝如何提升关键词排名
  • 技术先进的网站建seo学徒是做什么
  • 商洛城乡建设局网站陕西seo推广
  • 什么网站可以做网站测速对比抖音推广运营
  • 怎么在网站上做反邪教知识今日最新闻
  • 酒店官方网站的功能建设曹操论坛seo
  • 酒泉网站建设与制作社群运营
  • 专业的大连网站建设郑州学校网站建设
  • 微信用大型网站站做跳板引流推广软件
  • 网络建设与网站建设全网关键词指数查询
  • 做网站用哪个服务器不用备案网站快速优化排名
  • 网站从制作到使用的全过程明星百度指数排行
  • 域名解析网站什么意思今日疫情最新消息
  • 河南百度建个网站东莞seo建站如何推广
  • 做网站的私活现在疫情怎么样了最新消息
  • 传统网站建设 成本企业官网seo
  • 网站背景图片怎么做信息流广告优化
  • 广西桂林疫情最新消息今天封城了湛江seo