当前位置: 首页 > news >正文

汕头网站建设技术托管苏州seo按天扣费

汕头网站建设技术托管,苏州seo按天扣费,网站后台如何修改参数,厦门网站建设方案策划1. 分析爬取地址 打开某乎首页,点击热榜 这个就是我们需要爬取的地址,取到地址某乎/api/v3/feed/topstory/hot-lists/total?limit50&desktoptrue 定义好请求头,从Accept往下的请求头全部复制,转换成json headers {Accep…

1. 分析爬取地址

打开某乎首页,点击热榜
在这里插入图片描述
这个就是我们需要爬取的地址,取到地址某乎/api/v3/feed/topstory/hot-lists/total?limit=50&desktop=true
定义好请求头,从Accept往下的请求头全部复制,转换成json在这里插入图片描述

headers = {'Accept': '*/*','Accept-Encoding': 'gzip, deflate','Accept-Language': 'zh-CN,zh;q=0.9','Cookie': '你的请求头中的cookie','Sec-Ch-Ua': 'Not/A)Brand\';v=\'99\', \'Google Chrome\';v=\'115\', \'Chromium\';v=\'115','Sec-Ch-Ua-Mobile': '?0','Sec-Ch-Ua-Platform': 'Windows','Sec-Fetch-Dest': 'empty','Sec-Fetch-Mode': 'cors','Sec-Fetch-Site': 'same-origin','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36','X-Ab-Param': '','X-Ab-Pb': 'CgInBxIBAA==','X-Api-Version': '3.0.76','X-Requested-With': 'fetch','X-Zse-93': '101_3_3.0','X-Zse-96': '2.0_6hUp=vt8=9zOcwtPHcLjutT0sL2PhwOPys0v=fvQr7yneBCmMO2zkvXcYfoc5esu'
}

2. 分析请求结果

通过请求可以看出,hot-lists/total?limit=50&desktop=true请求后的返回参数直接是json格式,则不需要单独处理在这里插入图片描述
定义好需要抓取的参数按元素获取即可

    order_list = []  # 热榜排名title_list = []  # 热榜标题desc_list = []  # 热榜描述url_list = []  # 热榜链接hot_value_list = []  # 热度值answer_count_list = []  # 回答数data_list = json_data['data']order = 1  # 热榜排名初始值

GET请求接口

    response = requests.get(url=url, headers=headers)json_data = response.json()

循环数组json并赋值

        order_list.append(order)# 热榜标题title = data['target']['title_area']['text']print(order, '热榜标题:', title)title_list.append(title)desc_list.append(data['target']['excerpt_area']['text'])url_list.append(data['target']['link']['url'])hot_value_list.append(data['target']['metrics_area']['text'])answer_count_list.append(data['feed_specific']['answer_count'])order += 1```
将结果导出到csv,注意定义一下编码集为utf_8_sig
df = pd.DataFrame({'热榜排名': order_list,'热榜标题': title_list,'热榜链接': url_list,'热度值': hot_value_list,'回答数': answer_count_list,'热榜描述': desc_list,}
)
# 保存结果到csv文件
df.to_csv('知乎热榜.csv', index=False, encoding='utf_8_sig')
### 3. 结果验证
![在这里插入图片描述](https://img-blog.csdnimg.cn/eb0b9fdced6241e9bd7d6e941826b389.png)
###  注意:如果请求返回的json格式乱码,调整请求头Accept-Encoding,去掉br后即可
http://www.yidumall.com/news/89051.html

相关文章:

  • 广州企业网站模板购买营业推广方式
  • 动易网站模板seo文章推广
  • 网站开发公司招聘技术人员杭州seo关键词优化公司
  • 聊天网站制作教程附近成人电脑培训班
  • wordpress客户表单数据排名优化哪家专业
  • 北京网站手机站建设公司吗500强企业seo服务商
  • 做物流网站的公司手机百度下载免费安装
  • 一家做公司评估的网站营销策略都有哪些方面
  • 课题组研究网站怎么做新手如何学seo
  • 电子商务网站的建设与运营西安seo霸屏
  • 教务系统网站怎么做热搜关键词查询
  • 做免费资料分享网站会不会涉及版权营销型网站策划书
  • 网站开发 商标注册站长之家域名解析
  • 怀柔网站建设推广优化seo设置
  • 做网站 需要 域名 空间西安百度提升优化
  • 巴彦淖尔市网站建设seo排名优化有哪些
  • wordpress 代购主题邵阳seo优化
  • 壹佰网站建设关键词优化是什么意思
  • 建设一个聊天类的网站站长工具天美传媒
  • 西安网站设计培训试听seo外链软件
  • 本地的上海网站建设上海站优云网络科技有限公司
  • 昆山苏州网站建设佛山做网站的公司哪家好
  • 网站服务器租赁你的知识宝库电商网站入口
  • 科技网站实例东莞seo优化团队
  • 校园网站怎么做HTML企业网站建设方案模板
  • 郑州网站托管公司哪家好网页怎么制作
  • 阳江 网站建设百度云群组
  • 国际军事新闻联播正规seo需要多少钱
  • 实惠网外贸论坛深圳seo网络推广
  • 合肥企业网站建设工作室安徽网络seo