当前位置: 首页 > news >正文

做酒的网站软件开发公司简介

做酒的网站,软件开发公司简介,2b网站推广怎么做,没有平台没有网站怎么做外贸情景:传统的爬虫只需要设置fetch_typejs即可,因为可以获取到整个页面。但是现在ajax应用越来越广泛,所以有的网页不能用此种爬虫类型来获取页面的数据,只能用slef.crawl()来发起http请求来抓取数据。 直接上例子: 可以…

情景:传统的爬虫只需要设置fetch_type=js即可,因为可以获取到整个页面。但是现在ajax应用越来越广泛,所以有的网页不能用此种爬虫类型来获取页面的数据,只能用slef.crawl()来发起http请求来抓取数据。

直接上例子:
可以看到,该网页的每一页的数据是通过ajax请求获取到的,方式为POST,所以不能用传统方法。
在这里插入图片描述

可以看到该请求的请求体,我们需要把请求体和请求方法写到crawl函数的参数里。
在这里插入图片描述

直接上代码:

# coding: utf-8
from pyspider.libs.base_handler import *class Handler(BaseHandler):@every(minutes=10)def on_start(self):data = {'channelid': 229105,'sortfield': '-docorderpri,-docreltime','classsql': 'chnlid=40078','classcol': 'publishyear','classnum': 100,'classsort': 0,'cache': 'true','page': 1,'prepage': 75,}save = {'req_body':data}# method指定POST,data指定请求体,save保存一些自定义字段。self.crawl('http://yjt.fujian.gov.cn/fjdzapp/search', callback=self.index_page, method="POST", data=data, save=save)# 抓取请求的响应数据后会调用此接口@config(age=10*60)def index_page(self, response):print(response.save['req_body']) # 查看请求体print(response.json) # 获取所抓到的数据return response.jsondef on_result(self, result):# 处理结果 ...

请求体和响应如下:
在这里插入图片描述

需要注意的地方

可以看到,字典的字段都是u'...',这表明是Unicode编码,所以想要获取字典中的字段,需要做下面的处理:

response字典中有个recordCount的key,我想获取他的值,需要将其先按照utf-8的编码方式解码为Unicode(python2默认Unicode编码,但是我们的脚本是utf-8的编码方式),这样就可以获取到字典的值啦

	recordCount = response.json.get('recordCount'.decode('utf-8'))
http://www.yidumall.com/news/34256.html

相关文章:

  • 旅游网站开发 结束语优化教程
  • 山东网站建设开发维护seo中文含义是什么
  • 如何做视频教程网站网站排名怎么优化
  • 网站上传虚拟主机怎么网站排名seo
  • 游戏网站怎么做推广首页关键词排名代发
  • 怎么建设微信网站地推平台
  • 成功营销的案例杭州seo论坛
  • 装修网站怎么做推广信息推广的方式有哪些
  • 管理咨询公司注册资本宁波seo免费优化软件
  • wordpress chmodseo霸屏软件
  • 优化型网站建设seo服务方案
  • 做地产网站哪家好个人网站制作软件
  • 企业网站建设 广州app运营方案
  • 广东官方移动网站建设哪家好cps广告联盟网站
  • 威海网站推广成都网络推广公司
  • wordpress 首页代码南昌seo管理
  • 东莞网站建设推广有哪些搜索引擎排名大全
  • 网站一次性链接怎么做的一级消防工程师考试
  • 乐清英文网站建设如何创建网页链接
  • 禹城网站设计宁波seo软件
  • 重庆奉节网站建设公司哪家好长沙疫情最新数据消息
  • 人力资源管理系统入口焦作整站优化
  • 做网站公商品促销活动策划方案
  • 居士做网站长沙seo优化首选
  • 做不锈钢管网站百度推广投诉电话客服24小时
  • 做医疗护具网站哈尔滨网络推广
  • wordpress微信网站模板宁波网站推广优化哪家正规
  • beyond歌迷做的网站seo快速排名是什么
  • 微信网站怎么做下载附件舆情分析报告案例
  • 云南网是什么网站seo优化有百度系和什么