当前位置: 首页 > news >正文

网站建设 培训网站排名搜索

网站建设 培训,网站排名搜索,网站怎么做接口,python 网站开发 prf安装scrapy pip install scrapy创建scrapy项目,需要在终端里创建 注意:项目的名字开头不能是数字,也不能包含中文 scrapy startproject 项目名称 示例: scrapy startproject scra_baidu_36创建好后的文件 3. 创建爬虫文件&…
  1. 安装scrapy
pip install scrapy
  1. 创建scrapy项目,需要在终端里创建
    注意:项目的名字开头不能是数字,也不能包含中文
scrapy startproject 项目名称
示例:
scrapy startproject scra_baidu_36

创建好后的文件
在这里插入图片描述
3. 创建爬虫文件:
要在spider文件里面创建爬虫文件
先在终端中cd到spider文件里
创建爬虫文件

scrapy genspider 爬虫文件名 要爬取的网页
示例:
scrapy genspider baidu http://www.baiud.com

创建的爬虫文件内容:
在这里插入图片描述
name 爬虫的名字,用于运行爬虫的时候使用的值
allowed_domains 允许访问的域名
start_urls 起始url地址,指的是第一次要访问的域名
parse 是执行了start_urls之后执行的方法,方法中的response就是返回的那个对象

  1. 运行爬虫文件
    写一个print()
    在这里插入图片描述

在终端输入

scrapy crawl 爬虫的名字
示例:
scrapy crawl baidu

但是运行完并没有给我们返回任何数据
在这里插入图片描述
这是因为有robots协议
解决办法:只需要在settings.py文件里把 ROBOTSTXT_OBEY = True 给注释掉就可以了(或者把True改成False也可以)
在这里插入图片描述
然后再重新运行一遍就可以获取到数据了
在这里插入图片描述

http://www.yidumall.com/news/73391.html

相关文章:

  • 网站建设多久可以建成汕头seo外包机构
  • 免费零食网站模板东莞网站制作公司
  • 西宁做网站的网络公司2345导航网址
  • 广州十二区分布图seo智能优化软件
  • 表情包做旧网站爱网站查询挖掘工具
  • 织梦dede网站后台被挂黑链怎么办注册百度账号免费
  • 网站建设代码题东莞网站建设最牛
  • ml域名免费注册山东公司网站推广优化
  • web前端工程师证书考取seo是什么意思 职业
  • 无锡网站建设企业整合营销传播成功案例
  • 佛山专业网站建设报价注册安全工程师
  • wordpress模版推荐东莞网站优化
  • 做兼职看什么网站好济南疫情最新情况
  • 椒江网站建设578做网站深圳网络营销全网推广
  • 北京市城乡建设委员会官方网站seo网站优化策划书
  • 网站建设的相关资料重庆最新数据消息
  • 宠物店做网站的论文seo案例分析
  • 中国设计网字体杭州seo外包
  • 网站开发系统计划书网络推广销售是做什么的
  • 网站建设软件开发工作室整站模板国际热点事件
  • 做境外网站网页广告怎么做
  • 新加坡二手手机网站大全360收录提交
  • 怎么样用ps做网站品牌营销策略分析
  • 公司两个网站可以做友情链接吗抖音关键词推广
  • 装潢网站模板网站推广怎样做
  • 北京公司地址seo推广培训课程
  • 优良的定制网站建设提供商网上做广告宣传
  • 网站实名认证功能怎么做自助建站
  • 做网站自己装服务器百度网页pc版登录
  • 电商网站怎么做seo优化seo设置