当前位置: 首页 > news >正文

企业建设网站的重要性企业建站

企业建设网站的重要性,企业建站,芜湖炎黄做的网站,武汉市人民政府网官网Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架。 安装scrapy pip install scrapy2.5.0 1.新建 Scrapy项目 scrapy startproject mySpider # 项目名为mySpider 2.进入到spiders目录 cd mySpider/mySpider/spiders 3.创建爬虫 scrapy gensp…

Scrapy 是用 Python 实现的一个为了爬取网站数据、提取结构性数据而编写的应用框架。

安装scrapy

pip install scrapy==2.5.0

1.新建 Scrapy项目

scrapy startproject mySpider   # 项目名为mySpider

2.进入到spiders目录

 cd mySpider/mySpider/spiders

3.创建爬虫

 scrapy genspider dgcuAI  ai.dgcu.edu.cn      # 爬虫名为dgcuAI,爬取域为ai.dgcu.edu.cn

 4.制作爬虫

创建爬虫之后,打开dgcuAI.py文件。

引入Selector

from scrapy.selector import Selector

修改start_urls:

start_urls = ['http://ai.dgcu.edu.cn/front/category/2.html']

 修改parse函数:

    def parse(self, response):

        print(response.url)

        selector = Selector(response)

        # # 使用XPath表达式提取信息:

        # 标题: //div[@class="pageList"]/ul/li/a/div[@class="major-content1"]/text()

        # 链接: //div[@class="pageList"]/ul/li/a/@href

        # 日期: //div[@class="pageList"]/ul/li/a/div[@class="major-content2"]/text()

        node_list = selector.xpath("//div[@class='pageList']/ul/li")

        for node in node_list:

            # 文章标题

            title = node.xpath('./a[1]/div[@class="major-content1"]/text()').extract_first()

            # 文章链接

            url = node.xpath('./a[1]/@href').extract_first()

            # 日期

            date = node.xpath('./a[1]/div[@class="major-content2"]/text()').extract_first()

            print("文章标题:", title)

            print("文章链接:",url)

            print("日期:",date)

 5.运行爬虫

 在mySpider/mySpider/文件夹下创建run.py文件,并运行:

from scrapy import cmdline

cmdline.execute("scrapy crawl dgcuAI -s LOG_ENABLED=False".split())

其中“-s LOG_ENABLED=False ”表示不打印日志信息,若代码运行有错误则需要“-s LOG_ENABLED=True ”,这样就能在控制台看到错误信息。

运行结果:

http://www.yidumall.com/news/31513.html

相关文章:

  • 公司备案网站负责人是谁google搜索网址
  • 毛网商城宁波seo推广外包公司
  • 想制作自己的网站在线培训系统平台
  • 自己怎么做云购网站吗北京网站优化方法
  • 拍卖行 网站建设seo推广岗位职责
  • 惠州网站建设 鑫经典软文案例分析
  • 诚信通网站怎么做外链什么是seo搜索引擎优化
  • 同仁微网站建设工作室百度人工智能开放平台
  • 网站手机端跳转页面模板微信营销系统
  • 垃圾ip段做网站百度推广登陆入口官网
  • 如何做自己微网站国际新闻最新消息美国
  • 个人做旅游网站营销模式有几种
  • 湛江北京网站建设保定seo推广外包
  • 有做销售产品的网站免费的关键词挖掘工具
  • 晋城网站制作公司怎么选seo优化外链平台
  • 做一家算命的网站信息流广告案例
  • 云南网站优化360优化大师最新版下载
  • 网站域名解析后多久能生效推广引流方法与渠道
  • 网站建设优点seo搜索引擎优化公司
  • 创意广告宣传片制作seo谷歌外贸推广
  • 做天猫转让网站seo点击软件哪个好用
  • 运动网站开发的需求分析软文广告经典案例200字
  • 网上商店怎么开网站seo推广
  • 制作表情包外贸谷歌优化
  • 建设充值网站多钱seo优化就业前景
  • 邢台网站建设服务周到谷歌广告投放
  • 做网站的软件dw精准营销的成功案例
  • 做装饬在哪家网站挂深圳货拉拉
  • 做网站 花园路国贸网络营销首先要
  • 手机网站横幅制作模板中国企业500强