当前位置: 首页 > news >正文

海外推广助理济南优化网站的哪家好

海外推广助理,济南优化网站的哪家好,免费做视频的软件app,最好的javascript视频在使用爬虫获取维基百科数据时看到了一个很好的项目: 博客:https://blog.51cto.com/u_15919249/5962100 项目地址:https://github.com/wjn1996/scrapy_for_zh_wiki 但在使用过程中遇到若干问题,记录一下: The more_it…

在使用爬虫获取维基百科数据时看到了一个很好的项目:
博客:https://blog.51cto.com/u_15919249/5962100
项目地址:https://github.com/wjn1996/scrapy_for_zh_wiki

但在使用过程中遇到若干问题,记录一下:
The 'more_itertools' package is required; normally this is bundled with this package so if you get this warning, consult the packager of your distribution.:

1.解决方案:

或许并不是环境本身的问题。
1. pip show more_itertools没有则安装,有则下一步
2. 把queue.py 文件及该文件中的Queue类均重命名分别为myqueue.py 与 MyQueue。
3. 将重命名后的myqueue.py放到spiders文件夹下,
4. 将spider下单wiki.py 中的from queue import  Queue修改为from .myqueue import MyQueue
原因可能是Python中自带queue库,而博主这里是想调用自己的queue。

2.后面同样要把filter_words.py文件拿到spider下,并修改wiki中的from filter_words import filter_url 为from .filter_words import filter_url

3.在wiki.py繁简转换中加判断,避免输入为空

def Traditional2Simplified(sentence):'''将sentence中的繁体字转为简体字:param sentence: 待转换的句子:return: 将句子中繁体字转换为简体字之后的句子'''# sentence = Converter('zh-hans').convert(sentence)# return sentenceif sentence:sentence = Converter('zh-hans').convert(sentence)return sentenceelse:return sentence

4. 在wiki.py中修改

'''
content_entity = search.xpath("//h1[@id='firstHeading']/text()").extract_first()
为
content_entity = search.xpath("//h1[@id='firstHeading']/span/text()").extract_first()
'''



 

http://www.yidumall.com/news/106085.html

相关文章:

  • 阿里云服务器架设网站品牌推广的意义
  • 网站设计软件培训百度推广代运营公司
  • 韩国男女做游戏视频网站个人网站模板
  • 观澜做网站天津网站建设优化
  • 免费动漫网站seo外包公司有哪些
  • 做网站泰安seo初学教程
  • 手游源码交易平台青岛的seo服务公司
  • 看到一个电商网站帮做淘宝真正免费的网站建站平台
  • 抖音属于b2c还是c2cseo优化培训班
  • 洞头区网站建设收费目录搜索引擎有哪些
  • 重庆奉节网站建设百度app下载链接
  • 初中做网站软件宣传软文是什么
  • 做高仿鞋子在什么网站卖好百度seo推广首选帝搜软件
  • wordpress注入docker迅速上排名网站优化
  • wordpress 登录后才能查看seo优化网站的注意事项
  • 企业做网站收费seo外链论坛
  • 专业的佛山网站建设价格白云区新闻
  • wordpress聚合平台模板百度seo优化及推广
  • 个人做论坛网站优化营商环境心得体会个人
  • 石家庄网站建设推广电话购物网站哪个最好
  • 顺的网站建设咨询全网营销平台有哪些
  • 长沙哪里做网站好seo长尾关键词排名
  • 网站做不做账seo薪资seo
  • 临西做网站报价今日军事新闻最新消息
  • 百度站长验证网站失败网络营销是什么
  • 海淀网站建设公司排名西安百度公司
  • 网站管理系统模板2023年国家免费技能培训
  • 自动化产品的网站建设百度代发排名
  • 湖北响应式网站建设设计百度词条
  • 开源程序做网站任务百度快照网址