当前位置: 首页 > news >正文

网站建设模式有哪些内容宁波seo优化排名

网站建设模式有哪些内容,宁波seo优化排名,wordpress做静态网页,怎么建立博客网站Python爬取网页信息 需求: 持续爬取某嵌入式设备配置网页上的状态信息 shell脚本 简单快速, 不用装插件只能爬取静态内容 用curl命令返回整个网页的内容用grep命令抓取其中某些字段结合正则表达式可多样查找但对于动态内容, 比如对某嵌入式设备配置网页上的一条不断更新的信…

Python爬取网页信息

  • 需求: 持续爬取某嵌入式设备配置网页上的状态信息

shell脚本

  • 简单快速, 不用装插件
  • 只能爬取静态内容
  1. curl命令返回整个网页的内容
  2. grep命令抓取其中某些字段
  3. 结合正则表达式可多样查找
  4. 但对于动态内容, 比如对某嵌入式设备配置网页上的一条不断更新的信息, 可能只能爬出来占位符XXXX, 不满足我的需要
#!/bin/bash
while true
do# 获取时间戳timestamp=$(date +"%Y-%m-%d %T")# 先获取网页内容, 再获取内容中带Temperature的一行temperature_line=$(curl -s "http://lidar-internal-config.com" | grep "Temperature")# 打印出来echo "$timestamp $temperature_line" >> log.txt  sleep 1
done
# wget和curl差不多效果
# wget -q -O - 192.168.4.5 | grep -o "gps lock\|gps unlock" | awk '{print strftime("%Y-%m-%d %H:%M:%S"), $0}'

python脚本

  • 要安装一些东西, 有点麻烦

  • 可以爬取动态内容, 模仿网页

  • Ubuntu安装selenium

    • pip安装的可能是py2环境下的, 这时要用pip3安装
  • 再安上边链接的步骤安装geckodriver

    • Ubuntu自带火狐, 所以用geckodriver, 会先打开一个网页, 然后在这个网页上刷新.
    • 如果用get打开网页就读取内容, 可能动态内容还没刷出来, 有时还会抓到占位符, 加个延时就行
    • phantomjs不会打开网页, 但对于变化内容还是只能爬出占位符XXXX, 官方好像也放弃这库, 推荐用firefox或chrome
from selenium import webdriver
from selenium.webdriver.common.by import By
import time
import datetime
browser = webdriver.Firefox()
# browser = webdriver.PhantomJS() # 不好用
# 传入地址, 返回要抓取的内容
def Get_Status(address):browser.get(address)time.sleep(0.2) # 延时等待正常刷新# 定位到带GNSS静态字符的位置, 方便抓旁边的动态字符elements = browser.find_elements_by_xpath("//*[text()='GNSS']")sibling_element = elements[0].find_element_by_xpath(".").# 抓取动态内容find_element_by_xpath("./following-sibling::*").text# print(sibling_element)return sibling_elementcurrent_time = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
file_name = "./log/gps_monitor"+current_time+".txt" # 先定好文件名while True:current_time = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S") # 每条记录打上时间戳Status = Get_Status("你要访问的ip地址")# 写入log文件内with open(file_name,'a') as f:f.write("{}: GGG: {} \n".format(current_time, Status))time.sleep(10)
browser.close()
http://www.yidumall.com/news/100958.html

相关文章:

  • 小网站asp好还是php好百度秒收录软件工具
  • 佛山选择免费网站优化免费seo网站推荐一下
  • 手机棋牌网站大全店铺运营方案策划
  • 网站建设学习泉州百度seo公司
  • 网站开发合同免费模板排名seo公司
  • 做网站开发欧美seo查询
  • 地方门户网站建设方案百度应用app
  • 兰州做网站咨询兰州做网站公司合肥网络推广服务
  • 给老外做代购网站免费二级域名建站
  • 上海网站建设雍熙世界最新新闻
  • 武汉网站公司多少钱如何进行网站的推广
  • 广州建设网站的公司免费的网站软件
  • 网易做的什么网站线上渠道推广怎么做
  • 湖南长沙旅游攻略windows10优化大师
  • 对用户1万的网站做性能测试搜索关键词的方法
  • 网站转化肇庆百度快速排名
  • 电商线上推广渠道佛山网站优化
  • 申请域名建立网站宁波网站优化公司哪家好
  • 怎么做物流网站代理电脑培训学校能学什么
  • 呼市网站建设网站关键词排名优化软件
  • 网站制作是那个西安seo网络优化公司
  • 开发网站的过程广告联盟怎么做
  • 网站内容页301如何做百度如何做推广
  • 深圳定制展会时间表厦门谷歌seo公司有哪些
  • 网站上传好了如何做定向网络宣传渠道有哪些
  • 平原县网站seo优化排名seo网站关键词优化价格
  • 做网站建设销售热狗网站排名优化外包
  • 企业网站建设论文网络推广运营优化
  • 深圳政府在线官网seo建站工具
  • 厦门集美区网站建设热门网站