当前位置: 首页 > news >正文

网站的结构怎么做推广恶意点击软件怎样使用

网站的结构怎么做,推广恶意点击软件怎样使用,兰州做系统优化的公司,网站备案几天目录 一、安装XPath 二、XPath的基础语法 1.选取节点 三、使用XPath匹配数据 1.浏览器审查元素 2.具体实例 四、总结 一、安装XPath 控制台输入指令:pip install lxml 二、XPath的基础语法 XPath是一种在XML文档中查找信息的语言,可以使用它在HTM…

目录

一、安装XPath

二、XPath的基础语法 

 1.选取节点

三、使用XPath匹配数据

1.浏览器审查元素

2.具体实例

四、总结


一、安装XPath

控制台输入指令:pip install lxml

二、XPath的基础语法 

        XPath是一种在XML文档中查找信息的语言,可以使用它在HTML源代码文档中通过元素、属性等方式进行查找和提取数据。

 1.选取节点

表达式描述
nodename

选取此元素的所有子元素。

例:div选取div下所有子元素。

/

从根节点选取子节点。

例:/div选取根元素div

//从匹配选择的当前元素下选择文档中的元素,而不考虑它们在文档中的位置。
.选取当前元素。
..选取父元素。
@选取属性。

例:XPath的常用语法格式

ul//li              
#选取ul下所有li子元素,而不管它们在文档的位置。
//@class
# 选取所有具有class属性的元素
ul//li[1]
# 选取ul元素下第一个li子元素
//div[@id="t2"]
# 选取id属性为t2的所有div元素
//li[@class="it"]
#选取class属性为it的li子元素
/div/ul/li[@class="it"]
# 选取根元素div下ul元素下的class属性等于it的li子元素

三、使用XPath匹配数据

1.浏览器审查元素

        上文初步了解了XPath的语法,这里介绍一个技巧,无需我们自己写XPath,使用浏览器自带工具即可,自动生成XPath。

第一步:打开要爬取的网页( 以机场三字代码查询系统_机场代码 (6qt.net)为例)

 按下F12,显示以下界面。

第二步: 点击审查元素按钮

第三步:在左侧选取要爬取的内容

2.具体实例

实例一:根据class属性进行匹配

获取标签文本使用text() 。

from lxml import html
import requests
url="http://www.6qt.net"
res=requests.get(url)
res.encoding="gb2312"
data_html=html.fromstring(res.text)
# 将网络请求返回的文本res.text转换为一个HTML文档对象
name_list=data_html.xpath('//tr[@class="tdbg"]//td[1]/a/text()')
for x in name_list:print(x)

运行结果:

实例二:根据id属性进行匹配

获取标签属性值使用@属性名,以下案例获取了属性title值:@title 。

from lxml import html
import requests
url="http://www.6qt.net"
res=requests.get(url)
res.encoding="gb2312"
data_html=html.fromstring(res.text)
# 将网络请求返回的文本res.text转换为一个HTML文档对象
name_list=data_html.xpath('//div[@id="logo"]/a/@title')
for x in name_list:print(x)

运行结果:

实例三:根据name属性进行匹配

获取了meta标签的content属性

from lxml import html
import requests
url="http://www.6qt.net"
res=requests.get(url)
res.encoding="gb2312"
data_html=html.fromstring(res.text)
# 将网络请求返回的文本res.text转换为一个HTML文档对象
name_list=data_html.xpath('/html/head/meta[@name="Keywords"]/@content')
for x in name_list:print(x)

运行结果:

四、总结

        爬虫是一个自动化获取网页数据的工具,其使用关键在于会分析HTML文档结构,使用正确的Xpath匹配数据,才能获取到想要的内容,所见即所得。

http://www.yidumall.com/news/81018.html

相关文章:

  • 网站转让 备案广告优化师培训
  • 免费 企业 网站 metinfo 教程深圳网站优化公司哪家好
  • 丹徒网站建设平台太原百度快速排名提升
  • 网站建设不力 被问责百度关键词刷搜索量
  • 动态网站开发试题及答案seo排名怎么样
  • 海南省住房和城乡建设厅官网网站谷歌google浏览器官方下载
  • 政府网站建设典型经验材料新站seo快速排名 排名
  • 城口自助建站最近新闻头条最新消息
  • 私域流量代运营公司百度seo优化推广公司
  • 做门户网站的好处百度推广新手入门
  • 怎么查看网站的pv uv自助建站系统哪个好
  • 网站建设咨询公司推荐杭州排名优化软件
  • 三合一网站管理系统seo诊断工具网站
  • 个人备案的网站竞价排名做不了seo外包服务
  • 网站静态和动态区别长沙网站推广工具
  • 政府部门网站建设特点网站推广平台排行
  • 做网站的域名多少钱优化大师app下载安装
  • 网站推广工具推荐金蝶进销存免费版
  • 常州金坛网站建设合肥网络推广外包
  • 网站开发合作意向书seo自然排名优化
  • 请人做网站需要多少钱商丘网站优化公司
  • 做网站需要什么学历seo优化工具推荐
  • 宝安网站建设推广seo建站平台哪家好
  • 如何建设好英文网站关键词竞价广告
  • 外贸网站建设升上去网络推广有哪些
  • 怎么开发一个网站自己怎么做引流推广
  • access 做网站 出现问题优化设计方法
  • 北京好的网站制作整站优化多少钱
  • 购物商城网站建设方案青岛百度推广seo价格
  • 电商网站课程设计报告西安网站seo外包