描述 | XPath | CSS selector |
---|---|---|
父元素 | //div/. | 无 |
使用ID定位 | //div[@id=‘id_value’] | div#id_value |
使用class定位 | //div[@class=‘class_value’] | div.class_value |
使用name定位 | //div[@name=‘name_value’] | div[name=‘name_value’] |
多属性定位 | //div[@name=‘name_value’ and class=‘class_value’] | div[@name=‘name_value’] [class=‘class_value’] |
第N个子元素 | //ul[@id=‘id_value’]/li[4] | u#id_val li:nth-child(4) |
最后一个元素 | //ul[@id=‘id_value’]/li[last()] | u#id_val li:last-child |
属性包含某字段 | //div[contains(@title, “text”)] | div[title*=“text”] |
属性以xxx开头 | //div[starts-with(@title, “text”)] | div[title^=“text”] |
属性以xxx结尾 | //div[ends-with(@title, “text”)] | div[title$=“text”] |
text中包含某字段 | //div[contains(text(), “text”)] 。 凡是用text()的地方均可以直接用.来进行表示。 例如a[text()=’SELENIUM’] 和 a[.=’SELENIUM’]是等价的。 | 无 |
同级弟弟元素 | //div[@id=‘D’]/following-sibling::div[1] | 无 |
同级哥哥元素 | //li/preceding-sibling::div[1] | 无 |
XPath运算符 | 说明 |
---|---|
/ | 此路径运算符出现在模式开头时,表示应从根节点选择。 |
// | 是指从全文上下文中搜索//后面的节点 |
.// | 从当前节点开始递归下降。此路径运算符出现在模式开头时,表示应从根节点递归下降。 |
. | 当前上下文。 |
… | 当前上下文节点父级。 |
* | 通配符;选择所有元素节点与元素名无关。(不包括文本,注释,指令等节点,如果也要包含这些节点请用node()函数) |
@ | 属性名的前缀。 |
@* | 选择所有属性,与名称无关。 |
: | 命名空间分隔符;将命名空间前缀与元素名或属性名分隔。 |
( ) | 括号运算符(优先级最高),强制运算优先级。 |
[ ] | 应用筛选模式(即谓词,包括"过滤表达式"和"轴(向前/向后)")。 |
[ ] | 下标运算符;用于在集合中编制索引。 |
- | 减法。 |
div | 浮点除法。 |
and, or | 逻辑运算。 |
mod | 求余。 |
not() | 逻辑非 |
= | 等于 |
!= | 不等于 |
特殊比较运算符 | <或者 <&#61; 或者 > 或者 >&#61; |
normalize-space | 去掉文字前后的空格、回车&#xff0c;.//a[normalize-space(text())&#61;‘XXXXX’] |
XPath轴名称 | 说明 |
---|---|
ancestor | 选取当前节点的所有先辈&#xff08;父、祖父等&#xff09; |
ancestor-or-self | 选取当前节点的所有先辈&#xff08;父、祖父等&#xff09;以及当前节点本身 |
attribute | 选取当前节点的所有属性 |
child | 选取当前节点的所有子元素。 |
descendant | 选取当前节点的所有后代元素&#xff08;子、孙等&#xff09;。 |
descendant-or-self | 选取当前节点的所有后代元素&#xff08;子、孙等&#xff09;以及当前节点本身。 |
following | 选取文档中当前节点的结束标签之后的所有节点。 |
namespace | 选取当前节点的所有命名空间节点 |
parent | 选取当前节点的父节点。 |
preceding | 直到所有这个节点的父辈节点&#xff0c;顺序选择每个父辈节点前的所有同级节点 |
preceding-sibling | 选取当前节点之前的所有同级节点。 |
self | 选取当前节点。 |
常用表达式举例 | 说明 |
---|---|
/ | Document Root文档根. |
/* | 选择文档根下面的所有元素节点&#xff0c;即根节点&#xff08;XML文档只有一个根节点&#xff09; |
/node() | 根元素下所有的节点&#xff08;包括文本节点&#xff0c;注释节点等&#xff09; |
/text() | 查找文档根节点下的所有文本节点 |
/messages/message | messages节点下的所有message节点 |
/messages/message[1] | messages节点下的第一个message节点 |
/messages/message[1]/self::node() | 第一个message节点&#xff08;self轴表示自身&#xff0c;node()表示选择所有节点&#xff09; |
/messages/message[1]/node() | 第一个message节点下的所有子节点 |
/messages/message[1]/*[last()] | 第一个message节点的最后一个子节点 |
/messages/message[1]/[last()] | Error&#xff0c;谓词前必须是节点或节点集 |
/messages/message[1]/node()[last()] | 第一个message节点的最后一个子节点 |
/messages/message[1]/text() | 第一个message节点的所有子节点 |
/messages/message[1]//text() | 第一个message节点下递归下降查找所有的文本节点&#xff08;无限深度&#xff09; |
/messages/message[1] /child::node() | 第一个message节点下的所有子节点 |
/messages/message[1] /node() | 第一个message节点下的所有子节点 |
/messages/message[position()&#61;1]/node() | 第一个message节点下的所有子节点 |
//message[&#64;id&#61;1] /node() | 第一个message节点下的所有子节点 |
//message[&#64;id&#61;1] //child::node() | 递归所有子节点&#xff08;无限深度&#xff09; |
//message[position()&#61;1]/node() | 选择id&#61;1的message节点以及id&#61;0的message节点 |
/messages/message[1] /parent:: * | Messages节点 |
/messages/message[1]/body/attachments/parent::node() | attachments节点的父节点。父节点只有一个&#xff0c;所以node()和* 返回结果一样。 |
/messages/message[1]/body/attachments/parent:: * | attachments节点的父节点。父节点只有一个&#xff0c;所以node()和* 返回结果一样。 |
/messages/message[1]/body/attachments/. . | attachments节点的父节点。 |
//message[&#64;id&#61;0]/ancestor:: * | Ancestor轴表示所有的祖辈&#xff0c;父&#xff0c;祖父等。 向上递归 |
//message[&#64;id&#61;0]/ancestor-or-self:: * | 向上递归,包含自身 |
//message[&#64;id&#61;0]/ancestor::node() | 对比使用*,多一个文档根元素(Document root) |
/messages/message[1]/descendant::node() | 递归下降查找message节点的所有节点 |
//messages/message[1]//node() | 递归下降查找message节点的所有节点 |
/messages/message[1]/sender/following:: * | 查找第一个message节点的sender节点后的所有同级节点&#xff0c;并对每一个同级节点递归向下查找。 |
//message[&#64;id&#61;1]/sender/following-sibling:: * | 查找id&#61;1的message节点的sender节点的所有后续的同级节点。 |
//message[&#64;id&#61;1]/datetime/&#64;date | 查找id&#61;1的message节点的datetime节点的date属性 |
//message[&#64;id&#61;1]/datetime[&#64;date] | 查找id&#61;1的message节点的所有含有date属性的datetime节点 |
//message/datetime[attribute::date] | 查找message节点的所有含有date属性的datetime节点 |
//message[datetime] | 查找所有含有datetime节点的message节点 |
//message/datetime/attribute:: * | 返回message节点下datetime节点的所有属性节点 |
//message/datetime/attribute::node() | 返回message节点下datetime节点的所有属性节点 |
//message/datetime/&#64;* | 返回message节点下datetime节点的所有属性节点 |
//message/datetime[attribute:: *] | 选择所有含有属性的datetime节点 |
//message/datetime[attribute::node()] | 选择所有含有属性的datetime节点 |
//message/datetime[&#64;*] | 选择所有含有属性的datetime节点 |
//message/datetime[&#64;node()] | 选择所有含有属性的datetime节点 |
//attribute:: * | 选择根节点下的所有属性节点 |
//message[&#64;id&#61;0]/body/preceding::node() | 顺序选择body节点所在节点前的所有同级节点。&#xff08;查找顺序为&#xff1a;先找到body节点的顶级节点&#xff08;根节点&#xff09;,得到根节点标签前的所有同级节点&#xff0c;执行完成后继续向下一级&#xff0c;顺序得到该节点标签前的所有同级节点&#xff0c;依次类推。&#xff09; 注意&#xff1a;查找同级节点是顺序查找&#xff0c;而不是递归查找。 |
//message[&#64;id&#61;0]/body/preceding-sibling::node() | 顺序查找body标签前的所有同级节点。&#xff08;和上例一个最大的区别是&#xff1a;不从最顶层开始到body节点逐层查找。我们可以理解成少了一个循环&#xff0c;而只查找当前节点前的同级节点&#xff09; |
//message[&#64;id&#61;1]//*[namespace::amazon] | 查找id&#61;1的所有message节点下的所有命名空间为amazon的节点。 |
//namespace:: * | 文档中的所有的命名空间节点。&#xff08;包括默认命名空间xmlns:xml&#xff09; |
//message[&#64;id&#61;0]//books/*[local-name()&#61;‘book’] | 选择books下的所有的book节点&#xff0c; 注意&#xff1a;由于book节点定义了命名空间amazone:book.若写成//message[&#64;id&#61;0]//books/book则查找不出任何节点。 |
//message[&#64;id&#61;0]//books/*[local-name()&#61;‘book’ and namespace-uri()&#61;‘http://www.amazon.com/books/schema’] | 选择books下的所有的book节点&#xff0c;(节点名和命名空间都匹配) |
//message[&#64;id&#61;0]//books/*[local-name()&#61;‘book’][year>2006] | 选择year节点值>2006的book节点 |
//message[&#64;id&#61;0]//books/*[local-name()&#61;‘book’][1]/year>2006 | 指示第一个book节点的year节点值是否大于2006. 返回xs:boolean: true |
CSS选择器 | 示例 | 说明 | CSS |
---|---|---|---|
.class | .intro | 选择 class&#61;“intro” 的所有元素。 | 1 |
#id | #firstname | 选择 id&#61;“firstname” 的所有元素。 | 1 |
* | * | 选择所有元素。 | 2 |
element | p | 选择所有 元素。 | 1 |
element,element | div,p | 选择所有 元素和所有 元素。 | 1 |
element element | div p | 选择 元素内部的所有 元素。 | 1 |
element>element | div>p | 选择父元素为 元素的所有 元素。 | 2 |
element&#43;element | div&#43;p | 选择紧接在 元素之后的所有 元素。 | 2 |
[attribute] | [target] | 选择带有 target 属性所有元素。 | 2 |
[attribute&#61;value] | [target&#61;_blank] | 选择 target&#61;“_blank” 的所有元素。 | 2 |
[attribute~&#61;value] | [title~&#61;flower] | 选择 title 属性包含单词 “flower” 的所有元素。 | 2 |
[attribute | &#61;value] | [lang | &#61;en] |
:link | a:link | 选择所有未被访问的链接。 | 1 |
:visited | a:visited | 选择所有已被访问的链接。 | 1 |
:active | a:active | 选择活动链接。 | 1 |
:hover | a:hover | 选择鼠标指针位于其上的链接。 | 1 |
:focus | input:focus | 选择获得焦点的 input 元素。 | 2 |
:first-letter | p:first-letter | 选择每个 元素的首字母。 | 1 |
:first-line | p:first-line | 选择每个 元素的首行。 | 1 |
:first-child | p:first-child | 选择属于父元素的第一个子元素的每个 元素。 | 2 |
:before | p:before | 在每个 元素的内容之前插入内容。 | 2 |
:after | p:after | 在每个 元素的内容之后插入内容。 | 2 |
:lang(language) | p:lang(it) | 选择带有以 “it” 开头的 lang 属性值的每个 元素。 | 2 |
element1~element2 | p~ul | 选择前面有 元素的每个
| 3 |
[attribute^&#61;value] | a[src^&#61;“https”] | 选择其 src 属性值以 “https” 开头的每个 元素。 | 3 |
[attribute$&#61;value] | a[src$&#61;“.pdf”] | 选择其 src 属性以 “.pdf” 结尾的所有 元素。 | 3 |
[attribute*&#61;value] | a[src*&#61;“abc”] | 选择其 src 属性中包含 “abc” 子串的每个 元素。 | 3 |
:first-of-type | p:first-of-type | 选择属于其父元素的首个 元素的每个 元素。 | 3 |
:last-of-type | p:last-of-type | 选择属于其父元素的最后 元素的每个 元素。 | 3 |
:only-of-type | p:only-of-type | 选择属于其父元素唯一的 元素的每个 元素。 | 3 |
:only-child | p:only-child | 选择属于其父元素的唯一子元素的每个 元素。 | 3 |
:nth-child(n) | p:nth-child(2) | 选择属于其父元素的第二个子元素的每个 元素。 | 3 |
:nth-last-child(n) | p:nth-last-child(2) | 同上&#xff0c;从最后一个子元素开始计数。 | 3 |
:nth-of-type(n) | p:nth-of-type(2) | 选择属于其父元素第二个 元素的每个 元素。 | 3 |
:nth-last-of-type(n) | p:nth-last-of-type(2) | 同上&#xff0c;但是从最后一个子元素开始计数。 | 3 |
:last-child | p:last-child | 选择属于其父元素最后一个子元素每个 元素。 | 3 |
:root | :root | 选择文档的根元素。 | 3 |
:empty | p:empty | 选择没有子元素的每个 元素&#xff08;包括文本节点&#xff09;。 | 3 |
:target | #news:target | 选择当前活动的 #news 元素。 | 3 |
:enabled | input:enabled | 选择每个启用的 元素。 | 3 |
:disabled | input:disabled | 选择每个禁用的 元素。 | 3 |
:checked | input:checked | 选择每个被选中的 元素。 | 3 |
:not(selector) | :not§ | 选择非 元素的每个元素。 | 3 |
::selection | ::selection | 选择被用户选取的元素部分。 | 3 |
部分内容来源&#xff1a;
1.https://blog.csdn.net/weixin_40326608/article/details/101202935