python xpath用法

作者：你给的一半温柔发布日期:2025-11-17 浏览:244

from lxml import etree

# 示例HTML内容
html_content = """
<div>
    <ul>
        <li class="item-0">first item</li>
        <li class="item-1">second item</li>
        <li class="item-2">third item</li>
    </ul>
</div>
"""

# 将字符串解析为HTML
html = etree.HTML(html_content)

# 使用XPath选择所有class包含'item'的<li>元素
result = html.xpath("//li[contains(@class, 'item')]/text()")

# 输出结果
print(result)

解释说明：

导入库：我们使用lxml库中的etree模块来解析和处理HTML内容。
示例HTML内容：定义了一个简单的HTML字符串，包含一个<ul>列表，里面有三个<li>元素，每个元素都有不同的class属性。
解析HTML：使用etree.HTML()函数将字符串解析为HTML对象。
XPath表达式：//li[contains(@class, 'item')]/text()用于选择所有class属性中包含item的<li>元素，并提取其文本内容。
输出结果：最终打印出所有匹配的<li>元素的文本内容。

如果你需要更复杂的XPath用法或有其他问题，请随时告诉我！

上一篇：python re.findall

下一篇：python dict get