from lxml import etree
# 示例HTML内容
html_content = """
<div>
<ul>
<li class="item-0">first item</li>
<li class="item-1">second item</li>
<li class="item-2">third item</li>
</ul>
</div>
"""
# 将字符串解析为HTML
html = etree.HTML(html_content)
# 使用XPath选择所有class包含'item'的<li>元素
result = html.xpath("//li[contains(@class, 'item')]/text()")
# 输出结果
print(result)
lxml库中的etree模块来解析和处理HTML内容。<ul>列表,里面有三个<li>元素,每个元素都有不同的class属性。etree.HTML()函数将字符串解析为HTML对象。//li[contains(@class, 'item')]/text()用于选择所有class属性中包含item的<li>元素,并提取其文本内容。<li>元素的文本内容。如果你需要更复杂的XPath用法或有其他问题,请随时告诉我!
下一篇:python dict get
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站