Laravel  
laravel
文档
数据库
架构
入门
php技术
    
Laravelphp
laravel / php / java / vue / mysql / linux / python / javascript / html / css / c++ / c#

python bs4

作者:菠蘿。d海   发布日期:2025-03-03   浏览:130

from bs4 import BeautifulSoup

# 示例HTML内容
html_doc = """
<html>
<head>
    <title>示例网页</title>
</head>
<body>
    <p class="title">这是一个段落。</p>
    <a href="http://example.com" id="link">链接文本</a>
    <div id="content">
        <p>更多内容在这里。</p>
    </div>
</body>
</html>
"""

# 创建BeautifulSoup对象,解析HTML
soup = BeautifulSoup(html_doc, 'html.parser')

# 查找并打印标题
title = soup.title.string
print(f"网页标题是: {title}")

# 查找并打印所有<p>标签的内容
paragraphs = soup.find_all('p')
for p in paragraphs:
    print(f"段落内容: {p.get_text()}")

# 查找并打印特定类的<p>标签的内容
specific_paragraph = soup.find('p', class_='title')
print(f"特定类的段落内容: {specific_paragraph.get_text()}")

# 查找并打印带有id为'link'的<a>标签的href属性
link = soup.find('a', id='link')['href']
print(f"链接地址: {link}")

解释说明:

  1. 导入库:首先导入 BeautifulSoup 类。
  2. HTML内容:定义一个字符串变量 html_doc,其中包含要解析的HTML内容。
  3. 创建BeautifulSoup对象:使用 BeautifulSoup 解析HTML内容,并指定解析器为 html.parser
  4. 查找标题:通过 soup.title.string 获取并打印网页的标题。
  5. 查找所有段落:使用 soup.find_all('p') 查找所有 <p> 标签,并打印它们的内容。
  6. 查找特定类的段落:使用 soup.find('p', class_='title') 查找具有特定类的 <p> 标签,并打印其内容。
  7. 查找链接:使用 soup.find('a', id='link')['href'] 查找具有特定ID的 <a> 标签,并获取其 href 属性值。

上一篇:zip在python中的含义

下一篇:python keyerror

大家都在看

python时间格式

python ord和chr

python中的yield

python自定义异常

python list.pop

python的for i in range

npm config set python

python代码简单

python读取文件夹

python中turtle

Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3

Laravel 中文站