python beautifulsoup

作者：戮尽逆者发布日期:2026-05-17 浏览:155

from bs4 import BeautifulSoup
import requests

# 获取网页内容
url = 'https://example.com'
response = requests.get(url)
html_content = response.text

# 解析HTML内容
soup = BeautifulSoup(html_content, 'html.parser')

# 查找所有的标题标签<h1>
titles = soup.find_all('h1')

# 打印所有标题文本
for title in titles:
    print(title.get_text())

解释说明：

导入库：首先导入 BeautifulSoup 和 requests 库。BeautifulSoup 用于解析 HTML，而 requests 用于发送 HTTP 请求获取网页内容。
获取网页内容：使用 requests.get() 方法获取指定 URL 的网页内容，并将其存储在 html_content 变量中。
解析HTML内容：使用 BeautifulSoup 解析获取到的 HTML 内容，并指定解析器为 html.parser。
查找标签：使用 soup.find_all('h1') 查找所有的 <h1> 标签，并将结果存储在 titles 列表中。
打印标题文本：遍历 titles 列表，使用 get_text() 方法提取并打印每个标题的文本内容。

如果你需要更多功能或有其他问题，请告诉我！

上一篇：python __init__.py

下一篇：python集合的基本操作