from bs4 import BeautifulSoup
import requests
# 获取网页内容
url = 'https://example.com'
response = requests.get(url)
html_content = response.text
# 解析HTML内容
soup = BeautifulSoup(html_content, 'html.parser')
# 查找所有的标题标签<h1>
titles = soup.find_all('h1')
# 打印所有标题文本
for title in titles:
print(title.get_text())
BeautifulSoup 和 requests 库。BeautifulSoup 用于解析 HTML,而 requests 用于发送 HTTP 请求获取网页内容。requests.get() 方法获取指定 URL 的网页内容,并将其存储在 html_content 变量中。BeautifulSoup 解析获取到的 HTML 内容,并指定解析器为 html.parser。soup.find_all('h1') 查找所有的 <h1> 标签,并将结果存储在 titles 列表中。titles 列表,使用 get_text() 方法提取并打印每个标题的文本内容。如果你需要更多功能或有其他问题,请告诉我!
下一篇:python集合的基本操作
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站