# 导入所需的库
import requests
from bs4 import BeautifulSoup
# 定义一个简单的爬虫函数
def simple_spider(url):
# 发送HTTP请求获取网页内容
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 使用BeautifulSoup解析HTML内容
soup = BeautifulSoup(response.text, 'html.parser')
# 提取页面标题
title = soup.title.string
# 返回页面标题
return title
else:
return "请求失败"
# 示例URL
url = "https://www.example.com"
# 调用爬虫函数并打印结果
print(simple_spider(url))
requests
库来发送HTTP请求,以及BeautifulSoup
库来解析HTML内容。simple_spider
函数接受一个URL作为参数,并返回该页面的标题。requests.get(url)
发送GET请求,获取网页内容。response.status_code
是否为200来确认请求是否成功。BeautifulSoup
解析响应的HTML内容,并提取页面的标题。这个示例代码展示了如何使用Python编写一个简单的爬虫框架。
上一篇:python ping
下一篇:zip在python中的含义
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站