Laravel  
laravel
文档
数据库
架构
入门
php技术
    
Laravelphp
laravel / php / java / vue / mysql / linux / python / javascript / html / css / c++ / c#

python爬取网页数据

作者:/神經病/   发布日期:2026-05-20   浏览:55

import requests
from bs4 import BeautifulSoup

# 定义一个函数来爬取网页数据
def fetch_web_data(url):
    try:
        # 发送HTTP请求获取网页内容
        response = requests.get(url)
        # 检查请求是否成功
        if response.status_code == 200:
            # 使用BeautifulSoup解析网页内容
            soup = BeautifulSoup(response.text, 'html.parser')
            # 示例:提取所有标题标签<h1>的内容
            titles = soup.find_all('h1')
            # 打印所有标题
            for title in titles:
                print(title.get_text())
        else:
            print(f"请求失败,状态码: {response.status_code}")
    except Exception as e:
        print(f"发生错误: {e}")

# 示例URL
url = 'https://example.com'
fetch_web_data(url)

解释说明:

  1. 导入库

    • requests:用于发送HTTP请求并获取网页内容。
    • BeautifulSoup:用于解析HTML文档,方便提取所需的数据。
  2. 定义函数 fetch_web_data

    • 接受一个URL作为参数。
    • 使用requests.get()方法发送HTTP GET请求,获取网页内容。
    • 检查响应状态码是否为200(表示请求成功)。
    • 使用BeautifulSoup解析HTML文档,并提取所有<h1>标签的内容。
    • 打印提取到的标题内容。
  3. 异常处理

    • 如果请求失败或发生其他异常,会捕获并打印错误信息。
  4. 示例URL

    • 使用https://example.com作为示例URL,你可以替换为你想要爬取的实际网址。

上一篇:python jieba库

下一篇:pythonrange函数

大家都在看

python 二维码识别

python excel 库

python时间格式

pythoneval函数用法

列表切片操作python

python读取文件路径

staticmethod在python中有

python 保存json文件

python的assert基本用法

python开发windows应用程序

Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3

Laravel 中文站