<?php
// 简单的PHP爬虫示例代码,使用Goutte库
// 需要先安装Goutte库:composer require fabpot/goutte
require 'vendor/autoload.php';
use Goutte\Client;
// 创建一个新的客户端实例
$client = new Client();
// 定义要抓取的URL
$url = 'https://example.com';
// 发送GET请求并获取响应
$crawler = $client->request('GET', $url);
// 提取页面中的标题
$title = $crawler->filter('title')->text();
echo "网页标题: " . $title . "\n";
// 提取页面中的所有链接
$links = $crawler->filter('a')->each(function ($node) {
return $node->attr('href');
});
echo "网页中的链接:\n";
foreach ($links as $link) {
echo $link . "\n";
}
?>
Client
类用于发起HTTP请求。$client->request()
方法向目标URL发送GET请求,并获取响应内容。$crawler->filter('title')->text()
提取网页的标题。$crawler->filter('a')->each()
遍历所有的<a>
标签,并提取其中的href
属性值。如果你不需要爬虫框架的具体实现,或者上述代码不符合你的需求,请告知具体要求。
上一篇:php读取csv文件
下一篇:php后端
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站