Laravel  
laravel
文档
数据库
架构
入门
php技术
    
Laravelphp
laravel / php / java / vue / mysql / linux / python / javascript / html / css / c++ / c#

java jsoup

作者:终生卟离   发布日期:2025-07-04   浏览:21

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;

public class JsoupExample {
    public static void main(String[] args) {
        // 定义要抓取的URL
        String url = "https://example.com";

        try {
            // 使用Jsoup连接到URL并获取HTML文档
            Document document = Jsoup.connect(url).get();

            // 打印页面标题
            String title = document.title();
            System.out.println("页面标题: " + title);

            // 选择所有带有特定类名的元素
            Elements elementsWithClass = document.getElementsByClass("example-class");
            for (Element element : elementsWithClass) {
                System.out.println("元素内容: " + element.text());
            }

            // 选择所有<a>标签并打印链接
            Elements links = document.select("a[href]");
            for (Element link : links) {
                System.out.println("链接: " + link.attr("href"));
                System.out.println("链接文本: " + link.text());
            }

        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

解释说明:

  1. 导入库:首先导入了Jsoup库中的相关类,包括DocumentElementElements
  2. 定义URL:定义了一个字符串变量url,表示要抓取的网页地址。
  3. 连接并获取HTML文档:使用Jsoup.connect(url).get()方法连接到指定的URL,并获取其HTML文档内容。
  4. 获取页面标题:通过document.title()方法获取并打印页面的标题。
  5. 选择特定类名的元素:使用document.getElementsByClass("example-class")选择所有带有特定类名的元素,并遍历这些元素打印它们的内容。
  6. 选择所有标签:使用document.select("a[href]")选择所有带有href属性的<a>标签,并遍历这些标签打印链接及其文本内容。
  7. 异常处理:使用try-catch块捕获可能发生的IOException异常。

上一篇:java map根据key排序

下一篇:java void

大家都在看

java连接数据库的代码

ubuntu 卸载java

java sort用法

java collections.sort

java file类的方法

java 判断

java时间数据类型

java 时间加一天

java demo

java 截取

Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3

Laravel 中文站