import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class HtmlTagRemover {
public static String removeHtmlTags(String htmlContent) {
// 使用Jsoup库解析HTML内容并去除标签
return Jsoup.parse(htmlContent).text();
}
public static void main(String[] args) {
// 示例HTML内容
String htmlContent = "<html><head><title>测试页面</title></head><body><p>这是一个测试。</p><a href='https://example.com'>链接</a></body></html>";
// 调用方法去除HTML标签
String result = removeHtmlTags(htmlContent);
// 输出结果
System.out.println(result); // 输出: 测试页面 这是一个测试。 链接
}
}
Jsoup库来解析和处理HTML内容。Jsoup是一个非常强大的Java库,用于处理HTML文档。Jsoup.parse()方法将其解析为一个文档对象,然后通过调用.text()方法提取纯文本内容,去除所有HTML标签。main方法中,我们定义了一个示例HTML字符串,并调用removeHtmlTags方法去除其中的HTML标签,最后输出处理后的纯文本内容。为了运行这段代码,你需要确保项目中已经添加了Jsoup库的依赖。如果你使用的是Maven项目,可以在pom.xml中添加以下依赖:
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.14.3</version>
</dependency>
上一篇:java iterator迭代器
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站