下面的示例将解析HTML为新的文档(Document),然后获取html body的Element对象。
Document document=Jsoup.parseBodyFragment(html); Element body=document.body();
parseBodyFragment(String html)方法将输入的HTML解析为新的文档,该文档对象可用于遍历并获取html正文片段的详细信息。
使用您选择的任何编辑器在C:/> jsoup中创建以下Java程序。
JsoupTester.java
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class JsoupTester { public static void main(String[] args) { String html = "<div><p>Sample Content</p>"; Document document = Jsoup.parseBodyFragment(html); Element body = document.body(); Elements paragraphs = body.getElementsByTag("p"); for (Element paragraph : paragraphs) { System.out.println(paragraph.text()); } } }
使用 javac 编译器编译类,如下所示:
C:\jsoup>javac JsoupTester.java
现在运行JsoupTester以查看输出。
C:\jsoup>java JsoupTester
查看输出。
Sample Content
祝学习愉快!(内容编辑有误?请选中要编辑内容 -> 右键 -> 修改 -> 提交!)