Jsoup课程:

postagent操作数url地址限制1.简介

Jsoup是一个HTML分析器,可以直接分析URL地址? html文本内容。还可以使用DQ,CSS和类似jQuery的方法获取和处理数据。其主要功能。

1.从网址,字符串或文本中清除HTML

2.查找和检索数据

3.处理html元素,属性:文本。

Jsoup直接继承Object类声明的公共对象Jsoupextends

这是使用Jsoup库进行公共访问的基础。

二,方法的细节

1.公共静态Documentparse(字符串html,字符串baseUri)最小化文档中的html,在这里您可以为任何HTML创建任何文档树。

其中,html的baseUri和url通常以相对道路强度的形式表示。 BaseUri用于调整其根路径的强度。当分析html中的url(从相对流量到绝对流量)时,这一点尤其重要。

2.公共静态Documentparse(字符串html,字符串baseUri,解析器解析器)使用指定的解析器分析html行。

3.分析文档中社交静态文档分析(字符串html)html的静态行。这里未列出BaseUri,它取决于html \\ lt;。基本href \\ ugt26标签:

4.公共静态Connectionconnect(字符串url)创建具有指定url的联系人对象,该对象通常用于检索或分析html页面。

例如,文档doc = Jsoup.connect(“ http://example.com”).userAgent(“ Mozilla”).data(“ name”,“ jsoup”)Get()

文件doc = Jsoup.connect(“ http://example.com”).cookie(“ auth”,“ token”)。发布();

5.公共静态Documentparse(文件输入,字符串charsetName,字符串baseUri)抛出IOException分析HTML文件

charsetName是指加密,通常使用UTF-8更安全。当找不到文件或文件不可读或加密无效时,它将运行,但IO除外

互联网价格图片大全

6.公共静态Documentparse(文件输入,字符串charsetName)抛出IOException周期HTML文件,该文件的位置通常用作baseUri。其余与上述5相同。

7.公共静态Documentparse(InputStream输入,String charsetName,String baseUri)抛出IOException,读取输入流,然后在Document对象中对其进行分析。

8.公共静态Documentparse(InputStream输入,String charsetName,String baseUri,Parser解析器)抛出IOException读取输入流using使用指定的分析器对其进行分析。

9.公共静态DocumentparseBodyFragment(字符串bodyHtml,字符串baseUri)分析html部分,该部分仅包含正文的一部分。列出了BaseUri

10.公共静态DocumentparseBodyFragment(字符串bodyHtml)分析html部分,该部分仅包含主体的一部分。未指定BaseUri

11.公共静态Documentparse(URL url,int timeoutMillis)丢弃文档中IOException的url中指定的html标记。而是将这些视为您必须定期执行的操作。

如果返回码不是200,或者错误读取错误将导致IO异常。

12.公共静态Stringclean(字符串bodyHtml,字符串baseUri,白色指针白色指针)使用白名单标签?属性过滤入站html以安全地访问html。列出了BaseUri

13.公共静态Stringclean(字符串bodyHtml,白色指示符白色指示符)使用白色指示符和属性过滤不允许的html过滤器以获取安全的html。未指定BaseUri

14.公共静态booleanisValid(字符串bodyHtml,白名单白名单)检查输入的html是否仅包含允许的标签:属性。 Jsoup类Postagent歌剧URL地址cepfragment。JS

猜你喜欢

转载自www.cnblogs.com/blogst/p/12671120.html
今日推荐