テキストやHTML要素の属性を抽出します

問題

オブジェクトのDocumentインスタンスを取得し解析した後、あなたはこれらの要素のデータを取得したい要素の一部を発見しました。

方法

  • プロパティの値を取得するには、使用することができますNode.attr(String key) 方法を
  • テキスト要素の場合は、それを使用することが可能であるElement.text()方法を
  • HTMLコンテンツ内の要素または属性を取得するには、使用することができますElement.html()、または  Node.outerHtml()方法

例:

HTML =文字列"<P> <a href='http://example.com/'>アン<B>例</ B> </a>のリンク</ P>" ; 
文書DOC = Jsoup.parse( HTML); // 解析HTML文字列が実装ドキュメントを返す 
)(第一)=( ""要素のリンクdoc.selectを;. // の最初の要素を見つける

文字列text = doc.body()テキストを(); // "アン例のリンク" // テキスト文字列を取得する 
文字列linkHref = link.attr( "HREFを"); // " http://example.com/ " // リンクアドレスを取得する 
文字列をlinkText = link.text (); // "例"」// テキストリンクアドレス取得

文字列linkOuterH = link.outerHtmlを(); 
     // "<A HREF ="http://example.com "> <B>例</ B> </a>の" 
文字列linkInnerH = link.html()。// "<B>例</ b>の" // 取得链接内的なHTML内容

説明

上記の方法は、データにアクセスする方法の中核要素です。また、他の方法を用いてもよいです。

これらのアクセサメソッドは、データを変更するには、対応するsetterメソッドを持っています。

おすすめ

転載: www.cnblogs.com/deityjian/p/12541625.html