Javaの学習とアプリケーション(4.3.1) - XMLと分析

XML

ワールド・ワイド・ウェブ・コンソーシアム(W3C)、HTMLに、基本的な言語と後で保存されたデータ(コンフィギュレーションファイル、ネットワークファイル転送)を交換することにより、提案したXML(拡張マークアップ言語拡張マークアップ言語)、
文書の最初の行は:? <XMLバージョン=「1.0を宣言しました?「>、<?xmlの-スタイルシート(例えばバージョンなどの属性のリスト[必須]、エンコードする[デフォルトのISO-8859-1]、スタンドアロンの[ファイルかどうかとは無関係には、有効期限が切れている]) tpye = "テキスト/ cssの"のhref =「XXXを.css「?>早起きと制御表示ページとCSSスタイルに。
その後、カスタムドキュメントラベル、タグ、属性値を持つ引用符で一つだけは、ラベルが適切に閉じなければならない(または自己閉鎖し、ペアリング)、および大文字と小文字が区別されます。それが実証されるようにのみ必要なIDタグ、CDATAコンテンツ領域(特殊文字)(<[]に示されるように、データDATA []!>)
制約:ドキュメント書き込みルールは、XMLで、フレームのユーザとして、XML文書を指定しました制約ドキュメント(DTD、スキーマ)の導入。
DTD:<!ELEMENT>タグは、タグは括弧の中に何回も発生する可能性がありますように*許可子として追加、定義され、+ 1以上、#のPCDATA文字列です。<!ATTLIST>タグは(現れなければならないと#REQUIRED)されているタグ、属性、属性タイプのために順次定義された属性ました。
DTDの外部DTD、サブローカル(<!DOCTYPEルートタグ名SYSTEM "DTD位置">)とネットワーク(<!DOCTYPEルートタグ名PUBLIC "DTDファイル名"、 "場所のURL">)。また、内部DTD、XML内(<!DOCTYPEルートタグ名[DTDコンテンツ]> )。
Schemla制約:文字列の内容は、制約、XSD拡張を定義することができます。メソッドの追加:属性のxsiプレフィックスルートタグを導入することは、XSD名前空間、GAPデフォルトのヌルプレフィックスののxmlnsを簡素化するために、各制約のXSD名前空間ファイルを指定A接頭辞を導入しました。

<xmlのバージョン= "1.0"エンコード= "UTF-8"?> 
<! - 
	1.塗りつぶしたXML文書のルート要素
	2.はじめにxsiプレフィックスのxmlns:。XSI =「http://www.w3.org/ 2001 / XMLスキーマ・インスタンス「
	3.株式会社XSD名前空間ファイルXSI :.のschemaLocation =」http://www.itcast.cn/xml student.xsd「
	4. XSD各制約を指定Aプレフィックス、識別のxmlnsなど=」 http://www.itcast.cn/xml " 
	
	
 - > 
<学生のxmlns:XSI =" http://www.w3.org/2001/XMLSchema-instance " 
			のxmlns =" http://www.itcast.cn / XML " 
			のxsi:schemaLocationの=" http://www.itcast.cn/xml student.xsd " 
> 
	<学籍番号=" heima_0001「> 
		<名前>トム</名前> 
		<年齢> 18である</年齢> 
		<セックス>男性</セックス> 
	</学生> 

</学生>

 

XML解析

XML構文解析:DOM解析(サーバー)、合わせのCRUD操作でDOMツリー、操作しやすいが、総メモリ。SAXパース(携帯端末)、イベント駆動型に基づいていないメモリのうち、行ずつ読み取り、のみ読み取ることができます。
パーサ:太陽のDOMとSAX、DOM4J比較的良好なパーサによって提供さJAXPをサポート。HTMLの構文解析Jsoupなど[例]、PULLパーサは、Androidが構築されています。データを取得ジャーパッケージのインポート、取得Documentオブジェクト、Elementオブジェクト、。
JsoupはDEMO1を参照して、コードを使用します。
Jsoupツールは、解析されたHTML(解析着信ファイルと符号化データ列またはURLまたはネットワークリソースオブジェクトを、タイムアウトDOMをロードする)オブジェクト、
文書オブジェクトは、に基づいてオブジェクトを取得するために集合の要素他の要素を取得(タグID属性【のArrayList] DOMツリーを表します。 )、要素オブジェクトセットの代表的な要素
のプロパティ値属性名に従って、テキスト取得したテキスト、HTMLを取得するコンテンツタグ本体)、ノードノードオブジェクト(親文書と要素を取得ATTRよう求めるサブラベルgetElementを含む素子要素オブジェクト(、クラスオブジェクト)。
迅速かつ簡単な方法:セレクタセレクタ、参照を選択クラスのメソッド定義されました。括弧内に引用符のエスケープを追加し、属性値整合素子と、選択した属性のデータを取得するためのdocument.select方法、>その子タグ。
XPathの:インポートのjarパッケージ、Documentオブジェクトを取得するには、JXDocumentオブジェクトを作成し、使用することは、(マニュアル参照)SELNメソッド書き込みパス式として、queryメソッドをクエリの構文をJXDocument。

 

おすすめ

転載: www.cnblogs.com/bai2018/p/12306934.html