バイト []バイト= Files.readAllBytes(Paths.get( "E:\\ PDF \\ AAA \\ HTML \\ TEXT.TXT" ).normalize())。 ストリング・テキスト = IOUtils.toString(バイト)。 文字列XML = text.substring(text.indexOf( "<TBODY>" )); InputSourceのinputXML = 新しい InputSourceの(新しいにStringReader(XML)); XPathたxPath = XPathFactory.newInstance()newXPath()。 NodeListノード =(のNodeList)xPath.evaluate( "/ TBODY / TR" 、inputXML、XPathConstants.NODESET)。 int型の長さ= nodes.getLength()。 パスファイル= Paths.get( "E:\\ PDF \\ AAA \\ HTML \\ out.txtを" )。 試みる(BufferedWriterのライター= Files.newBufferedWriter(ファイルいるCharset.defaultCharset()、StandardOpenOption.CREATEは)){ ため(int型 i = 0; iは長さ<; iは++ ){ ノードノード = nodes.item(I)。 NodeListたchildList =(のNodeList)xPath.evaluate( "TD" 、ノード、XPathConstants.NODESET)。 用(INT J = 0; J <childList.getLength(); J ++ ){ ノードの子 = childList.item(J)。 文字列の内容 =child.getTextContent(); // System.out.print(コンテンツ); writer.write(コンテンツ)。 もし(J <childList.getLength() - 1 ){ writer.write( "\ tの" )。 } } writer.newLine()。 } }
TEXT.TXTコンテンツ
出力内容: