try { Parser parser=new Parser("http://detail.zol.com.cn/260/259165/param.shtml"); // NodeFilter nodeFilter=new HasAttributeFilter("",""); HtmlPage htmlPage=new HtmlPage(parser); parser.visitAllNodesWith(htmlPage); TableTag tableTags[] =htmlPage.getTables(); for(TableTag tableTag:tableTags){ TableRow tableRows[]=tableTag.getRows(); for(int i=0;i<tableRows.length;i++){ System.out.println("----------------------"); TableColumn tableColumns[]=tableRows[i].getColumns(); for(int j=0;j<tableColumns.length;j++){ System.out.println(tableColumns[j].toPlainTextString()); } } } } catch (ParserException e) { // TODO Auto-generated catch block e.printStackTrace(); }
这是提取表格内容的一个小例子。不用解释了,能看懂的。呵呵