htmlparser抽取表格

原创文章:转载请注明出处
try {
			Parser parser=new Parser("http://detail.zol.com.cn/260/259165/param.shtml");
//			NodeFilter nodeFilter=new HasAttributeFilter("","");
			HtmlPage htmlPage=new HtmlPage(parser);
			parser.visitAllNodesWith(htmlPage);
			TableTag tableTags[] =htmlPage.getTables();
			for(TableTag tableTag:tableTags){
				TableRow tableRows[]=tableTag.getRows();
				for(int i=0;i<tableRows.length;i++){
					System.out.println("----------------------");
					TableColumn tableColumns[]=tableRows[i].getColumns();
					for(int j=0;j<tableColumns.length;j++){
						System.out.println(tableColumns[j].toPlainTextString());
					}
				}
			}
		} catch (ParserException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}


这是提取表格内容的一个小例子。不用解释了,能看懂的。呵呵

猜你喜欢

转载自wangwei3.iteye.com/blog/896158
今日推荐