perl 模块学习：HTML::TableExtract （从 html 中提取出 table 里的内容） - 代码天地

perl 模块学习：HTML::TableExtract （从 html 中提取出 table 里的内容）

其他 2018-08-04 09:46:15 阅读次数: 0

#!/usr/bin/perl
use strict;
use warnings;
use HTML::TableExtract;
use Data::Dumper;


my $inputhtml = shift;
my $content=<<_CMD_
<table class="gy">
<tr><th>Sample</th><th>Library</th><th>Raw Reads</th><th>Clean Reads</th><th>Raw Base(G)</th><th>Clean Base(G)</th><th>Effective Rate(%)</th><th>Error Rate(%)</th><th>Q20(%)</th><th>Q30(%)</th><th>GC Content(%)</th></tr>
            <tr>
            <td>Sample1</td><td>TKD1805000</td><td>15,014,440</td><td>14,731,101</td><td>4.5</td><td>4.42</td><td rowspan=1>98.11</td><td rowspan=1>0.01</td><td>96.94</td><td>92.81</td><td>57.50</td>
            </tr>
            <tr>
            <td>Sample2</td><td>TKD1805000</td><td>7,494,788</td><td>7,424,284</td><td>2.25</td><td>2.23</td><td rowspan=1>99.06</td><td rowspan=1>0.03</td><td>92.60</td><td>84.22</td><td>55.30</td>
            </tr>
 </table>
_CMD_

my $te = new HTML::TableExtract();
$te->parse( $content );
for my $ts ($te -> table_states){
	for my $row ($ts->rows) { 
        print join("\t", @$row), "\n";       
    } 
}

输出列表：
Sample  Library Raw Reads       Clean Reads     Raw Base(G)     Clean Base(G)   Effective Rate(%)       Error Rate(%)   Q20(%)  Q30(%)  GC Content(%)
Sample1  TKD1805000    18,839,956      18,687,871      5.65    5.61    99.19   0.01    96.00   90.48   52.84

参考：https://blog.csdn.net/cnki_ok/article/details/6534346
https://metacpan.org/pod/HTML::TableExtract

猜你喜欢

转载自blog.csdn.net/rojyang/article/details/81216701

perl 模块学习：HTML::TableExtract （从 html 中提取出 table 里的内容）

HTML中提取文字内容，去掉标签样式等

从html中提取img标签

HTML table

table html

HTML - Table

html table内容不随标题滚动

html中表格table的内容居中显示

html中table中td内容换行

html table.html

从html富文本中提取纯文本

v-html里的内容添加样式

HTML table表格标签的学习

（HTML学习记录）：表格（table）

Perl包和模块(内容来自beginning perl)

HTML table的td内容过长时，自动隐藏效果

HTML通过使用JS动态显示table内容

html将table表中的内容导出为excel文件

Html table 内容超出显示省略号

Html中table居中和表格内容居中的问题

Element Plus table formatter函数返回html内容

html table 列求和

HTML 表格(form/table)

关于html table样式

html table 转json

html creates table with javascript

HTML Table的跨行标签

html基础-table标签

html table隐藏列

HTML5--Table

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)