火车采集器的使用技巧(自用笔记)

1.网址探测器,网址采集测试,右键可以导出同级节点网址

 

2.标签 内容 可以从网址中截取  

3.便签内容在某一页中出现循环,记得点 上图的 循环匹配

4.标签内容可以前后截取后,再次进行截取,替换,html标签过滤,字符编码转换(高级功能)

5.标签 循环设置 默认### 一般改为 添加为新记录

 

6.反爬措施较严格的网站,最好修改间隔时间,默认间隔100毫秒(0.1秒)

7. 数据默认存储为sqlite类型的数据库

猜你喜欢

转载自blog.csdn.net/qq_912917507/article/details/85336752