最近在写/毕/业/论/文,想搜一篇致谢参考一下,我想复制一下,结果。。
百度文库的内容不可以批量复制,只能一点点复制,实在太麻烦了。
就试着Ctrl+Shift+i看下文字部分可不可以被选中,结果竟然可以。
这里头的文字部分是可以被选中的,可以看到class name 是 reader-word-layer,因此理论上是可以通过爬虫直接获取的,接下来就尝试使用class来获取,结果还不错,非常迅速的download下来了,省去了-下载券,效果如下:
代码非常简单,通过url访问后,获取class下的内容就行了,源码公众号回复【百度文库】就可以获取啦~so easy(切莫商用,请自娱自乐!)