发表3308篇论文是一种怎样的体验?并非搬运自知乎

    在百度学术的学者主页上发现了一些有趣的东西,左下方有一个影响力排行榜,于是我按文章数降序排了一下,top 1发表了3308篇文章。假如20岁开始发文章,一直科研不缀发到60岁,在这480个月中,月均发表论文3308/480=6.9篇,每4天就有一篇。借用标题党的惯用手法:深度震惊!这要是让方舟子看见了那还得了,方舟子出征,寸草都不生。


    再具体看一看这10位顶尖的科技工作者的研究领域:


    top 9全是医学类!有3个是肿瘤学!

    这10个人里面有3个人姓王,10个人的名字全是2个字,而且完全没有生僻字。因此,同名的人必然非常多。试着在百度学术上搜索“张强”,共有106个页面,每页6个人,最后一页只有1个人,共631个张强。第一页的张强的论文普遍很多,越往后面论文数越少,到第102页时,基本只有1篇了。


    按照百度的描述:自动聚合学术成果。百度学术会根据全网文章数据,自动帮学者聚合学术成果,生成自己的学者主页,学者只需要认证自己的主页即可以使用相关功能。我严重怀疑这个“聚合”有问题,把一个人的成果算在了另一个人身上,而且不是随机地弄错,它的聚类算法似乎有一种让多者更多、少者更少的两极分化趋势。同时,张强与章蔷的拼音相同,我甚至怀疑百度的算法会把章蔷的英文论文也算在张强身上。而且,那个排行榜上的文章数字变化十分剧烈,有的人的文章一夜之间就增加或减少几百篇。

    在中国人民解放军第306医院的官网上,我却并没有找到专家张强。官网没有搜索功能,我就用Chrome的Web Scraper插件,把专家姓名全部采集了,没有张强。


    在中国人民解放军总医院官网上也没有搜到专家王敏,只搜到眼科护士长王敏。


    这就有点奇怪了。
    百度学术上,湖北医药学院附属人民医院的李芳以2817篇论文和著作位列季军,但在百度医学上同一个人的论文数量又变成919了。这是在向国产大飞机致敬吗?


    再看看北大的高文院士的百度学术主页,


    专著有246本,God!唐七公子这样的抄袭界的大佬一辈子恐怕也抄不出这么多著作。理论上讲,如果一个人的著作超过10本,特别是科学与技术领域的,就应该人工复核一下,看有没有弄错。百度现在整出一个写了246本书的“神”,著作等身(形容著述极多,叠起来能跟作者的身高相等)这词已经不够用了,即使一本书一厘米厚,也比姚明要高了。

高文院士自己编排的主页是这样的:

    5本著作,这才是正常数字。


    论文553篇,也不是2371×47.5%=1127篇。
    百度的数据出了这么大的偏差,该不该负一点责任呢?整天吹嘘大数据,却连个简单的论文数都搞不对,真是讽刺……

    但是,但是,2017-12-01我又去看了一下那个变幻莫测的排行榜,发现第10位由高文变成了王娟,而王娟是河北省人民医院的肿瘤学专家。


    现在,top 10全是医学类,有4个专家姓王,有4个研究肿瘤学,不得不让我联想到今年上半年的撤稿事件。
    4月20日,世界最大学术出版机构之一的施普林格(Springer)出版社发表撤稿声明,旗下期刊《肿瘤生物学(Tumor Biology)》宣布撤回107篇发表于2012年至2016年的论文,原因是同行评议造假。而这107篇论文全部来自中国。
    论文提交的评审人建议中,使用了评审人的真实姓名,但假冒了其电子邮件地址,这让编辑以为文章发送给了真正的评审人。在我们与真正的评审人进行调查和沟通之后,他们确认并没有对论文做过评审。

    这种巧合实在是让人容易往坏处想……参考百度的这个排行榜(风向标),我们是不是可以预测下一次大规模撤稿是什么领域的?(大数据的一个重要应用不就是预测吗?)同行评议造假很多是第三方论文代发机构搞出来的。(当然,也有作者自己搞出来的。)


    中国科协、教育部、科技部、卫生计生委、中科院、工程院、自然科学基金会共同研究制定了《发表学术论文“五不准”》

    所以啊,马云巴巴的达摩院的人工智能技术到底能不能把淘宝上的这些论文代发机构识别出来并清理掉大部分?一宝不扫,何以扫天下?
    曾有学者提议,限制每个人每年能署名的论文的数量,比如一个自然年内最多在10篇文章上署名,不论是第几作者,英文期刊和中文期刊一起统计。(或者,在评审时,候选人只能从每一年中选出10篇文章参加评审,比如3年内发了50篇论文,但评教授时只能从中选出30篇。)因为,现在的评审制度是同时比数量和质量,但是,提高数量比提高质量要容易得多,于是大家的论文数量都很疯狂。如果在数量上进行限制,可以大大减少论文挂名的现象。既然署名数量有限,那么署名的机会将会尽量留给能当一作的论文用。当大家论文数量基本都一样了,就得把精力花在提高质量上了,剽窃、造假的垃圾论文也会大大减少,也给真正潜心学术的人减少他人不正当竞争造成的压力,促进社会公平和科研的健康发展。
发布了45 篇原创文章 · 获赞 98 · 访问量 35万+

猜你喜欢

转载自blog.csdn.net/pijianzhirui/article/details/78729108