【数据应用案例】atom2vec,通过无监督学习的方式复现元素周期表

案例来源:@量子位 @CoupMF @新智元

案例地址:https://mp.weixin.qq.com/s/fOOXBImDHEeweYTcMZ1cBghttps://cloud.tencent.com/developer/news/260987https://xueqiu.com/3426965578/109607389

1. 目标:让模型学习现有的分子结构式,将同类型的原子归类,复现元素周期表

2. 过程

    1)参考word2vec,利用分子式作为文本,原子用上下文原子进行表示,如Bi2Se3中,2个Bi周围有3个Se,则Bi表示为(Bi,2Se3);3个Se周围有2个Bi,则Se表示为(Se,3Bi2)

    2)构造了 原子-上下文 的稀疏矩阵,用SVD进行降维

    3)对降维后的矩阵进行层次聚类,距离采用余弦距离,进行聚类

    4)发现主族元素能聚类在一起,过渡金属效果较差。基本复现了元素周期表主要的部分

3. 延伸

    1)目前仅是基础研究,未来的研究中希望能帮助发现新的分子材料

    2)将算法抑制到分子生物学领域,设计出可以攻击正确抗原的抗体

    3)作为一种判断计算机智能的方法:图灵测试受限于人的判断能力,而如果模型能够重复人类已经完成的一些伟大发现(如元素周期表),那么说明模型有一定的智能

猜你喜欢

转载自blog.csdn.net/u013382288/article/details/81337353
今日推荐