案例来源:@量子位 @CoupMF @新智元
案例地址:https://mp.weixin.qq.com/s/fOOXBImDHEeweYTcMZ1cBg;https://cloud.tencent.com/developer/news/260987;https://xueqiu.com/3426965578/109607389
1. 目标:让模型学习现有的分子结构式,将同类型的原子归类,复现元素周期表
2. 过程
1)参考word2vec,利用分子式作为文本,原子用上下文原子进行表示,如Bi2Se3中,2个Bi周围有3个Se,则Bi表示为(Bi,2Se3);3个Se周围有2个Bi,则Se表示为(Se,3Bi2)
2)构造了 原子-上下文 的稀疏矩阵,用SVD进行降维
3)对降维后的矩阵进行层次聚类,距离采用余弦距离,进行聚类
4)发现主族元素能聚类在一起,过渡金属效果较差。基本复现了元素周期表主要的部分
3. 延伸
1)目前仅是基础研究,未来的研究中希望能帮助发现新的分子材料
2)将算法抑制到分子生物学领域,设计出可以攻击正确抗原的抗体
3)作为一种判断计算机智能的方法:图灵测试受限于人的判断能力,而如果模型能够重复人类已经完成的一些伟大发现(如元素周期表),那么说明模型有一定的智能