如何评测一个大模型?(微软亚洲研究院 )

NoSuchKey