知识图谱在应用过程中,主要面临哪些困难?

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/duozhishidai/article/details/88908891

知识图谱在工业界还没有形成大规模的应用,很多仍处于调研阶段,主要原因在于很多企业对知识图谱并不了解,或者理解不深。但从目前的趋势可以预测,知识图谱在未来几年内必将成为工业界的热门工具。当然,知识图谱在实际应用中仍然将面对很多的挑战。

1、数据的可访问性。数据处理的最大烦恼常常是无法得到数据。由于种种原因,数据往往无法得到充分的公开,被封闭在数据孤岛上;或者仅仅被用书面的方式保存,无法用电子形式读取处理,可访问性不好。提高可访问性的主要手段是把数据电子化和网络化,可以方便地通过网络链接和访问。其中涉及的技术有:网络爬虫、PDF格式转文本、图片中的字符识别和文本清理等。最后,使用大家广泛接受的传输协议,提供不同平台间的兼容。

2、数据的可发现性。原始数据中往往存在很多的噪声,例如,数据本身在收录时有错误,必须被纠正;再如,数据会有冗余,同一家公司的名称可能会有全名、缩写名等形式,处理时被当作不同的公司对待等。这些都会对后继的数据处理造成干扰,降低数据的可发现性。

3、数据的深层关系。因为海量的数据已经远远超出人类的处理能力,依靠人力无法发现在数据中隐藏的众多关系。人类也许能从数据中最多找出几百个维度,但是机器使用自然语言处理的技术可以识别成千上万个维度,特别是关系抽取。此外,各种推理的方法也非常重要,通过推理规则可以发现隐藏得很深的联系。

4、领域知识的集成。金融涉及多个行业,可以分为上百个领域,这些领域都多少需要集成领域的专业知识。不管是投资还是制造,其中的主要概念、产品分类、市场竞争情况等都需要通过行业专家收集整理,并反映到领域知识库中。其中需要的主要技术为:文档篇章分割、中文分词、实体提取及消歧、关系提取、规则库建设等。金融领域中的征信、融资、资管、二级市场交易等都有具体的业务场景,都需要业务逻辑,这些逻辑在数据之上表现为模型,需要在基础数据和领域知识的基础上实现。

5、策略的生成。现有阶段,机器在业务场景中还无法完全替代人类的作用,而是辅助人类作出价值判断、风险判断,通过过往的案例或者既定的逻辑,为人类推荐可行的策略。在此,涉及到人工智能的方方面面:对用户交互而言,有意图理解、语言生成、用户画像匹配等;在业务层面,有逻辑生成、投资模型、风险模型等;涉及的数据处理有规则提取、知识库建设,语义检索、逻辑推理等。

最后,我们必须看到,金融和所有其他领域一样,正在逐渐被人工智能渗透,人类将会越来越多地依靠机器的帮助,更加科学地决策。今天的金融辅助工具已经可以提供大量的帮助,让投资人更容易地获得数据和分析层面的支持,大大提高工作的效率。而在整个技术链中,知识图谱居于核心地位,这是自金融报表电子化以来又一次质的飞跃。知识图谱是金融数据分析从简单的量化模型走向更为复杂的价值判断和风险评估必经的一环,把经验逐步变成可重用、可演化、可验证、可传播的知识模型,从而实现数据到智能的升华。
人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
1.人工智能时代,AI人才都有哪些特征?
http://www.duozhishidai.com/article-1792-1.html
2.大数据携手人工智能,高校人才培养面临新挑战
http://www.duozhishidai.com/article-7555-1.html
3.人工智能,机器学习和深度学习之间,主要有什么差异
http://www.duozhishidai.com/article-15858-1.html


多智时代-人工智能大数据学习入门网站|人工智能、大数据、物联网云计算的学习交流网站

多智时代-人工智能大数据学习入门网站|人工智能、大数据、云计算、物联网的学习服务的好平台

猜你喜欢

转载自blog.csdn.net/duozhishidai/article/details/88908891