反向智能问答学习第一天

反向智能回答:

一问一答的形式(机器去问,人来回答),去理解用户的回答,去分类与判断用户的回答程度与喜好,再继续生成问题,最后再逼近所要的结果,给出答案与分类。

机器所提出来的问题类型有两种:判断(此时判断回答的程度)与选择问题(此时判断选择的情况)

现在的难点是有两点:回答的理解与分类(自然语言理解问题)+自己对各种分类有的思考——设置的问题生成(之后的问题生成与之前的答案之间的联系匹配)

第一、回答的语义结构与回答类别进行的理解与分析:

通常采用自然语言技术对回答进行深层次的理解,包括命名实体识别、依存句法分析、词义消歧等。(???自然语言技术)

回答理解主要包括 回答分类、主题焦点提取、回答扩展处理

回答分类是将用户回答归入不同的类别,使系统能够针对不同回答类型采用不同的提问反馈机制得到候选问题集合。问答系统通常使用机器学习算法训练回答分类器来实现用户回答的分类。(???分类器问题实现对问题分类)

主题焦点提取主要完成用户问题的信息需求的精确定位,其中主题表示问句的主要背景或者用户的感兴趣的对象焦点则是用户询问的有关主题的内容,通常是问句话题的相关信息或对话题起到描述性的作用,比如属性、动作、实例等等。

回答扩展处理:是将用户在回答中没有充分表达的意思补充出来,回答中潜在的信息显化出来,从而提高判断类别的精度。

第二、自己对各种分类有的思考——设置的问题生成(之后的问题生成与之前的答案之间的联系匹配)

置信度:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平

应用最广泛是基于统计机器学习的置信度计算方法。这种方法通常定义一系列词法、句法、语义以及其他相关特征(如编辑距离、BM25等)来表示回答与候选问题之间的匹配关系,并使用分类器的分类置信度作为下一个问题的置信度。

猜你喜欢

转载自blog.csdn.net/eurus_/article/details/82712976