幽默计算

本文是参考林鸿飞的《幽默计算及其应用研究》。

1、幽默计算

主要分为幽默识别幽默生成
幽默计算旨在赋予计算机识别、生成幽默的能力,它涉及信息科学、认知语言学、心理学等多个学科的交叉。
对于幽默的界定并非易事,其内涵和外延涉及到语境认知、文化等诸多问题。
幽默是一种特殊的语义表达,幽默的理解通常需要在字面含义的基础上,探索更深层次的语义内涵,可以考虑用深度学习的方法建立幽默计算模型,利用计算机自动识别生成幽默文本。

2、幽默的分类

语言中的幽默包含两大类:言语幽默(verbal humor)和指称性幽默(或称概念性幽默Referential or conceptual humor)。
言语幽默是只由语言本身产生的幽默,它依赖于词和短语的语言特征,产生诸如双关语、歧义等幽默。例如,“胃大(伟大)的领导”、“蛤蟆跳井——不懂(扑通)”。这种幽默与文化和语言特征紧密联系,很难在不同语言中进行翻译。
指称性幽默主要是指通过语言传递的幽默。它涉及某个场景或者事件,可以通过漫画、视频、文本、演讲等各种媒介进行描述,并且能够直接翻译成其他语言,产生类似的效果。例如,“服务员,你的大拇指在汤里了!”“没关系,这汤一点也不烫。”。
言语幽默注重语言模态和语义浅层属性,复杂性相对较低,而指称幽默与语义、语用、逻辑等知识密切相连,具有更大的难度和挑战性。

3、幽默的发展

幽默初期是以手工构造规则的方式,生成一些简单的双关语句子和小谜语等。
后来随着机器学习性能的改善,以及词汇获取和本体语义等技术的进步,幽默实体和关系等信息的获取更加高效而准确,可以处理的数据规模进一步扩大,此阶段基于统计的方法得到更多学者的青睐。
幽默智能的提高需要对语义具有较为深刻的了解和细致的描述。

4、幽默的语言学基础

1、基本理论
幽默产生于同一语境下的语义冲突(或不协调),最早亚里士多德提出了乖讹理论,认为幽默产生于对同一陈述两种不同解释框架的混合,即期望与实际结果之间的差异通常是幽默的来源,并且这种不协调程度越大,越出其不意,幽默的效果就越强烈。

5、幽默生成

幽默生成一直以来都是一个巨大的挑战,该过程需要对文化背景和上下文信息进行充分考虑。当前幽默生成相关研究主要关注于生成固定模式的幽默框架或者基于双关语表达的幽默生成机制。

研究和构建幽默框架的核心在于将幽默表达分解并转化为非幽默表达,并在此基础上深入理解幽默所传达的情感信息,在幽默生成中双关语的构建是其核心所在,通过构建双关语,在充分把握文本上下文的基础上将非幽默表达转化为幽默表达,是幽默生成研究的重点。

基于深度学习的幽默生成框架
幽默生成框架以直接形式的文本表达作为输入,以具有相同含义的幽默文本表达作为输出,在处理过程中通过使用指代替换和双关语构建等方式将原始文本转化为对应的具有幽默感的表达,从而实现幽默的生成过程。

深度学习方法可用于文本的深层语义表达,利用深度神经网络模型构建原始句子表达和候选幽默句子表达,通过计算两者之间的匹配程度,定量的评估二者语义上的相似程度,同时通过幽默句子表达与现有幽默句子之间的相似度,评估候选幽默句子的幽默程度,权衡二者,选择与原始文本在语义上最为接近且具有较高幽默感的句子作为系统的最终输出。

猜你喜欢

转载自blog.csdn.net/qq_32458499/article/details/80267760
今日推荐