返回

生态发布会|天津大学计算机学院张鹏分享自然语言的量子不确定性理论和方法

来源: 发布时间:2021/12/23 浏览量:


2021年12月21日,“数智驱动决策”中科闻歌首届大数据与决策智能生态发布会在北京召开。会上,天津大学计算机学院副院长张鹏作了题为《自然语言的量子不确定性理论和方法》的主题报告,介绍了如何使用量子力学解决自然语言不确定性难题这个研究方向的进展与成果。


1.jpg


       张鹏指出,量子自然语言理解的方法论是将微观世界量子理论作为数学工具用在宏观世界的认知与决策当中他表示,随着科技的发展,人们逐渐认识到人的认知、思维以及决策过程符合量子力学的数学规律,并列举了“苹果”一词存在水果和手机两种意思的叠加态,以及人的决策过程也是量子叠加态这2个具体的例子。

       张鹏认为,自然语言难在其不确定性,如一词多义、一词多音等,导致了机器理解自然语言的困难,而自然语言的不确定性恰好和量子力学的重要概念相吻合,由此引申出自然语言的量子不确定性的理论和方法体系这一关键科学问题。他指出,这个问题面临着如何利用量子力学表示自然语言、如何进一步探究自然语言背后人的认知机理、以及语言不确定性的模型压缩和语言不确定性的量子算法四大挑战。

2.jpg自然语言处理中的量子现象(图片来自张鹏副院长演讲方案)
 

       针对自然语言不确定性的量子表示问题,张鹏及其团队提出使用量子多体来表示自然语言的一词多义以及词语间的复杂交互,把词语性的复杂交互很好地利用量子多体来进行表示,并进一步利用张量分解、投影测量等技术简化大张量计算语言复杂度,同时推导出量子多体语言模型和卷积神经网络之间的本质联系。


3.jpg基于量子多体的语言表示(图片来自张鹏副院长演讲方案)

       针对语言不确定性的认知机理问题,张鹏及其团队使用量子干涉解释自然语言语义理解的认知机理,提出量子概率空间下的语义匹配量子干涉项,开创性地使用约化密度矩阵建模语义匹配量子干涉项,提出量子干涉启发的语义匹配模型,有效应用于信息检索任务。

4.jpg基于量子干涉的认知机理(图片来自张鹏副院长演讲方案)


       针对现在大规模预训练语言模型参数量巨大的问题,张鹏及其团队将参数矩阵重整化为量子多体表示,再使用张量分解技术大幅压缩模型参数,还提出了张量化的Transformer语言模型,使用核张量重构多线性自注意力机制,大幅压缩模型参数。


5.jpg基于量子多体的模型压缩(图片来自张鹏副院长演讲方案)


       针对现有语言建模无法合理兼顾语义和语法的问题,他介绍剑桥大学的一项工作,该工作提出了基于前群缩并技术的语言建模方法,将现有的语言的象征性方法和分布式方法进行了有效结合。分布组合语义模型(CSC)可以移植到了量子计算平台,不仅大幅度提升了计算资源的利用率,还大大降低了计算的复杂度。


       张鹏认为,量子自然语言理解的未来前景可期,现在基于知识的符号主义和神经网络连接主义不能很好的融合。量子力学对符号主义能提供分布式语义,对连接主义可以提供可解释性以及因果推断技术和认知机理增强。鉴于这些特点,量子人工智能有望成为通向第三代人工智能的可能路径之一。 


IPO
系列

IPO产品系列

企业
出海

企业出海系列产品

关注中科智库公众号
即享最新权威资讯洞察

下载智看APP
开启舆情咨询
商业洞察专业服务

下载智看APP
开启舆情咨询
商业洞察专业服务

在线留言

请留下您的信息,我们会第一时间与您联系

所有提交信息,我们将严格为您保密

您已阅读并同意用户授权协议