返回

已开源!用大模型把NLP任务重做一遍,雅意2.0推出多语言信息抽取工具箱YAYI-UIE

来源: 发布时间:2023/12/25 浏览量:

12月15日,中科闻歌重磅发布全自主知识产权大模型——雅意2.0,并首推针对多语言复杂信息抽取的YAYI-UIE,旨在对多种信息抽取任务进行统一训练,完成命名实体识别、关系抽取、事件抽取等信息抽取任务,实现结构化输出。


YAYI-UIE 基于UIE统一信息抽取框架,在百万级中英双语语料上进行指令微调和多任务学习,能够根据用户指令,自动分析和理解文本内容,从中提取出关键信息,为用户提供精确、高效的数据分析和决策支持。


YAYI-UIE 开源地址


GitHub: https://github.com/wenge-research/YAYI-UIE

HuggingFace: https://huggingface.co/wenge-research/yayi-uie



YAYI-UIE 三大信息抽取能力全面领先




YAYI-UIE具备命名实体识别、关系抽取、事件抽取三大任务能力,在与多个代表性模型的零样本对比测试中,YAYI-UIE多项能力获得SOTA(最佳性能表现)


● 命名实体识别(NER): 识别文本中的特定实体,例如人名、地点、组织、日期、产品等。在此任务上,YAYI-UIE英文能力与ChatGPT性能接近,中文整体性能最佳。


● 关系抽取(RE): 识别文本中的实体之间的关系,例如领属关系(拥有关系)、修饰关系(如形容词和名词之间的关系)、时间关系等。在此任务上,YAYI-UIE中英文效果均实现整体性能最佳(SOTA)。


● 事件抽取(EE): 识别文本中的事件以及这些事件之间的关系,例如发生了什么事件、状态如何变化等。在此任务上,YAYI-UIE 中文整体性能最佳(SOTA)。



YAYI-UIE 适配各类应用场景信息抽取需求

面向安全、金融、生物、医疗、商业、新闻媒体等12个应用场景,YAYI-UIE 进行了针对性训练及测试,确保适应不同行业和应用场景的信息抽取需求。


1. 安全领域

支持演习、政策动态、制裁事件、网络安全、袭击事件、突发事件、进出口异动等相关信息的抽取。

eg:制裁事件要素抽取,包括制裁时间、实施国家、被实施国家、制裁方案


2. 金融领域

支持公司上市、财报公告、亏损事件、破产、收购事件、中标事件、股票减持、股份回购、质押事件、约谈事件等相关信息的抽取。

eg:公司上市信息抽取,包括上市公司、发行价格、发行申购日


3. 舆情领域

支持访问事件、人才迁移、合作事件、会议活动等相关信息的抽取。

eg:会议活动信息抽取,包括活动名称、发生时间、发生地点、主办机构、出席人、活动名称


4. 商业领域

支持个人、产品、公司等相关信息的抽取。

eg:产品相关实体信息抽取,包括产品、品牌、型号、介绍等


5. 生活工作

支持餐厅、简历、电影核心要素、娱乐等信息的抽取。

eg:简历中实体信息抽取,包括人物、国籍、籍贯、职称、民族、专业、组织、学历等



6. 生物领域

eg:生物要素实体抽取,包括细胞系、蛋白质、RNA、DNA、细胞类型


7. 医疗领域

eg:医疗诊断信息抽取,包括治疗、身体部位、检查和检验、疾病和诊断、症状和体征等



更多领域复杂信息抽取应用

  欢迎登录以下网址,立即体验!

https://yayi.wenge.com/uie/



IPO
系列

IPO产品系列

企业
出海

企业出海系列产品

关注中科智库公众号
即享最新权威资讯洞察

下载智看APP
开启舆情咨询
商业洞察专业服务

下载智看APP
开启舆情咨询
商业洞察专业服务

在线留言

请留下您的信息,我们会第一时间与您联系

所有提交信息,我们将严格为您保密

您已阅读并同意用户授权协议