已开源!用大模型把NLP任务重做一遍,雅意2.0推出多语言信息抽取工具箱YAYI-UIE
YAYI-UIE 基于UIE统一信息抽取框架,在百万级中英双语语料上进行指令微调和多任务学习,能够根据用户指令,自动分析和理解文本内容,从中提取出关键信息,为用户提供精确、高效的数据分析和决策支持。
YAYI-UIE 开源地址
GitHub: https://github.com/wenge-research/YAYI-UIE
HuggingFace: https://huggingface.co/wenge-research/yayi-uie
YAYI-UIE 三大信息抽取能力全面领先
YAYI-UIE具备命名实体识别、关系抽取、事件抽取三大任务能力,在与多个代表性模型的零样本对比测试中,YAYI-UIE多项能力获得SOTA(最佳性能表现)。
● 命名实体识别(NER): 识别文本中的特定实体,例如人名、地点、组织、日期、产品等。在此任务上,YAYI-UIE英文能力与ChatGPT性能接近,中文整体性能最佳。
● 关系抽取(RE): 识别文本中的实体之间的关系,例如领属关系(拥有关系)、修饰关系(如形容词和名词之间的关系)、时间关系等。在此任务上,YAYI-UIE中英文效果均实现整体性能最佳(SOTA)。
● 事件抽取(EE): 识别文本中的事件以及这些事件之间的关系,例如发生了什么事件、状态如何变化等。在此任务上,YAYI-UIE 中文整体性能最佳(SOTA)。
YAYI-UIE 适配各类应用场景信息抽取需求
面向安全、金融、生物、医疗、商业、新闻媒体等12个应用场景,YAYI-UIE 进行了针对性训练及测试,确保适应不同行业和应用场景的信息抽取需求。
1. 安全领域
支持演习、政策动态、制裁事件、网络安全、袭击事件、突发事件、进出口异动等相关信息的抽取。
eg:制裁事件要素抽取,包括制裁时间、实施国家、被实施国家、制裁方案等
2. 金融领域
支持公司上市、财报公告、亏损事件、破产、收购事件、中标事件、股票减持、股份回购、质押事件、约谈事件等相关信息的抽取。
eg:公司上市信息抽取,包括上市公司、发行价格、发行申购日等
3. 舆情领域
支持访问事件、人才迁移、合作事件、会议活动等相关信息的抽取。
eg:会议活动信息抽取,包括活动名称、发生时间、发生地点、主办机构、出席人、活动名称等
4. 商业领域
支持个人、产品、公司等相关信息的抽取。
eg:产品相关实体信息抽取,包括产品、品牌、型号、介绍等
5. 生活工作
支持餐厅、简历、电影核心要素、娱乐等信息的抽取。
eg:简历中实体信息抽取,包括人物、国籍、籍贯、职称、民族、专业、组织、学历等
6. 生物领域
eg:生物要素实体抽取,包括细胞系、蛋白质、RNA、DNA、细胞类型等
7. 医疗领域
eg:医疗诊断信息抽取,包括治疗、身体部位、检查和检验、疾病和诊断、症状和体征等
更多领域复杂信息抽取应用
欢迎登录以下网址,立即体验!
https://yayi.wenge.com/uie/