返回

“雅意”发布会系列之三 | 徐楠博士:开源开放为社区做贡献

来源: 发布时间:2023/07/15 浏览量:

目前,“雅意”的代码、模型以及面向领域的训练数据,都已在GitHub、HuggingFace社区向每一位开发者开放。在中科闻歌雅意大模型发布会上,徐楠博士分享了“雅意”的开源计划和评测结果


以下为演讲实录:


在人工智能发展方面,中国一直强调开源、开放这一基本原则。根据科技部最新发布的《中国人工智能大模型地图研究报告》显示,目前,已经有超过一半国内发布的大模型实现了开源。


中科闻歌作为一家人工智能企业,我们有开源、开放的情怀,坚持开源创新和生态引导,愿意为社区贡献,我们在大模型这条路上的经验和数据,因此我们在本次发布会,会把雅意大模型全面开源,包括雅意的代码、模型,以及相关的面向领域的训练数据,都将通过GitHub、HuggingFace平台向每一位开发者开放。我们期望通过雅意大模型的开源,为促进中文预训练大模型开源社区的发展,贡献一份自己的力量,通过开源与每一位合作伙伴,共建雅意大模型的生态。



雅意基于开源可商用的预训练模型初始化,在百万级人工构造的高质量领域数据上进行指令微调,训练数据涵盖媒体、安全、金融、治理等多个领域,上百种自然语言指令任务。从雅意的base模型逐步到领域模型的迭代过程中,我们逐步增加了它的中文基础能力、领域分析能力,并支持了各种插件的能力。


接下来,我们将通过大语言模型基座的规模,并结合更多领域的特定训练数据等手段,进一步强化雅意大模型的多轮对话能力和逻辑推理能力。此外,我们也在积极探索更多的插件能力、多模态生成能力。


未来,我们将持续投入对领域基础大模型的研究,结合中科闻歌在大数据方面的经验优势和数据优势,在更加安全可控的中文预训练数据上,通过自监督训练探索更加通用的领域基础大模型。


我们将雅意与目前市面上主流大模型进行了综合的人工评测。评测能力主要包括基础能力和领域的分析能力,涵盖12大类、55类子任务。评测结果显示,雅意在金融、舆情、媒体、安全领域均取得了不错的性能。未来通过雅意的开源,再进一步提升它的性能。



欢迎扫码访问“雅意”的代码及模型!


IPO
系列

IPO产品系列

企业
出海

企业出海系列产品

关注中科智库公众号
即享最新权威资讯洞察

下载智看APP
开启舆情咨询
商业洞察专业服务

下载智看APP
开启舆情咨询
商业洞察专业服务

在线留言

请留下您的信息,我们会第一时间与您联系

所有提交信息,我们将严格为您保密

您已阅读并同意用户授权协议