“雅意”发布会系列之三 | 徐楠博士：开源开放为社区做贡献

来源：发布时间：2023/07/15 浏览量：

目前，“雅意”的代码、模型以及面向领域的训练数据，都已在GitHub、HuggingFace社区向每一位开发者开放。在中科闻歌雅意大模型发布会上，徐楠博士分享了“雅意”的开源计划和评测结果。

以下为演讲实录：

在人工智能发展方面，中国一直强调开源、开放这一基本原则。根据科技部最新发布的《中国人工智能大模型地图研究报告》显示，目前，已经有超过一半国内发布的大模型实现了开源。

中科闻歌作为一家人工智能企业，我们有开源、开放的情怀，坚持开源创新和生态引导，愿意为社区贡献，我们在大模型这条路上的经验和数据，因此我们在本次发布会，会把雅意大模型全面开源，包括雅意的代码、模型，以及相关的面向领域的训练数据，都将通过GitHub、HuggingFace平台向每一位开发者开放。我们期望通过雅意大模型的开源，为促进中文预训练大模型开源社区的发展，贡献一份自己的力量，通过开源与每一位合作伙伴，共建雅意大模型的生态。

雅意基于开源可商用的预训练模型初始化，在百万级人工构造的高质量领域数据上进行指令微调，训练数据涵盖媒体、安全、金融、治理等多个领域，上百种自然语言指令任务。从雅意的base模型逐步到领域模型的迭代过程中，我们逐步增加了它的中文基础能力、领域分析能力，并支持了各种插件的能力。

接下来，我们将通过大语言模型基座的规模，并结合更多领域的特定训练数据等手段，进一步强化雅意大模型的多轮对话能力和逻辑推理能力。此外，我们也在积极探索更多的插件能力、多模态生成能力。

未来，我们将持续投入对领域基础大模型的研究，结合中科闻歌在大数据方面的经验优势和数据优势，在更加安全可控的中文预训练数据上，通过自监督训练探索更加通用的领域基础大模型。

我们将雅意与目前市面上主流大模型进行了综合的人工评测。评测能力主要包括基础能力和领域的分析能力，涵盖12大类、55类子任务。评测结果显示，雅意在金融、舆情、媒体、安全领域均取得了不错的性能。未来通过雅意的开源，再进一步提升它的性能。

欢迎扫码访问“雅意”的代码及模型！

上一篇：无

下一篇：无

DIOS认知与决策基础平台

雅意大模型

媒体

产品

解决方案

雅意大模型

社会计算

产品

解决方案

雅意大模型

金融

产品

解决方案

雅意大模型

治理

解决方案

雅意大模型

“雅意”发布会系列之三 | 徐楠博士：开源开放为社区做贡献

业务合作

在线留言

请留下您的信息，我们会第一时间与您联系