“雅意”发布会系列之三 | 徐楠博士:开源开放为社区做贡献
以下为演讲实录:
在人工智能发展方面,中国一直强调开源、开放这一基本原则。根据科技部最新发布的《中国人工智能大模型地图研究报告》显示,目前,已经有超过一半国内发布的大模型实现了开源。
中科闻歌作为一家人工智能企业,我们有开源、开放的情怀,坚持开源创新和生态引导,愿意为社区贡献,我们在大模型这条路上的经验和数据,因此我们在本次发布会,会把雅意大模型全面开源,包括雅意的代码、模型,以及相关的面向领域的训练数据,都将通过GitHub、HuggingFace平台向每一位开发者开放。我们期望通过雅意大模型的开源,为促进中文预训练大模型开源社区的发展,贡献一份自己的力量,通过开源与每一位合作伙伴,共建雅意大模型的生态。
雅意基于开源可商用的预训练模型初始化,在百万级人工构造的高质量领域数据上进行指令微调,训练数据涵盖媒体、安全、金融、治理等多个领域,上百种自然语言指令任务。从雅意的base模型逐步到领域模型的迭代过程中,我们逐步增加了它的中文基础能力、领域分析能力,并支持了各种插件的能力。
接下来,我们将通过大语言模型基座的规模,并结合更多领域的特定训练数据等手段,进一步强化雅意大模型的多轮对话能力和逻辑推理能力。此外,我们也在积极探索更多的插件能力、多模态生成能力。
未来,我们将持续投入对领域基础大模型的研究,结合中科闻歌在大数据方面的经验优势和数据优势,在更加安全可控的中文预训练数据上,通过自监督训练探索更加通用的领域基础大模型。
我们将雅意与目前市面上主流大模型进行了综合的人工评测。评测能力主要包括基础能力和领域的分析能力,涵盖12大类、55类子任务。评测结果显示,雅意在金融、舆情、媒体、安全领域均取得了不错的性能。未来通过雅意的开源,再进一步提升它的性能。
欢迎扫码访问“雅意”的代码及模型!