历经60多年起起落落,人工智能在深度学习、大数据和计算能力三大发展力量碰撞下重获新生,数据智能成为这次人工智能浪潮最重要的技术特征。在具体应用场景下,人工智能基于场景大数据进行学习,发现知识,创造价值,并为智能系统合理的决策和行动提供支撑。在这一背景下,这种初级阶段的“人工智能”需要大量的数据作为“思考”和“决策”的基础,大数据也需要人工智能技术进行数据价值化操作。
人工智能与自动化也有着明显区别。自动化是建立在确定的模型和流程基础上的,能自动反馈控制,也具有对环境中确定性参数变化的调整能力。数学家也可以提出判定这些自动化系统调整能力稳定性的判断依据。而人工智能的研究对象则存在模型严重的不确定性,即模型未知或知之甚少,模型的结构和参数变动范围较大。人工智能如果具备对非结构化环境变化系统的适应能力,则就具备了自主性,这是自动化的高级阶段。而自主性是基于信息甚至知识驱动的,系统根据任务需求自主完成“感知—判断—决策—执行”的动态过程,并能够应对意外情形。
这种建立在大数据基础上的静态学习和自动化基础上的动态自主学习目前还大多是弱人工智能。静态的学习是通过与大数据标注等结合构成闭环,从而不断提高性能,例如语音识别、图像识别、机器翻译等任务。而动态学习能力,则是与环境建立实时化的学习和反馈机制,不断适应交互需求,例如进入物质世界的机器人和自主无人系统。现有大多人工智能算法在现实数据或者环境下性能进步只是线性的,而通过虚拟环境则有可能实现超实时、指数级性能提升,这有待于人工智能基础理论突破。
智能的玄妙之处在于没有一个明确的标准。但真正的人工智能无疑应该具备强大的学习能力。对环境的理解、推理、对结果的可解释性等都是达到认知、决策阶段人工智能必不可少的重要特征。我们正处在真正人工智能的起步阶段,这意味着巨大的发展空间,也正是人工智能的魅力所在。这些问题只要有一点儿进步和解决,就会对人类社会和人们生活发生巨大的改变。
自20世纪50年代发展至今,根据人工智能解决问题的不同阶段,大致可以将其归纳为感知智能、认知智能和决策智能等三个阶段。
第一阶段是感知智能,以语音识别、图像理解、文字识别等为主要任务,表现为“能听会说、能看会认”,单一任务已接近或超越人类水平。就人工智能取得最大进展的语音识别领域而言,在几万乃至几十万小时标注语音数据基础上,深度学习可以达到甚至超过我们人类的听写水平。当前人工智能在感知智能层的技术已经进入了一个成熟的阶段。
第二阶段是认知智能,以推理、决策、学习等为主要任务,表现为“能理解、会思考、有认知。以让机器回答“明天这个天气状况会造成航班延误吗?”为例,机器不但需要了解现在的天气状况是什么、还需要知道什么样的天气会造成航班延误等常识,也需要知道具体到某个航空公司或机场飞机起飞基本准则等。语言理解的背后是常识和推理,而文字只是人类认知空间的冰山一角。认知智能的研究才刚起步,目前人工智能的认知天花板还很低。
随着机器认知水平越来越高,其“自主性”进一步增强,具备了应对更多样态势和功能的能力,人类无可避免地会将越来越多的问题交给机器决策。但机器的决策就一定比人的决策正确吗?这就需要加强复杂问题下,提升人机信任度,增强人类与智能系统交互协作智能的研究,即决策智能。
但感知智能、认知智能和决策智能绝非泾渭分明。当前人工智能只解决了专用场景的识别、分类、跟踪、检测等感知智能,但当这些感知智能走向通用场景时,就迈入了认知智能和决策智能边界。当我们试图把语音识别系统放置于背景嘈杂的鸡尾酒会环境时,现有系统就基本分不清东南西北了。机器就需要跟人类大脑一样,调用人类的知识、常识等记忆并不断进行选择决策,才能有效区分不同信号源并加以正确处理。目前人工智能距离认知智能和决策智能还有较远的距离,存在大量“无人区”亟须探索。
人工智能技术正在塑造数据极其丰富的商业和社会场景,但目前推动业务爆炸式增长的人工智能往往并不复杂。事实上,只需要一个计算机系统就能完成传统上由专业人士来完成的特定任务——这通常被称为“弱人工智能”。
人工智能作为社会发展的引擎,必须与各行业深度结合,而人工智能平台至关重要。平台就像人类工业文明的蒸汽机,可以适配到不同的应用领域,形成不同的AI社区帮助解决气候变化、改善生产和管理流程、提供医疗辅助诊断、到改变人类的教学方式等。在人工智能时代,我们需要新的思维逻辑,数据和算法已经成为整个世界的底层,也是我们理解未来的关键。但受人工智能技术和商业推动的约束,这种改变目前仅仅处于初级阶段。
首先,人工智能技术发展首先需要一个务实的环境。只有清醒客观的判断和勤勤恳恳的努力,这项技术才会真正地便捷人们的工作和生活。过去几年把后台人工作业当做人工智能,刻意拔高人工智能水平以获取投资,以及把预设程序的自动化当做智能等伪人工智能的行为层出不穷。再加上媒体不严谨的报道,如把OpenAI的GPT-2生成文章的能力、对人工智能替代放射科医生的预测、DeepMind论文缺乏潜在局限性的讨论、Elon Musk曾承诺2020年实现无人驾驶等新闻。在扰乱人工智能市场的同时,也给决策者和公众带来困惑。实践证明,即使在更简单、更具体的智能放射学案例中,将实验室演示用于现实也非常困难,而实现更加复杂的全自动驾驶,比大多数人预期的要困难得多。
第二,人工智能学习能力的基础科学问题需要长期探索。真正人工智能核心体现在能指数级提升性能的卓越学习能力上,目前机器学习无论从机理还是能力都与此相差甚远。从人类大脑结构、功能和可塑性学习机制上探索智能本质、研究相应学习算法,将为了解并定量化描述人工智能技术的性能预期和局限性奠定基础。人工智能不同于人类智能,研究把数据和知识相结合,开发能充分利用观测数据、模拟数据和先验知识的人工智能算法体系,设计并测试基于真实物理环境的学习算法等基础性工作也十分重要。
第三,需要坚持把应用场景落地作为推动新一代人工智能发展的抓手。人工智能作为一项通用性赋能型技术,对人类经济和社会发展产生了深刻的影响,随着我国《新一代人工智能发展规划》加紧实施,充分发挥我国得天独厚的海量数据资源、巨大应用需求和深厚市场潜力,以此促进推动关键核心技术形成以及应用模式的推广,建立起我国人工智能健康发展的创新高地,是当前人工智能发展的最重要发力点。
第四,需要加快建立连接人工智能创新链的人工智能平台生态。如同所有创新性的信息技术,人工智能正在快速走向开源化、平台化、生态化。在过去几年,PyTorch和TensorFlow 等深度学习框架流行,极大地优化了模型性能和提供更加高效的开发模式。从中短期来看,我国要充分发挥应用优势,从应用、芯片和基础算法协同入手,依托现有优势企业、联盟等开源平台和社区,集中力量发展开源开放的人工智能平台,奠定良好的人工智能底层应用生态;从中长期看,要通过算法的原始创新,形成从基础理论、算法、芯片、核心软件到应用生态的完整创新链,研究建立基于知识产权共享的开源激励机制和大规模群体协同共享机制,促进基础算法、行业数据、典型应用方面的开放共享,推动形成具有国际影响力的标准规范和准则,占据人工智能制高点。
习近平总书记在主持中共中央政治局第九次集体学习时强调,“人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。”中国在这一轮的人工智能浪潮中发挥着不可替代的作用,并且第一次有可能站在领跑的位置上,新一轮科技革命与产业变革已曙光可见。
在此背景下,围绕人工智能重大问题,探索新型举国体制在重大基础理论突破和关键核心技术攻关中的作用,加快构建引领型资源集聚性的创新体制就显得极为必要。一方面从国家层面完善人才政策和评价体系,从上到下构建吸引人才、适合人才成长的、稳定支持的环境,组织顶尖科学家和工程师长期稳定地进行团队式研究攻关,并鼓励自由探索。另一方面,加快布局国家级的人工智能研究中心和实验室,横向吸纳各领域顶尖人才和资源,碰撞智慧火花,纵向串联整条人工智能创新链条。
在这场关乎前途命运的大赛场上,我们必须抢抓人工智能发展的重大战略机遇,构筑先发优势,把握新一轮科技革命战略主动,以期实现我国在人工智能马拉松赛式国际竞争中始终占据有利地位,为建设创新型国家奠定坚实基础。