伴随AI预训练大模型持续发展、人工智能生成内容(AIGC)算法不断创新以及多模态AI日益主流化,以ChatGPT为代表的AIGC技术加速成为AI领域的最新发展方向,推动AI迎来下一个大发展、大繁荣的时代,将对经济社会发展产生重大影响。

腾讯研究院高级研究员徐思彦认为,当前AIGC发展挑战与机遇并存,具体而言,AIGC在产业应用中面临三大挑战。

一是可解释性与可靠性。生成式人工智能的可解释性问题是指生成式人工智能所产生的结果难以解释或理解。生成式人工智能是一种基于深度学习的人工智能技术,其通过学习大量数据来生成新的数据或图像。但是,生成式人工智能所产生的结果通常很难理解和解释,因为其内部的运作过程非常复杂,所以很难直观地描述。

这种可解释性问题对于许多应用场景都非常重要,比如医疗诊断、金融风控、自动驾驶等领域。在这些领域中,人们需要了解生成式人工智能的内部运作过程,以便更好地理解其产生的结果,并且能够对其进行调整和优化。

二是AI大模型的价值对齐问题。所谓人工智能的价值对齐(AI Alignment),就是让人工智能系统的行为符合人类的目标、偏好或伦理原则。价值对齐是AI安全研究的一个核心议题。在理论上,如果一个强大的AI系统所追求的目标和人类的真实意图、价值不一致,就有可能带来灾难性后果。目前,大语言模型的价值对齐问题主要表现为,如何在模型层面让人工智能理解人类的价值观和伦理原则,尽可能防止模型的有害输出,从而打造更加有用同时更加符合人类价值观的AI模型。在这方面,RLHF是一个有效的方法,通过小量的数据就可能实现比较好的效果。简言之,RLHF要求人类专家对模型输出内容的适当性进行评估,并基于专家反馈对模型进行优化。

三是AI对人类未来生存的潜在风险。大语言模型等生成式AI的发展,在让人们看到AGI曙光的同时,也带来更加复杂难控的风险。在科技向善理念下,AI时代需要成为一个负责任创新的时代,而非另一个“快速行动、打破陈规”的时代。人们需要建立合理审慎的AI伦理和治理框架,塑造负责任的AI生态,打造人机和谐共生的未来。生成式AI领域的创新主体则需要积极探索技术上和管理上的安全保障措施,为生成式AI的健康发展和安全可控应用构筑起防护栏。

徐思彦同时表示,AIGC在产业应用中发挥着十分积极的作用。一是多模态将带来创新应用蓝海。多模态AI是指能够理解和处理多种类型信息的人工智能,如文本、图像、音频、视频等。这种AI不仅能够理解单一数据类型的问题,而且可以在不同数据类型间建立联系和融合,从而综合、全面地处理多模态问题。AI能够对各种不同类型的数据进行关联分析,为解决复杂问题提供支持。

在多模态技术发展初期,不同模态的AI开始集成,比如图像识别和自然语言处理技术的结合。除了ImageBind打通六种模态外,多数仍在探索文本与图像的融合,但进展飞快。例如UniDiffuser除了可以单向文生图,还能实现图文联合生成、无条件图文生成等多种功能。

OpenAI开发了许多多模态AI案例,如DALL-E、CLIP等,可以识别图像中的对象,同时生成与图像相关的描述性文本,或由文本指导生成有关物品的新图像。

随着多模态技术的发展,多模态AI在理解和处理不同类型数据时能够实现更高程度的融合。算法和模型可以在不同数据类型之间建立联系,提取跨模态的共享信息。这使得AI能够深度理解和解决复杂问题。未来在诸多创新领域,多模态技术的发展将带来创新应用的蓝海。

二是生成式AI带来更贴近人的交互方式。从使用键盘、鼠标等方式跟电脑交互,到使用手指滑动屏幕跟手机交互,再到人们用唤醒词跟智能音箱等交互,人机交互从识别机器指令,到识别人的动作、语音,不断朝着更贴近人的习惯的交互方式演进。生成式AI的发展,让人类有史以来第一次有机会用自然语言的方式来跟机器对话,而机器也借由大模型拥有了极强的理解人类语言的能力,有望带来一场全新的交互变革。正如历次交互变革带来从终端到连接,再到各类应用的颠覆式变革,生成式AI也必将带来产业链、价值链和生态链的重塑。

生成式AI技术的突破,带来了大模型理解能力的大幅提升。大模型可以更好地理解人类表达的含义,并生成更符合人类价值观的回答。其技术成熟度已经可以在很多场景下达到可用甚至好用的程度。在科技公司不断投入对齐工作的进展中,大模型的“幻觉”被持续降低,从而让人类第一次有可能完全以自然语言对话的方式来跟机器交流。这也是人去发掘机器智能最简单直接、最有效的交互方式。

在这个背景下,所有APP都可以用生成式AI重做一遍,并可能产生原生AI APP。一方面,当前的所有软件,在后端不变的情况下,前端的交互可以直接换成自然语言对话的方式,这样让更多的APP拥有了智能对话的能力,给用户带来全新的体验。现在已经有很多应用软件和硬件,开始往这个方向升级。另一方面,未来更具市场想象力的是原生的AI APP,例如未来很可能出现一个万能的个人助理,可以回答人的各种问题,帮人出主意,甚至可以胜任文章撰写、艺术创作等更富创造力的工作。“机器生成+人脑筛选”在可预见的将来,会成为人机协作的重要方式。

徐思彦表示,生成式人工智能在发展演进过程中取得了显著的成果,为人类社会的进步和发展提供了强大的技术支持。从深度学习、自然语言处理等技术的发展,到生成式人工智能在各个产业中的应用,都展示了其强大的潜力和价值。然而,随着技术的不断创新和突破,生成式人工智能在应用过程中也暴露出一些问题,如数据安全、隐私保护、伦理等方面的挑战。因此,未来的研究应关注如何在保障技术创新的同时,解决这些潜在问题,以实现生成式人工智能的可持续发展。此外,各国政府、企业、研究机构等应加强合作,共同推动生成式人工智能的研究与应用,以实现人类社会的共同繁荣与进步。 

来源:人民邮电报