自2022年12月以来,国内外人工智能领域掀起新一轮技术革命。以ChatGPT、文心一言、通义千问为代表的通用智能产品问世,在推动知识生产力提升过程中,让广大消费者深刻感受人工智能技术对生活方式带来的冲击。面对人工智能技术范式转变带来的机遇,如何抓住机会窗口、打造新技术周期中的竞争力,已成为大家关注的重大课题。
作为新兴技术,人工智能技术的发展方向不确定性强且复杂度高,不仅需要产学研加强协同,在长周期、高投入下联合攻关基础研究环节,还需要市场主体引导创新方向、促进创新转化,这对国家层面的系统性基础支持提出更高要求。机会窗口期蕴含着无数机遇与挑战,亟须充分发挥国家公共力量,直面短板,在产学研协同发展中积极应对市场变化与技术竞争。
当前,首要的是为前沿基础研究夯实基础设施。大语言模型是智能时代下场景应用的开发基础,具有强外部性和(准)公共物品属性,需要大量计算资源和存储资源支持其进行大规模分布式训练。以ChatGPT模型为例,其单次训练成本高达1200万美元,且需要在特定的高性能计算芯片上运行。高资源门槛使高校、科研机构等主体望而却步,其非经济性特征也抑制了逐利的市场主体参与。
因此,我们应探索建设政府、国企央企、科研院所三方协同的公共研发平台,特别关注以高端算力设备、云网络为核心的重大装备建设,以此打破人工智能技术创新的技术障碍、降低研发成本。同时,研究人员、开发者和学术界能够共享数据、工具、算法和最佳实践,也有助于加速知识传播和交流、探索创新,促进研究成果在产学研互动中进行试验与应用。此外,育人功能也是公共研发平台的突出优势,年轻学者、研发人员既可以通过共享知识库、平台培训项目等快速学习,也可以通过平台的联合研发项目获得实践经验,并与领域内的专家进行交流合作。
人工智能技术的研究与发展离不开与应用场景的连接。从技术提升看,人工智能模型的性能和泛化能力依赖高质量数据集和有效的模型训练,然而,我国乃至全球人工智能科技企业都面临缺少高质量训练语料库的难题。因此,我们要以共享数据中心引领智能技术研用融合。作为数字经济时代的“石油”,高质量数据是高性能模型算法的必要基础,是智能产品提升场景适应力的关键因素。我们应着力建设高效能国家级共享数据中心,建设包括采集、脱敏、标注、清洗、存储等流程的精细化数据处理平台,为社会创新力量提供高效、安全、综合的数据资源供给。同时,共享数据中心还可作为基于场景的应用方案示范与交流中心,推动智能产品提高场景适应力,赋能智能产业发展。在政府监督与防护下,共享数据中心是维护全社会信息安全和公民权益的坚实可靠的防线,可实现数据开放利用和安全防护并重。
总而言之,要想抓住人工智能范式转变机会窗口期,我们必须在建设公共研发平台和共享数据中心等新型重大科研设施方面重点发力,这样才能力争在全球领先。