市场研究机构Gartner日前发布2023年《中国数据分析和人工智能技术成熟度曲线》,其中特别提及数据编织、数据资产管理、组装式数据和分析、大模型以及数据中台五项技术的发展趋势。

处于曲线技术萌芽期的数据编织是一种设计框架,用于获得灵活且可复用的数据管道、服务和语义,涉及数据集成、主动元数据、知识图谱、数据剖析、机器学习和数据分类。数据编织颠覆了现有的数据管理主导方法,不再针对数据和用例“量身定制”,而是“先观察再使用”。该机构表示,数据编织能充分利用沉没成本,同时也能为数据管理基础设施方面的新支出进行优先级排序和提供成本控制指导。

同样处于技术萌芽期的数据资产管理是指管理、处理和利用对业务运营有价值的数据的过程。数据资产管理适用于多种数据形态,例如系统中的图像、视频、文件、资料和交易数据,涵盖从数据获取到销毁的整个数据生命周期,目的是以管理资产的方式管理数据并从中创造价值。数据具有快速、多样、大量和描述事实的特点,因此,企业机构必须整合流程来生成对数据的洞察。该机构表示,数据资产不仅能提升运营质量和决策水平,创造更多业务价值,还能产生新的业务模式和利用数据直接变现。尽管价值创造在加速,但数据资产仍存在潜在风险。企业机构必须谨慎管理数据资产,避免监管违规和数据意外泄露。

组装式数据和分析也处于技术萌芽期,该技术利用基于容器或业务微服务的架构和数据编织理念,将现有资产组装为灵活、模块化和用户友好的数据分析和AI能力。这项技术可在低代码和无代码能供的支持下,综合运用一系列技术将数据管理和分析应用转变为数据分析和AI组件等应用模块,并支持自适应和智能决策。组装式数据和分析有助于企业机构使用模块化数据和分析能力,在各项措施中融合多个信息,避免割裂式开发。企业机构可通过组装或重组数据和分析能力进一步提高交付的灵活性,应对不同的使用场景。

处于期望膨胀期的大模型是在大范围的数据集上以自监督方式训练的大参数模型,在不久的将来可能会成为多模态。大模型源于其对多种使用场景广泛的适配性。大模型现在已经成为自然语言处理的首选架构,并已应用于计算机视觉、音视频处理、软件工程、化学、金融和法律领域。大模型衍生出的一个热门子概念就是基于文本训练的大语言模型。该机构表示,大模型有潜力为各类自然语言用例中的应用提供增强效果,因此将在垂直行业中产生深远影响,可以提高员工生产力、提升客户体验,以经济高效的方式创建新产品和服务,从而加速行业数字化转型。

数据中台处于曲线的泡沫破裂低谷期,是一种组织战略和技术的实践。通过数据中台,不同业务线的用户能够依据单一事实源,高效地使用企业数据进行决策。很多企业之所以采用数据中台实践,是为了减少其数据和分析架构的技术冗余,打通不同系统的数据“孤岛”,并增强可复用的数据和分析能力。但数据中台在许多情况下未能兑现这种能力,因此在市场中的地位被削弱。许多企业机构和供应商都不愿在企业内部采用这一概念,或者干脆将其从宣传中移除。

来源:人民邮电报