大规模预训练语言模型ChatGPT 一经发布便成为新晋网红,它能够以对话的方式与使用者进行交互,高质量的内容回复、上瘾的交互体验,不仅吸引全网用户探索ChatGPT的应用场景,也让AI技术发展以及在各行业领域的创新应用备受关注。
多样化产品竞相涌现
谈到AI领域的未来发展,就不得不提生成式人工智能(以下简称“生成式AI”)。简单来说,生成式AI是利用现有文本、音频或图像创建新内容的技术。自2021年起,生成式AI连续两年入选Gartner《Hype Cycle for Artificial Intelligence》,被认为是未来重要的AI技术趋势。2022年,AI画作《太空歌剧院》在美国科罗拉多州举办的艺术博览会上摘得金奖;近日发布的AI模型MusicLM可以根据文本、图像内容生成音乐,且曲风多变。这意味着,AI的触角已深入艺术创作等创意型脑力工作领域。
刚刚过去的2022年,扩散模型Diffusion和大规模预训练语言模型ChatGPT引领研究热潮,其突破性发展对于生成式AI具有重要意义。在人工智能顶级会议ICLR 2023中,Diffusion Model”作为论文题目关键词的频率排名从去年第159名上升到第14名。Stable Diffusion作为一款高性能深度学习模型,能够根据文字描述生成精美图像,将AI图像生成的效率与精度提升到前所未有的量级,在基础的终端设备上,只需输入关键词,就能生成高质量的AI图像;基于GPT-3.5的对话式AI ChatGPT不仅能够“理解”对话者的语义进行连续对话,还能写作甚至编程,生成内容的能力空前提高。生成式AI将为内容领域的生产方式带来变革,也让内容生产变得更容易、更个性。据Gartner测算,预计2025年超过10%的数据由生成式AI创造。
生成式AI产品竞相涌现、形态多样。目前生成式AI产品形态包含插件、API网页交互、客户端等。其中,插件形式通过IDE(集成开发环境)运行代码,不需要引入新的应用程序。API网页交互在云端即可获得生成内容,如用户可在百度的“文心ERNIE 3.0”产品网页中输入提示词生成内容。国内生成式AI产品以语言生成类和视觉生成类为主。华为云推出数字内容生产线MetaStudio,可用于虚拟直播、虚拟视频内容制作;百度发布的AI艺术和创意辅助平台“文心一格”,能够根据用户提供的文字描述和创作风格生成相应画作。在国外,生成式AI产品正在迅速获取大量用户。根据知名创业组织Antler的统计,截至2022年年底,海外生成式AI产品数量达到190余个,包括视频、音频、游戏、数据、搜索等多种类型应用。同时,2022年年底图片生成应用Midjourney官方Discord中的关注人数超过百万,ChatGPT上线后一周内用户数量已近百万。
内容监管难度将增加
社交论坛Reddit用户晒出了自己与ChatGPT的交流:“如何用JavaScript方法在调制控制台中打印一只大狗?”ChatGPT则马上“写”出了一段代码,用各种字符拼出狗的形状。看似简单的问答,实则展现出生成式AI的强大能力。对于用户而言,交互方式与平时的对话交流并没有太大区别,输入文字内容即可。由于ChatGPT解决问题的能力过于优秀,很多用户表示,它完全可以取代搜索引擎,甚至代替学校助教来回答专业领域的学术问题等。
发展总是与挑战并存,生成式AI的发展也面临诸多挑战。文本生成类应用在生成可控性、准确性等方面仍表现不足。比如AI“写”论文时,可能会引用不合适的例子或者错误的数据;“编”代码时,可能会生成看起来没问题但是会报错的代码。据了解,由于ChatGPT在解决复杂程序问题时表现不太理想,技术交流论坛Stack Overflow曾临时禁止ChatGPT回答编程问题。
图片生成类应用则面临版权争议、创作质量不高等问题。AI“创作”时会借鉴大量绘画作品,根据用户给定的关键词和创作风格“依葫芦画瓢”,生成内容与原作相似度较高,版权争议较大。据了解,综合CG视觉艺术作品展示平台ArtStation已有艺术家呼吁“NO TO AI GENERATED IMAGES(拒绝AI绘画)”,一时间网站首页大部分被此图片占领。此外,ArtStation网站新增了过滤功能,用于隐藏搜索结果中的AI作品。
随着AI技术不断成熟、深度学习算法持续演进,生成式AI的创作水平逐步提升,有些内容已经到了可以“以假乱真”的地步。除版权问题需要明确外,随意使用“换脸”“变声”等功能有可能加速虚假信息的传播,从而增加内容监管的难度。
对于代码、绘画、音乐等作品,如何能判别作者是人类还是AI模型?调查发现,89%的美国大学生已经在用ChatGPT写作业了,部分欧美学校开始从课程设计上着手打击AI生成的作业,比如增加口试、团队合作等课程评估方式的占比。近日,人工智能研究初创公司OpenAI,也就是ChatGPT的所有者,推出了一款名为Text Classifier的工具,旨在弄清文本内容的作者是人类还是AI。有趣的是,这款文本分类器与ChatGPT都基于GPT模型,颇有以子之矛攻子之盾的意思。该公司称其仍然在研发优化中,仅可用于长度大于1000个字符的英语文本内容,且现阶段使用效果并不理想。
* * *
如今,生成式AI已经逐渐渗透到专属于人类原创的领域,画作、论文、音乐乃至代码都可能出自AI之手。生成式AI正在进入应用爆发期,但是这种增长可以持续吗?用户的新鲜感如何维系?
从新颖的“玩具”到解决问题的“工具”,生成式AI在模型训练成本、构建独家差异化优势、用户获取策略等方面仍需努力,逐步建立可持续的生成式AI商业实践模式,帮助人们更好、更快、更低成本地创作,以多元应用不断创新AI应用范式,并将实践成果逐步延伸至智慧教育、智能制造、医疗等领域,真正成为人们生产生活的得力助手。