别怕，和ChatGPT 一起奔向未来

12月

1186 0 0

达到1亿月活跃用户，Tiktok用了大约9个月，Meta的Instagram用了约2.5年，而美国人工智能公司OpenAI推出的人工智能聊天程序ChatGPT仅用了两个月。近期大热的ChatGPT 一鸣惊人，如何客观看待这一新生事物？AI应用已经超越人类了吗？我们不妨聊聊ChatGPT的“成长过程”。

ChatGPT“学”了各领域的巨量知识，千亿规模参数量带来智能化程度提升。2018年，GPT（生成式预训练Transformer）模型已经在NLP（自然语言处理）领域火起来，该模型能够从大型文本语料库学习语言模式，进而生成自然语言文本。生成式模型的输出并不来自人们事先给定的训练数据，而是由模型学习归纳后进行演绎创造得来。从GPT-1（1.17亿参数）、GPT2（15亿参数）、GPT-3（1750亿参数）、InstructGPT到ChatGPT，模型的参数规模已从最初的几亿快速增长为千亿。其中，InstructGPT是经过微调的GPT3，参数量与GPT-3模型相当，能够尽可能减少不真实和有偏差的输出结果。ChatGPT是InstructGPT的姐妹模型，在训练过程中加入了基于人类反馈的强化学习，使得模型能产生更加近似人类的回复内容。简单来说，ChatGPT“博览群书”，学得多自然懂得多，写文章、编代码、归纳论文摘要等任务难不倒它。

知不足补不足，持续学习能力对于个人成长至关重要，对于AI产品也是如此。细心的用户应该已经发现了，并不能与ChatGPT“聊”实事，因为其训练数据截止到2021年，对于近期发生的“新鲜事”，它并不了解，很有可能胡编乱造。对比引入了ChatGPT能力的新版必应（搜索引擎），可以理解为联网版ChatGPT，能够整合网上的最新资讯，“持续学习”能力得到一定程度的提升。日前，在微软新版必应的演示中，展示了如何使用ChatGPT版必应对比不同吸尘器的优缺点、快速比较公司盈利结果等。然而，据外媒消息，ChatGPT版必应给出的搜索结果存在问题：比如其未能准确区分吸尘器的类型，甚至编造了某些产品信息；对比Gap和Lululemon营业利润率的相关表述和比较分析都存在错误。“知之为知之，不知为不知，是知也。”这是我们很早就明白的道理，对于现阶段的ChatGPT类应用，还需进一步发现自身不足，通过“持续学习”来为用户提供更加准确、全面的输出结果。

“近朱者赤，近墨者黑。”ChatGPT是通过对大量数据进行训练得到的，由于其不具备独立思考和判断能力，好的坏的通通都学，如果训练数据存在偏见，那么其输出结果也会保留这种偏见。有用户在使用过程中发现ChatGPT的输出内容带有种族歧视、政治偏见，比如加州大学伯克利分校的计算神经科学家史蒂文·皮安塔多西就在推特上分享，在他用ChatGPT 开发的一个判断“一个人是否应根据原籍国而受到酷刑”的Python程序中，当输入朝鲜、叙利亚等国家时，给出的答案是肯定的。不难看出，ChatGPT的思考能力和判断能力亟待提升，而作为人类的我们，在成长过程中一直遵循“见贤思齐焉，见不贤而内自省也”的方式，追求进步的同时注重纠偏和自省，逐步形成的批判性思维能力是目前技术水平下的ChatGPT无法企及的。

“悟已往之不谏，知来者之可追。”ChatGPT确实火了，从它一路“狂飙”成长中，我们不禁对AI领域的突破性进展发出赞叹。与此同时，我们也再次认识到独立思考能力、持续学习能力对于自身成长的重要意义。未来，ChatGPT类应用将进一步优化，各领域与AI技术的融合创新也将迈向新的阶段，“人类的工作是否会被AI取代？”在网上，很多人表达了这样的焦虑。但人类与AI之间一定是竞争或者替代的关系吗？大可不必，AI技术的发展有助于人类更加高效解决复杂问题，放眼历史长河，重大科技成果必然引发人们生活方式的改变，与此同时，它们也无一例外成为人类文明发展的活力因子。与其恐惧被替代，不如一起向未来。

ChatGPT核心知识点

GPT模型能够从大型文本语料库学习语言模式，进而生成自然语言文本。生成式模型的输出并不来自人们事先给定的训练数据，而是由模型学习归纳后进行演绎创造得来。

ChatGPT有多火？

达到1亿月活跃用户，Tiktok用了大约9个月，Meta的Instagram用了约2.5年，而美国人工智能公司OpenAI推出的人工智能聊天程序ChatGPT仅用了两个月。

参数规模已达千亿级别

从GPT-1（1.17亿参数）、GPT2（15亿参数）、GPT- 3（1750亿参数）、InstructGPT到ChatGPT，模型的参数规模已从最初的几亿快速增长为千亿。其中，InstructGPT是经过微调的GPT-3，参数量与GPT-3模型相当，能够尽可能减少不真实和有偏差的输出结果。ChatGPT是InstructGPT的姐妹模型，在训练过程中加入了基于人类反馈的强化学习，使得模型能产生更加近似人类的回复内容。

不具备思考判断能力

ChatGPT是通过对大量数据进行训练得到的，由于其不具备独立思考和判断能力，好的坏的通通都学，如果训练数据存在偏见，那么其输出结果也会保留这种偏见。

来源：人民邮电报

来源网址：https://www.cnii.com.cn/gxxww/rmydb/202302/t20230223_449069.html