火爆全网的ChatGPT是怎么一回事?

ChatGPT一经发布，热度持续走高，短短几天的时间，注册用户就超过100万，公开数据显示，截至2023年1月末，ChatGPT的月活用户已经突破1亿，成为史上用户增长速度最快的消费级应用程序。它不仅受到各类媒体论坛的关注，更是引领了全球的科技风向，一些公司正在提速相关步伐。

那么ChatGPT究竟是什么，它可以用来干什么？

背后依托的技术是什么？

针对这些问题，本文将会简单进行介绍。

01.

ChatGPT简介

2022年11月30日，美国人工智能公司OpenAI推出一款专注于对话的语言模型ChatGPT，它使用了GPT-3神经网络模型架构，会对用户的输入内容进行语义解析，根据解析出的用户意图，生成对应的回复来实现与人类的对话交互，这个回复可以很简短，也可以长篇大论，并且回复的文本能够在一定程度上模拟人类的语言风格。

ChatGPT官网中将它描述为优化对话的语言模型，是InstructGPT的兄弟模型，能够提供以下能力：基于上下文语义的多轮对话，勇于承认错误，敢于质疑不正确的问题和拒绝不适当的请求、输入等，上述这些能力极大地提高了互动场景中用户的体验感。

它彷佛有上知天文下知地理的能力，在一些聊天场景中，几乎能做到与人类无异的基于上下文语义的互动与交流。除了聊天以外，它还提供了丰富的写诗、编码、撰写邮件、翻译、撰写商业计划书、撰写简历、行业分析等任务，它几乎“无所不能”。

02.

ChatGPT的技术依托

ChatGPT的出现并不是一蹴而就的，其背后依托OpenAI公司的一系列生成式预训练模型，即GPT（Generative Pre-Trained Transformer），GPT系列目前已有GPT-1，GPT-2，GPT-3等模型，目前因强大的对话能力火出圈的ChatGPT正是基于GPT-3预训练模型发展而来的。

OpenAI公司因推出GPT系列自然语言模型而出名，受到模型越复杂，效果越好的影响，每一代模型的参数量都呈现出爆发式的增长，相应地，训练数据量也大幅上升。

模型	参数量	训练数据量	发布时间
GPT-1	1.17亿	5GB	2018.06
GPT-2	15亿	40G	2019.02
GPT-3	1750亿	45TB	2020.05

由于模型越大，人类对其越不好控制，即不能从本质上更好地遵循用户的意图，例如，大模型可能会生成不真实的、有毒的或对用户没有帮助的输出，因此，InstructGPT在GPT-3的基础上应用基于人类反馈的强化学习进行微调，使输出更具真实性和无害性。ChatGPT沿用了InstructGPT的模式，但数据收集设置方式有所不同且数据大了几个量级，并加入了更多人工监督方式进行微调，包括减少有毒害、欺诈性的训练输入等，以防ChatGPT误入歧途，ChatGPT能够更好地理解文本，并生成更符合人类预期的文本。

很显然，ChatGPT的出现经历了一个模型不断迭代、技术不断累积、经验不断丰富的过程。

03.

ChatGPT的优势与不足

ChatGPT从本质上来说，是一个目前流行的预训练大模型，巨大体量的参数规模和庞大到让人无法想象的多样化训练数据，使得ChatGPT见多识广，博学多才，能轻松应对用户的各种输入，并且对一些恶意、歧视等的输入能自动过滤，并给出反馈，堪称完美。

另一方面，从客观上来说，ChatGPT也存在一些短板，比如对一些事实性的问题缺乏判别，甚至会头头是道的“胡诌”；对一些需要逻辑推理的问题，像一道小学应用题，会给出看似合理实则错误的推理过程；对一些主观性的问题，会存在一定的模板制式，以保证客观和安全的立场，目前ChatGPT的回答标准参差不齐，其置信度还有待考察。同时，ChatGPT主要依赖的知识库是离线数据，缺乏新数据，限制了其提供新信息的能力。

但是，整体来看，ChatGPT给我们带来的更多是惊喜与震撼，它搅动了整个科技圈的“一江春水”，巨头科技公司纷纷宣称产品布局，在AI赛道上猛追紧赶，ChatGPT究竟能给我们的工作和生活带来哪些改变，让我们共同拭目以待。