ChatGPT一经发布,热度持续走高,短短几天的时间,注册用户就超过100万,公开数据显示,截至2023年1月末,ChatGPT的月活用户已经突破1亿,成为史上用户增长速度最快的消费级应用程序。它不仅受到各类媒体论坛的关注,更是引领了全球的科技风向,一些公司正在提速相关步伐。
那么ChatGPT究竟是什么,它可以用来干什么?
背后依托的技术是什么?
针对这些问题,本文将会简单进行介绍。
2022年11月30日,美国人工智能公司OpenAI推出一款专注于对话的语言模型ChatGPT,它使用了GPT-3神经网络模型架构,会对用户的输入内容进行语义解析,根据解析出的用户意图,生成对应的回复来实现与人类的对话交互,这个回复可以很简短,也可以长篇大论,并且回复的文本能够在一定程度上模拟人类的语言风格。
ChatGPT官网中将它描述为优化对话的语言模型,是InstructGPT的兄弟模型,能够提供以下能力:基于上下文语义的多轮对话,勇于承认错误,敢于质疑不正确的问题和拒绝不适当的请求、输入等,上述这些能力极大地提高了互动场景中用户的体验感。
它彷佛有上知天文下知地理的能力,在一些聊天场景中,几乎能做到与人类无异的基于上下文语义的互动与交流。除了聊天以外,它还提供了丰富的写诗、编码、撰写邮件、翻译、撰写商业计划书、撰写简历、行业分析等任务,它几乎“无所不能”。
ChatGPT的出现并不是一蹴而就的,其背后依托OpenAI公司的一系列生成式预训练模型,即GPT(Generative Pre-Trained Transformer),GPT系列目前已有GPT-1,GPT-2,GPT-3等模型,目前因强大的对话能力火出圈的ChatGPT正是基于GPT-3预训练模型发展而来的。
OpenAI公司因推出GPT系列自然语言模型而出名,受到模型越复杂,效果越好的影响,每一代模型的参数量都呈现出爆发式的增长,相应地,训练数据量也大幅上升。
模型 |
参数量 |
训练数据量 |
发布时间 |
GPT-1 |
1.17亿 |
5GB |
2018.06 |
GPT-2 |
15亿 |
40G |
2019.02 |
GPT-3 |
1750亿 |
45TB |
2020.05 |
由于模型越大,人类对其越不好控制,即不能从本质上更好地遵循用户的意图,例如,大模型可能会生成不真实的、有毒的或对用户没有帮助的输出,因此,InstructGPT在GPT-3的基础上应用基于人类反馈的强化学习进行微调,使输出更具真实性和无害性。ChatGPT沿用了InstructGPT的模式,但数据收集设置方式有所不同且数据大了几个量级,并加入了更多人工监督方式进行微调,包括减少有毒害、欺诈性的训练输入等,以防ChatGPT误入歧途,ChatGPT能够更好地理解文本,并生成更符合人类预期的文本。
很显然,ChatGPT的出现经历了一个模型不断迭代、技术不断累积、经验不断丰富的过程。
ChatGPT从本质上来说,是一个目前流行的预训练大模型,巨大体量的参数规模和庞大到让人无法想象的多样化训练数据,使得ChatGPT见多识广,博学多才,能轻松应对用户的各种输入,并且对一些恶意、歧视等的输入能自动过滤,并给出反馈,堪称完美。
另一方面,从客观上来说,ChatGPT也存在一些短板,比如对一些事实性的问题缺乏判别,甚至会头头是道的“胡诌”;对一些需要逻辑推理的问题,像一道小学应用题,会给出看似合理实则错误的推理过程;对一些主观性的问题,会存在一定的模板制式,以保证客观和安全的立场,目前ChatGPT的回答标准参差不齐,其置信度还有待考察。同时,ChatGPT主要依赖的知识库是离线数据,缺乏新数据,限制了其提供新信息的能力。
但是,整体来看,ChatGPT给我们带来的更多是惊喜与震撼,它搅动了整个科技圈的“一江春水”,巨头科技公司纷纷宣称产品布局,在AI赛道上猛追紧赶,ChatGPT究竟能给我们的工作和生活带来哪些改变,让我们共同拭目以待。
文章作者:叶秋萍
排版设计:王蔚棋
手绘插画:岳 媛
求分享
求点赞
求在看
原创文章,作者:EBCloud,如若转载,请注明出处:https://www.sudun.com/ask/33723.html