ai时代指什么,ai development

LearnPrompt.pro 2.0 更新Agent模块!九天连更!OpenAI联合创始人Andrej Karpathy在一个开发者活动上发表讲话,谈及了他和

LearnPrompt.pro 2.0 更新Agent模块!

9天持续更新!

OpenAI 联合创始人Andrej Karpathy 在一次开发者活动中发表讲话,讨论了他和OpenAI 对AI 代理的看法。他将过去开发人工智能代理的挑战与目前依靠新技术工具带来的新机遇进行了对比。 Andrej Karpathy 认为,普通人、企业家和极客在构建AI 代理方面比OpenAI 这样的公司更有优势,因为每个人都处于公平的竞争环境中。他期待着自己在这一领域取得的成就。

a8ba9547f5e449219cd419fb2a65a3b5~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717715939&x-signature=70rfrkZYXVPewMZBIFK7bWwUNCA%3D

OpenAI应用研究总监Lilian Weng也在长文中提出了Agent=LLM(大规模语言模型)+内存+规划技巧+工具使用的概念,详细解释了Agent各模块的功能。做过。她对Agent未来的应用前景充满信心,但也表示挑战无处不在。

AutoGPT、BabyAGI、MetaGPT等现有代理项目的成功证明了LLM的潜力。 LLM 不仅仅是一个文本生成工具,它还成为一个强大的通用问题解决工具。写作、讲故事、论文、项目——法学硕士拥有一切。它显示出巨大的潜力并具有解决现实问题的强大能力。

BabyAGI 的创始人中岛阳平曾说过: “自主代理的未来是每个人都是管理者。”这句话很好地概括了我们对代理的愿景。

Agent是什么?跟GPT的区别

代理可以完成推荐内容、撰写文案、回答问题等特定任务,以及帮助您完成更复杂的目标。将他们视为队友,而不仅仅是工具。您可以给代理商一些思考的机会,并给他们一些模糊的目标,例如“制作世界上最好的冰淇淋”。代理生成一个待办事项列表,并根据进度不断添加新任务,直到达到目标。

在继续之前,我们先解释一些术语。在人工智能领域,理解这些术语非常重要,以确保您理解确切的概念。

GPT=生成预训练的Transformer。为ChatGPT 等大规模语言模型(LLM) 提供支持的核心机器学习模型架构。

接下来我们就来看看什么是代理。

Agent=一个大型语言模型,可以设定一些目标或任务并迭代地执行它。这与ChatGPT 等工具中“通常”使用大规模语言模型(LLM) 的方式不同。通过ChatGPT,您可以提出问题并获得相应的答案。代理具有复杂的工作流程,允许它们与自己交互,而不需要人类控制交互的每个部分。

自主代理是由人工智能驱动的程序,在给定目标的情况下,它可以自行创建任务、完成任务、创建新任务、重新确定任务列表的优先级、完成新的顶级任务并重复直到目标为止。已完成。

ChatGPT 通过接收单个查询输入并返回输出来一次完成一项任务。然而,随着ChatGPT 插件的发布,这个限制发生了变化。模型现在可以利用外部工具一次执行最多10 个请求。这是ChatGPT 中“代理”概念的体现,因为模型可以决定是否发送额外的请求来完成任务。

对于那些还没有尝试过这个插件的人来说,基本概念是您可以告诉ChatGPT 特定外部工具的API 如何工作,并且您可以编写和运行代码,这意味着您可以根据用户查询向该API 发送请求。例如,如果您有一个天气插件,并且用户询问“纽约的温度是多少?”,该模型将认识到它无法回答该问题,并将使用用户已安装的任何可用插件来查看旅馆。假设您发送请求并且API 返回错误“纽约不是有效位置。请使用完整的城市名称而不是缩写。”该模型实际上可以读取此错误并发送新的请求来修复它。这是当今生产过程中代理工作的最简单的例子。

对于那些还没有尝试过该插件的人来说,基本概念是您可以告诉ChatGPT 特定外部工具的API 应该如何运行,并且您的模型将向该API 发出请求,这意味着您可以编写并运行您发送的代码。回答用户的疑问。例如,如果您有一个天气插件,并且用户询问“北方的温度是多少?”,模型将认识到它无法回答该问题,并将使用用户已安装的任何可用插件。假设您发送请求,但API 返回错误,指出“北不是有效位置。请使用更详细的城市名称。”该模型实际上可以读取此错误消息并发送新请求来修复它。这是在生产环境中工作的代理的最简单示例。

简化代理决策流程:

认识计划行动

感知是指智能体从环境中收集信息并从中提取相关知识的能力。规划是指智能体为实现特定目标而进行的决策过程。行动是指根据环境和计划而采取的行动。智能体从环境中收集信息并通过感知提取相关知识。然后,通过计划做出决定以实现特定目标。最后通过行动,根据环境和计划采取具体行动。策略是智能体采取行动的核心决策,行动为进一步识别提供观察前提和基础,形成自主的闭环学习过程。

Agent 图解

您可以通过可视化和示例进一步解释代理概念。代理使LLM(大规模语言模型)具有实现目标的能力,并使其能够通过自发的动机循环来实现这一目标。

交互不是线性的,而是可以是并行的(同时使用多个提示并试图解决同一目标)或单向的(没有人参与对话)。

创建代理的目标或主要任务后,此过程分为三个主要步骤:

245f70db453f493687cd15e1258623c6~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1717715939&x-signature=tKqsOyTP9ovrCG4j91F0cl8bf5E%3D

获取第一个未完成的任务,收集中间结果并将其存储在向量数据库中,创建新任务,并重置任务列表的优先级。让我们看一个具体的例子。您可以从“写一篇1500 字的关于ChatGPT 及其可以为您做什么的博客”这样的任务开始。

该模型收到此请求并执行以下步骤:

sub_tasks=openai.ChatCompletion.create(model=’gpt-4′,messages=[ {‘role’: ‘system’, ‘content’: ‘您正在创建一个世界级的系统,旨在帮助人们完成任务。I’我是你的助手’}, {‘ role’: ‘user’, ‘content’: ‘使用ChatGPT 创建1500 字的博客文章,你能做什么’}, {‘role’: ‘user’, ‘content’: ‘将上面的用户请求分解为可以轻松执行的简单子任务。’} ]) 此示例使用OpenAI API 来驱动代理。可以通过系统字段在一定程度上定义代理。接下来,添加您的用户内容。使用ChatGPT 创建1500 字的博客文章并了解其功能和后续步骤。 **将上面的用户请求分解为可以轻松执行的简单子任务。 **,您还可以基于此添加任务,并将查询简单地分解为子任务。

然后获取一个子任务,循环发送更多调用到模型,并执行所有调用,每个调用包含不同的系统消息(将子任务视为一个单独的代理。也许你擅长编写代理、学术研究等.)。

然后,您可以向模型循环发送进一步的调用来执行每个子任务。每个子任务可以包含不同的系统消息。你可以想象这些系统消息代表了不同领域的专家,比如擅长写作的人,擅长学术研究的人等等。这使得模型能够考虑并响应不同的角色,以更好地满足用户需求。

原创文章,作者:小条,如若转载,请注明出处:https://www.sudun.com/ask/80285.html

(0)
小条的头像小条
上一篇 2024年5月31日 上午7:18
下一篇 2024年5月31日 上午7:19

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注