每个人都应该写好Prompt,构建自己的AI智能体 |AI瞭望塔 (S1E12)

AI技术 Prompt设计 智能体工作流 大模型应用 AI协作
文章探讨了如何通过优化Prompt设计来构建高效的AI智能体工作流。吴恩达指出,AI智能体是AI的工具,通过设计工作流,即使是GPT-3.5也能超越GPT-4的表现。他强调,应摆脱传统的“命令-执行”模式,采用反思、使用工具、规划和多智能体协作等设计模式,以充分发挥大模型(LLM)的潜力。文章还提到,未来AI智能体将替代传统服务,用户可以通过构建个性化AI助手来提升效率。写好Prompt不仅是技术操作,更是理解人机协作关系的关键,能够帮助我们在通往通用人工智能(AGI)的旅程中迈出重要一步。
文章内容
思维导图
常见问题
社交分享

前言

AI 瞭望塔(AI Watchtower)是我们新开的一个子付费内容组。在航行的时,我会记录与分享关于AI的思考、观察、分析与见解。

1.每周花点时间思考正在做的事情,结合AI还有哪些可能性,或者是否真的用好了现有的大模型(LLM)?

2.昨晚在看吴恩达老师在红杉资本美国的一场分享会的演讲《《吴恩达:AI 智能体工作流引领人工智能新趋势》。即AI智能体的工作流可能被很多人忽略了。他提到一个很重要的观点,如果说智人区分于其他物种的能力是我们善用工具,那么对于 AI 来说,智能体就是它的工具。

吴恩达老师也分享了一个有意思的数据:你使用 GPT 3.5 进行零样本(zero-short)提示,它的正确率是 48%。GPT-4 的表现要好得多,正确率是 67%。但是如果你在 GPT 3.5 的基础上建立一个 AI 智能体的工作流,它甚至能比 GPT-4 做得更好。

意味着,如果我们基于 GPT-4 设计一个 AI 智能体的工作流,甚至可以提前到达 GPT-5 的水平。也就是说,我们不必盯着GPT-5或GPT-6什么时候发布。

3.可能很多人在使用AI时也发现以一种“命令-执行”的线性方式要求LLM输出答案,通常并不那么有效。这类的Prompt其实很常见,通常是以“请给我一篇500字的小红书爆文”的口吻输入,然后LLM输出一串幻觉严重的文章,或者是废话文学。以致很多人可能无法从LLM上解决一些问题,比如具有效果的新闻稿。然后,觉得这个大模型不可用,于是不断寻找和更换所谓可用的大模型。我在ChatGPT刚出来最开始写prompt时也翻过这样的错,其实很正常,人们对现有AI是高期望的,建立一种其能完成任何任务的能力的预设之上。

3.如何调用LLM的能力,像智能体那样工作?吴恩达老师认为,人们可以尝试“设计工作流”的智能体的方式来引导LLM进行多智能体协作。这是一个关键所在,在于人们可能需要摆脱搜索引擎式的机器工作方法:即输入“需求”,立刻要求LLM输出“结果”。回归一种数据库检索的方式,这并不是AI最擅长的地方,如果这样,可能谷歌搜索引擎更加有用和高效。这并不能发挥LLM的能力。

4.吴老师分享他构建AI智能体工作流的方式,总结了四种设计模式:反思、使用工具、规划和多智能体协作

-反思,即在初稿或需求里发现问题,然后进行反复迭代修改,直到达到效果。

-使用工具,即可以用AI调用工具(如插件)去执行任务,比如借助搜索引擎,常见的RAG 的AI产品

-规划,让 AI 自己规划解决问题的路径,去年很火的AutoGPT,则是根据用户的需求,自己规划解决步骤,然后一步一步去实现,包括调取外部的工具。

-多智能体协作:像之前我们分享的世界首个AI软件工程师「Devin」 就是一个多智能体协作的例子。比如你可以让LLM分别扮演CEO或项目总监,产品经理、开发工程师、测试等角色,你只需要告诉 LLM你现在是项目总监角色,开发工程师等,然后它们就会相互协作。

这几种模式,我回想起在写《用poe打造AI团队:Poe上优秀的AI机器人及附上实用AI工具| 《人人都可以有一个AI机器人团队》》的教程时,也采用类似的方法。比如在构建一个AI机器人时,我会先跟AI对话,围绕业务目标,拆解任务和工作流设计…大家可以回顾一下。我也抽时间重新整理这份教程,更新一下prompt。

5.LLM幻觉依然存在,GPT-4也不像以前那么坚挺(Sam说的,GPT-4现在有点挫)。Prompt则依然是重要的一环,帮助人们构建智能体来撬动LLM的能力。就像吴老师说的,智能体就是AI的工具。

6.红杉资本的分享里提到,GenAI时代,软件替代服务。未来一个AI智能体可以满足不同人从其中获得各个性的服务。同样,人们也可以自己构建属于自己的AI智能体,在一个平台上为自己创建生活、工作的“助手、代理人”。Prompt在LLM和AI Agent、用户之间架起桥梁。

题外话,红杉资本在最近一个采访时谈到​:哪里“硅”含量高,​就去哪里投资。

7.写好Prompt,吴老师已经给了可行性方式,我觉得都可以尝试去写prompt,然后用低成本的ChatGPT 3.5或Kimi等LLM来试验。从解决具体的,一个问题开始,调试和迭代,直到它可以真正给你很好地完成任务。不过,在AI执行任务过程中,可以尝试给多点耐心和时间给它输出,就像给新任经理人的耐心一样。

8.每个人都应写好Prompt,来构建AI智能体。看似一个执行的动作,这也是一个真正理解人(需求)——LLM——智能体之间的协作关系的方式,包括人机对话的思维和方式(你是用一种命令式的呢?还是一种探索式,协作式或引导式等等),尝试过可能更深刻理解AI,也可能打开一个未曾到达过的世界。

9.如果需要,我把此前搭建的AI 机器人(阅读助手、小红书SEO助手、封面插图等AI机器人)重新梳理,包括Prompt的写法和模板…

10.很喜欢吴恩达老师在分享时结尾说的,**通向通用人工智能的道路更像是一段旅程,而不是一个目的地,但我认为这种智能体工作流可能帮助我们在这个非常长的旅程上迈出一小步。**所以也不必每日抬头追随通往AGI之路。

(原视频:https://www.youtube.com/watch?v=sal78ACtGTc

往期阅读

浅谈Poe从工具到平台 |AI瞭望塔(S1E01)

GPTs在编织OpenAI的供应链网 |AI瞭望塔(S1E02)

GPT在品牌化 |AI瞭望塔(S1E03)

AI 产品需要品牌,因为人在用|AI瞭望塔(S1E04)

Poe获得7500万美金新融资,加速打造AI机器人供应链平台 | AI瞭望塔(S1E05)

AI+硬件是趋势,人可以选不是AI产品的其它最优解|AI瞭望塔(S1E6)

那些赞许你AI产品的声音,可能并不是你的用户|AI瞭望塔(S1E7)

Sora:AI 真正理解和模拟人类世界,应用广泛,不只是视频创作|AI瞭望塔(S1E8)

谷歌的AI产品名字真的很糟糕:混乱的品牌战略|AI瞭望塔(S1E9)

谈谈AI公司和产品的品牌策略 |AI瞭望塔(S1E10)

每个大模型都有自己的信众,每个大模型都有光明的未来|AI瞭望塔(S1E11)

思维导图生成中,请稍候...

问题 1: 为什么写好Prompt对构建AI智能体如此重要?
回答: 写好Prompt是构建AI智能体的关键,因为它能有效引导大语言模型(LLM)发挥其能力,通过设计工作流和多智能体协作,提升任务执行的准确性和效率,甚至超越更高版本的模型表现。

问题 2: 什么是AI智能体工作流?
回答: AI智能体工作流是一种通过设计任务流程,引导LLM以多智能体协作的方式完成任务的方法,包括反思、使用工具、规划和多智能体协作四种模式。

问题 3: 如何通过Prompt提升GPT-3.5的表现?
回答: 通过构建AI智能体工作流,GPT-3.5的表现可以显著提升,甚至超过GPT-4的零样本提示正确率,达到更高的任务完成效果。

问题 4: 在AI智能体工作流中,“多智能体协作”是什么意思?
回答: 多智能体协作是指让LLM扮演不同角色(如CEO、开发工程师等),通过角色间的协作完成任务,类似于团队合作的方式。

问题 5: 为什么“命令-执行”式的Prompt效果不佳?
回答: “命令-执行”式的Prompt通常会导致LLM输出幻觉严重或无效的内容,因为它未能充分发挥LLM的能力,缺乏任务分解和迭代优化的过程。

问题 6: 如何开始构建自己的AI智能体?
回答: 可以从写好Prompt开始,结合低成本的LLM(如ChatGPT 3.5或Kimi),针对具体问题调试和迭代,逐步构建高效的AI智能体工作流。

问题 7: 吴恩达提到的四种AI智能体设计模式是什么?
回答: 四种设计模式包括反思(迭代优化)、使用工具(调用插件或外部工具)、规划(让AI自主规划任务路径)和多智能体协作(角色分工合作)。

问题 8: 为什么说AI智能体是AI的工具?
回答: AI智能体通过工作流设计和多智能体协作,帮助LLM更好地完成任务,类似于人类使用工具提升效率的方式,因此被称为AI的工具。

问题 9: 在GenAI时代,软件如何替代服务?
回答: 在GenAI时代,AI智能体可以满足不同用户的个性化需求,提供定制化的服务,从而替代传统的软件服务模式。

问题 10: 如何理解通向通用人工智能(AGI)的旅程?
回答: 通向AGI的道路是一个长期的过程,AI智能体工作流是这一旅程中的一小步,帮助我们在实现通用人工智能的道路上不断前进。