Chatgpt發(fā)布了GPTs,釘釘發(fā)布了AI助理,在AI時(shí)代 AI agent(智能體)是大模型落地業(yè)務(wù)場(chǎng)景的主流形式,那什么是AI Agent?
01
—
什么是AI Agent?
AI Agent是指人工智能代理(Artificial Intelligence Agent)是一種能夠感知環(huán)境進(jìn)行自主理解,進(jìn)行決策和執(zhí)行動(dòng)作的智能體。AI Agent具備通過獨(dú)立思考、調(diào)用工具逐步完成給定目標(biāo)的能力。不同于大模型的區(qū)別在于,大模型與人類的交互通過提示詞(Prompt)實(shí)現(xiàn),用戶的提示詞是否清晰明確會(huì)影響大模型的效果。而AI Agent僅需要給定一個(gè),就能夠?qū)崿F(xiàn)針對(duì)目標(biāo)進(jìn)行獨(dú)立思考并完成目標(biāo)任務(wù)。
大模型在進(jìn)行訓(xùn)練的龐大數(shù)據(jù)中包含了各種數(shù)據(jù)以及大量的人類行為數(shù)據(jù),讓大模型具備了模擬人類的交互以及隨著模型的不斷增大,大模型涌現(xiàn)出了上下文學(xué)習(xí)能力、思維鏈、推理能力等類似人類思考方式的能力。而大模型同時(shí)也存在很多的問題,如幻覺、上下文限制等問題。因此將大模型作為AI Agent的核心大腦,實(shí)現(xiàn)將復(fù)雜任務(wù)拆解成可以實(shí)現(xiàn)的子任務(wù)等能力,構(gòu)成具備自主思考決策和執(zhí)行任務(wù)的智能體。
02
—
AI Agent系統(tǒng)架構(gòu)
一個(gè)基于大模型的AI Agent系統(tǒng)可以拆分 LLM(大模型)、記憶(Memory)、任務(wù)規(guī)劃(Planning)以及工具使用(Tool) 的集合。在LLM為基礎(chǔ)的AI Agent系統(tǒng)中,大模型為AI Agent系統(tǒng)的大腦負(fù)責(zé)計(jì)算,并需要其他組件進(jìn)行輔助。
1. 規(guī)劃(Planning)
①、對(duì)需要更多步驟的復(fù)雜任務(wù),AI Agent 能夠調(diào)用LLM通過思維鏈能力進(jìn)行任務(wù)分解,在AI Agent架構(gòu)中,任務(wù)的分解和規(guī)劃是基于大模型的能力來實(shí)現(xiàn)的,大模型的思維鏈(Chain Of Thought,COT)能力通過提示模型逐步思考,將大型任務(wù)分解為較小的、可管理的子目標(biāo),以便高效的處理復(fù)雜任務(wù)。
②、通過反思和自省框架,AI Agents可以不斷提升任務(wù)規(guī)劃能力,AI Agent 可以對(duì)過去的行為進(jìn)行自我批評(píng)和反省,從錯(cuò)誤中吸取經(jīng)驗(yàn)教訓(xùn),并對(duì)未來的行動(dòng)進(jìn)行分析、總結(jié)、提煉和完善,從而提高最終結(jié)果的質(zhì)量。自省框架使AI Agent能夠修正之前的決策,從而不斷優(yōu)化。這種反思和細(xì)化可以幫助 Agents 提高自身的智能和適應(yīng)性。
2. 記憶 (Memory)
①、短期記憶:對(duì)AI Agent智能體系統(tǒng)的所有輸入會(huì)成為系統(tǒng)的短期記憶,所有上下文學(xué)習(xí)都是依賴模型的短期記憶能力進(jìn)行的。短期記憶受到有限上下文窗口長度的限制,不同的模型的上下文窗口限制不同。
②、長期記憶:AI Agent在完成目標(biāo)時(shí),需要查詢的外部向量數(shù)據(jù)庫成為系統(tǒng)的長期記憶。長期記憶使得 AI Agents 能夠長期保存和調(diào)用無限信息的能力。外部的向量數(shù)據(jù)庫可以通過快速檢索進(jìn)行訪問。AI Agent主要通過長期以及完成很多復(fù)雜任務(wù),如閱讀PDF、知識(shí)庫等。
③、向量數(shù)據(jù)庫通過將數(shù)據(jù)轉(zhuǎn)化為向量存儲(chǔ)。
3. 工具(Tools)
①、AI Agent能夠使用外部工具API拓展模型能力,以獲取大模型以外的能力和信息。如預(yù)定日程、設(shè)置待辦、查詢數(shù)據(jù)等、
②、類GPT等大模型也更新了插件的功能,能夠調(diào)用插件訪問最新信息或者特定數(shù)據(jù)源,但是需要用戶針對(duì)提問問題提前選擇需要使用的插件,無法做到自然地回答問題。AI Agent可以自動(dòng)調(diào)用工具使用,根據(jù)規(guī)劃獲取的每一步任務(wù)判斷是否需要調(diào)用外部工具來完成該任務(wù),并獲取工具API接口返回的信息給到大模型進(jìn)行下一步任務(wù)。
聯(lián)系客服