《 AI Agent 的思考 》
一、AI Agent是什麼? AI Agent應該具備哪些能力?
AI Agent可以像人類發想計畫那樣制定步驟,運用「思維鏈」(Chain of Thoughts)與「思維樹」(Tree of Thoughts)等技術,將接收到的任務拆解成一連串子目標(subgoals),進而更有效率地管理、追蹤任務執行的進度。
在任務結束之後,AI Agent可以透過ReAct、Reflexion等反思機制,以及「事後反思鏈」(Chain of Hindsight)等架構,回顧與評估自身行動,藉此讓AI Agent從實際經驗中學習,避免重蹈覆轍,同時改善表現,提升行動品質。
鏈奇國際創辦人何建幟補充,他認為AI Agent應該具備三種基本能力:感知、思考與行動。
- AI Agent 之所以能夠自主運作,關鍵在於它具備感知世界的能力,也就是能即時掌握外部環境的變化與資訊,理解自己所處的位置與情境。
- 接著,透過思考能力,AI Agent可以根據蒐集到的資訊制定計畫,提升決策的精準度與有效性。
- 當計畫形成後,AI Agent不能只是坐而言,唯有起身行動,才能替人類代勞。把思考轉化為具體執行的行動能力,是讓任務真正實現的關鍵。這三大能力相輔相成,構成AI Agent完整運作框架。
2023年,Lillian Weng撰寫文章時AI Agent,還停留在概念,至2025年AI Agent已經成為現實。
AIAgent具備規劃能力、擁有記憶力、可以使用工具,因此能夠展開行動。
2024年,聯發科技人工智慧暨數據工程處副處長楊建洲表示,AI Agent應該具備個人化(personalization)、主動性(pro-active)、互動適應性(adaptive interaction)、自主學習(learning)以及任務管理(task management)等能力。總結來說,AI Agent能夠接受任務、調整任務、執行任務再到回報任務,才算合格。
以達哥團隊來說,會預先定義好「Agentic Workflow」(代理工作流程),讓AI Agent能夠知道自己要執行哪些任務。
二、AI Agent可以做甚麼?
量變帶來質變,隨著LLM能夠記起的內容變得更多,AI Agent的開發者便可以準備更加詳盡的例子讓LLM參照。有記憶力加持,面對陌生情況有足夠的範例可以看,「它會有樣學樣,把收到的任務做拆解,」這也是AI Agent規劃技巧進步的原因之一。
另外,AI Agent具備反思能力,能夠「從做中學」,一般做法是在原先行動的LLM角色以外,增加負責觀察並提供回饋的LLM角色,或者直接評估,又或者引入外部資訊檢查,讓它能夠審視LLM採取的行動,藉此改進。
|
AI Model與AI
Agent對比
|
|
項目
|
模型
|
Agent
|
|
知識
|
知識有截止日期(cutoff date), 僅具備 訓練資料中的知識。
|
可以利用外部搜尋工具,擴展知識的範圍。
|
|
脈絡
|
以單次查詢回應為主, 除非在指令中特別提醒, 否則無法「想起」先前對話內容。
|
能夠記錄並管理多輪對話的歷史,因此對話時較能掌握脈絡。
|
|
工具
|
無法調用工具。
|
能夠調用工具。
|
|
推理
|
使用者僅能盡量利用提示工程 (prompt engineering)技巧引導。
|
可以調用ReAct等推理框架。
|
|
資料來源:受訪者、Google 2025年AI Agent白皮書。整理:曾子軒。2025/01更新。
|
|
AI Agent的工具使用功能可以做哪些事?
|
|
項目
|
調用API
|
函數
|
資料
|
|
目的
|
使用他人已經開發好的 第三方服務或者取用資料。
|
處理開發者自訂的複雜 計算,或者企業內部業務 邏輯。
|
檢索(模型)外部資料, 藉此得到更精準與即時的 資訊。
|
|
注意事項
|
確保API訪問權限與速率限制。 若AI Agent調用太多API,可能因為回應延遲影響使用者體驗,甚至因為過度依賴外部API增加風險。
|
考慮函數執行的效率、順序與容錯能力,確保每個函數的輸出可正確被後續步驟使用,並妥善處理異常情況。
|
資料需經預先處理與索引,確保結構化數據的準確性;對非結構化資料需增加解析效率並保障隱私。
|
|
實例
|
- 調用地圖API獲取位置
- 調用翻譯API進行語言 轉換
- 調用支付API完成交易
|
- 驗證用戶輸入後進行條件 計算
- 在一個函數中轉換資料 格式後傳遞給下個函數 處理
- 人工審查後大量生成報表
|
-從PDF中抽取簽約者的 個人資料
- 從關聯資料庫中檢索銷售 情況
- 抓取HTML文件中特定 標籤的內容
|
|
資料來源:受訪者。整理:曾子軒。2025/01更新。
|
三、與AI Agent的互動 (「AI代理工作流程」(AI Agentic Workflow))?
其實,就是AI Agent接受人類指派工作後,起身行動的過程,例如:分拆指令、規劃、使用工具等。
以零售業為例,零售業一直存在「人怎麼跟商品配對」的基本問題,AI 能解決的,也不會跳脫這個領域;但現在可以用消費者端、銷售端,Engine 跟 Agent 描繪出四種零售業的 AI 應用場景。
AI Agent運用在零售業中,能夠扮演AI店員與店長的角色。
《2024生成式AI年會》
https://www.inside.com.tw/feature/2024-generative-ai-week/35129-2024-generative-ai-conference
《2024生成式AI年會》
《2024年 Google Cloud零售產業AI應用研討會》
《2025 零售高峰會|AI驅動零售新體驗》
進入零售業經營者最關心的核心問題只有一個:AI 能為我解決什麼真正的問題?
售業的演進脈絡:
- 過去,品牌面對消費者,是靠店員面對消費者做銷售;
- 在電商的場景,官網、APP、LINE 成為新的貨架,消費者透過點擊與滑動完成購物;
- 而進入AI的場景中,「Agent」將逐漸成為新的品牌溝通介面,出現在消費者與品牌之間,甚至也嵌入在消費者手中的數位助理之中。
在AI的場景中,「Agent」將逐漸成為新的品牌溝通介面,出現在消費者與品牌之間,甚至也嵌入在消費者手中的數位助理之中。
「新零售業的工作日常」:
由人腦(策略)+ 電腦(規則)+ AI(智慧執行)協作,將營運效率提升10倍以上。
1. AI Agent 第一個價值:解決品牌內部最痛苦的營運難題
零售業的營運瓶頸,常從一個「商品上架」開始。
|
零售產業
|
與消費者的互動方式
|
溝通介面
|
|
實體門市
|
由店員一對一銷售
|
體驗由人與人面對面建立。
|
|
電商平台
|
消費者自主點選、線上購物
|
官網、APP、LINE 等數位通路。
|
|
AI 零售
|
由 AI 代理與消費者即時互動
|
對話介面整合客服、導購功能。
|
AI Agent 導入前後的營運流程比較
|
項目
|
未導入 AI 前
|
導入 AI Agent 後
|
|
商品上架
|
手動填寫 15,000 格欄位
|
AI 填寫 90% 自動化
|
|
行銷活動
|
後台設定繁瑣、格式複雜
|
一句話用 AI 自動生成設定
|
https://www.blogger.com/blog/post/edit/6769464927463184927/8921693140514589423 《2025 零售高峰會|AI驅動零售新體驗》
2.AI Agent 第二個價值:對話式的消費體驗
當內部效率提升後,AI 的力量便能延伸至第一線,重新定義品牌與消費者互動的每一個節點。
|
項目
|
未導入 AI 前
|
導入 AI Agent 後
|
|
客服回應
|
人工處理,回覆速度不一
|
AI
Agent 即時回覆、導流或發券
|
|
系統負擔
|
高人力投入、高出錯率
|
精簡人力,轉為價值型工作
|
|
消費者體驗
|
跳轉頁面、等候人工客服
|
對話式即時解答、推薦商品
|
3.迎接 AI Agent:為下一個零售入口做好準備
消費者手上,也開始有了自己的 Agent。
https://www.blogger.com/blog/post/edit/6769464927463184927/8921693140514589423
《2025 零售高峰會|AI驅動零售新體驗》
4.品牌致勝的三大關鍵:擴增 AI 員工、打造 AI 服務、迎接 AI 助理
AI 究竟能為零售業帶來什麼改變?答案是:降本增效、提升體驗、搶佔新入口。
https://www.blogger.com/blog/post/edit/6769464927463184927/8921693140514589423
《2025 零售高峰會|AI驅動零售新體驗》
四、AI Agent的市場發展趨勢
以目前技術發展來看,AI Agent善於處理非結構化問題(unstructured problem),又能夠生成多樣內容,正好適合需要面對一定陌生、但任務又侷限在一定範圍的客服任務。
AI代理能夠對應的領域恰好處於中間,有未知程度,但並非全然不可預測。
AI工作系統就像是一個會回應的有機體:
- 流動性:流程會因應目標與情境而動態地產生。
- 隱含式:工作流程是從數據模式和使用者意圖推演而出。
- 調適力:系統能夠從例外情況中學習,並持續改進流程。
- 以使用者為中心:介面仰賴自然語言或其他直覺式操作方式。