Skip to content

為何選擇 Agent Starter Pack?

許多開發人員能迅速建立初步的生成式AI代理程式原型——建立一個基本的聊天機器人或RAG系統感覺很直接。 然而,從原型到穩健、可靠、可供生產使用的代理程式,過程會面臨重大挑戰。

生產部署的差距:數據分析

讓我們看看部署生成式AI代理程式的實際情況:

  • 3 個月: 連我們這些經驗豐富的 GCP 開發人員,將一個虛擬生成式AI代理程式帶到可供生產使用的狀態,也耗費了這麼多時間。
  • 3-9 個月: 我們觀察到開發人員將實際生成式AI代理程式投入生產的典型時間範圍(這還不包括最終被放棄的專案)。

為什麼需要這麼多的時間投入?

「最後一哩路」的挑戰

根據我們的經驗以及開發人員的回饋,真正的挑戰不在於初期的AI實驗,而是在於滿足生產部署的全面要求——這「最後一哩路」最終才能帶來商業價值:

why_starter_pack

  1. 客製化與整合:

    • 商業邏輯: 根據特定的業務需求和流程調整代理程式的行為。
    • 資料基礎: 安全地將代理程式連接到相關、高品質且即時的公司資料。
    • 安全性與合規性: 實施穩健的資料隱私控制、存取管理以及針對對抗性攻擊的防護措施。
  2. 嚴謹評估:

    • 效能測量: 定義指標並系統地評估代理程式的品質、準確性和安全性,其上線前。
    • 資料集生成: 通常需要建立合成或策展的資料集,以便進行徹底的評估和微調。
  3. 部署與營運 (MLOps/LLMOps):

    • 基礎設施: 建構可延展、具備韌性且具成本效益的雲端基礎設施來託管代理程式。
    • CI/CD 與測試: 建立自動化管線,以實現持續整合、交付、全面測試(單元測試、整合測試、負載測試),並支援快速疊代和安全回溯。
    • 使用者介面整合: 將代理程式無縫嵌入到面向使用者的應用程式中,以提供一致的體驗。
  4. 可觀察性與監控:

    • 效能監控: 即時追蹤代理程式的運行狀況、延遲和資源消耗。
    • 資料收集: 擷取使用者互動和代理程式回應,以便進行持續監控、評估和微調。
    • 使用者回饋: 實施機制來收集和處理使用者回饋,以實現持續改進。

Agent Starter Pack 彌補差距

我們意識到這些常見且耗時的困難,因此建立了 Agent Starter Pack

核心理念很簡單:您專注於核心代理程式程式碼——定義您的特定AI應用程式的獨特邏輯、提示和工具——而我們提供範本基礎,涵蓋在生產環境中可靠運行所需的一切。

why_starter_pack

想像一下:

  • 您的重心(核心代理程式):

    • 提示和 LLM 互動
    • 商業邏輯整合
    • 代理程式編排 (LangGraph, CrewAI, Google ADK)
    • 工具和資料來源定義
  • 我們的基礎(入門套件範本):

    • 部署與營運: API 伺服器、服務選項、CI/CD 管線、IaC、測試
    • 可觀察性: 日誌記錄、追蹤和監控儀表板
    • 評估: Vertex AI Evaluation 整合
    • 資料與使用者介面: 儲存連線、向量資料庫、使用者介面展示環境
    • 安全性: GCP 安全性最佳實務

Agent Starter Pack 如何提供幫助:

prototype_to_prod

  • 利用生產模式加速設定: 透過基於常見 Google Cloud 實務的 API 服務、CI/CD 和可觀察性的預建元件,搶佔先機,節省大量設定時間。
  • 專注於核心代理程式邏輯: 減少花費在基礎設施和 MLOps 上的時間,讓您的團隊更專注於精煉代理程式獨特的提示詞、工具和功能。

以 Apache 2.0 授權條款釋出。