學習構建實用代理系統
研究論文提出,自動設計和優化基於大型語言模型的代理系統雖然能提升結果品質,但生產系統更關注簡潔性、可控性和推論成本的可預測性。論文描述了一個代理框架,設計者可以通過定義「偽工具」來強制模塊化,這些偽工具在受限上下文中遞迴調用大型語言模型。使用這個框架,作者手動工程化代理處理多樣任務,並表明相對於動態規劃的工作流,手動構建的固定工作流通常更便宜且更準確。此外,論文提出新穎的學習方法來優化框架所需的代理組件,如偽工具和固定工作流,這些學習方法通常優於手動工程化的代理。最後,論文利用框架的模塊化特性應用多目標優化方法,以共同優化成本和回應品質,並融合多個學習系統的結果。
來源
來源:網頁來源