研究06/01 10:37

探索自主代理數據工程以實現模型專業化

研究論文提出了一個名為『自主代理數據工程』的新任務，旨在評估大型語言模型（LLMs）是否能作為自主數據工程師，執行端到端的數據策展流程以實現模型專業化。論文指出，現有的LLM數據策展方法大多依賴人類設計的工作流程，而本文則將數據視為可優化組件，研究代理如何計劃、生成和迭代優化訓練數據。實驗部分，自主LLM數據工程師展現了顯著成效，其中GPT-5.2構建的訓練課程使學生模型的性能提升了57.29%，完全通過迭代的代理驅動數據適應達成。研究不僅揭示了潛力與瓶頸，更確立了自主數據工程作為一項可衡量的能力，並為未來代理驅動的模型專業化指明了方向。此外，論文還討論了在多個領域中的實驗結果，強調了自動數據策展在提升模型適應性方面的關鍵作用。相關代碼將在GitHub上發布。

來源

來源：Hugging Face / 論文來源

Hugging Face / 論文來源Exploring Autonomous Agentic Data Engineering for Model Specialization