Azure Translator:透過自適應資料集與少樣本學習提升翻譯品質
官方公告表示,Azure Translator近期推出自適應翻譯功能,旨在改善領域特定語言的翻譯品質。傳統通用型大型語言模型在處理醫療或法律文件等專業術語時常有不足,例如將「La médica」誤譯為「El médico」。此新功能允許用戶透過Microsoft Foundry的Translator playground,上傳少量高品質的源語言和目標語言句子對,創建自適應資料集或使用參考翻譯對,從而教導模型自定義術語,無需進行模型訓練。官方發布的工作流程包括:開啟Translator模型體驗、選擇語言和部署、進行基線翻譯測試、添加自適應資料集後比較輸出。實測模式建議用戶先運行基線翻譯評估默認行為,再測試少樣本翻譯或自適應資料集,並比較結果的準確性、流暢性和術語一致性。完成評估後,可通過Translate API中的adaptiveDatasetId或referenceTextPairs參數,將相同配置應用到應用程式中。此功能支持最多10,000個段落對,並提供指南如保持句子對齊、移除重複翻譯等,以確保實驗可靠性。
來源:官方公告