研究06/01 12:08

GraphARC：基於圖形的抽象推理基準測試

研究論文提出 GraphARC，這是一個專門用於圖形結構數據的抽象推理基準測試。該基準測試擴展了抽象與推理語料庫（ARC）的少樣本轉換學習範式，每個任務要求從少數輸入輸出對中推斷轉換規則，並將其應用於新的測試圖形，涵蓋局部、全局和層次化的圖形轉換。與基於網格的 ARC 不同，GraphARC 實例可以在多樣化的圖形家族和大小中大規模生成，從而系統性地評估模型的泛化能力。論文評估了最先進的語言模型在 GraphARC 上的表現，發現模型在回答圖形性質問題時表現尚可，但在解決完整的圖形轉換任務時常失敗，揭示了理解與執行之間的差距。性能在較大實例上進一步下降，暴露出擴展障礙。更廣泛地說，通過結合節點分類、鏈接預測和圖形生成等面向，GraphARC 為未來的圖形基礎模型提供了一個有前景的測試平台。

來源

來源：網頁來源

網頁來源GraphARC: A Comprehensive Benchmark for Graph-Based Abstract Reasoning