現代LLMs與人類EEG共享效價軸心:飽和規律
根據 arXiv 上的研究論文提出,現代大型語言模型(LLMs)在情緒效價方面與人類腦電圖(EEG)具有共享的軸心。論文首先僅用九個情緒誘發句子從 LLMs 建構一維效價方向(V-axis),並通過零樣本遷移驗證其有效性。隨後,研究顯示此 LLM 派生方向映射到人類神經活動中,在公共 EEG 數據集上,線性投影能追蹤每個刺激的 V-axis 位置。此外,36 個未接觸 V-axis 的 EEG 情緒分類器自發重新發現相同方向,暗示語言模型與人類電生理學出現相同效價結構。然而,這種收斂並未提供有效訓練信號;論文測試了二十五種對齊策略,均無法改善解碼,其中十六種顯著降低準確度。論文將此結果形式化為飽和規律:一旦任務標籤驅動腦解碼網路到目標方向,額外監督主要扭曲已飽和的盆地。受此啟發,研究者通過集成殘差多樣性而非監督盆地,在 FACED 數據集上將平衡準確度提高了 10.5%,並在 SEED-V 數據集上複製相同效果。
來源
來源:網頁來源