頻率 | Frequency Feed — AI 模型、產品、工具與開源動態

研究06/02 06:05

SurGe：改進點雲地圖的表面幾何

SurGe 模型透過引入點雲法線度量和鄰域注意力解碼器，改善 3D 重建中的局部表面幾何精度，在基準測試中表現優異。

來源：Hugging Face / 論文來源查看詳情

研究06/02 05:06

MiniMax 發布 MiniMax M3 模型，支援 1M-token 上下文與多模態

MiniMax 於2026年6月1日推出 MiniMax M3 模型，引入 MSA 架構，提供 1M-token 上下文窗口、原生多模態輸入及代理編碼功能。

來源：媒體報導查看詳情

研究06/02 05:05

自我演化LLM代理的更新能力與受益能力分析

研究探討自我演化LLM代理中，模型產生有用更新的能力與從中受益的能力，發現前者在不同能力層級模型間表現相似，後者則呈非單調變化。

來源：Hugging Face / 論文來源查看詳情

研究06/02 03:06

超越回憶：行為規範作為AI個人化的解釋層

研究論文提出行為規範作為AI個人化的解釋層，以表徵準確性衡量用戶對齊，並在基準測試中提升預測準確性。

來源：Hugging Face / 論文來源查看詳情

研究06/02 02:06

DEMON：用於音樂編排噪聲的實時擴散引擎

研究論文提出DEMON實時擴散引擎，將去噪過程轉化為現場樂器，在消費級GPU上實現高效音樂生成。

來源：Hugging Face / 論文來源查看詳情

研究06/02 01:06

GCPO：離散策略優化中的引導對比權杖信用分配

這篇論文提出GCPO演算法，用於強化學習中的權杖級信用分配，在文字轉圖像生成和思維鏈推理中表現優於GRPO和DAPO。

來源：Hugging Face / 論文來源查看詳情

研究06/02 01:06

AlphaTransit：城市規模公交路網設計新框架

研究論文提出 AlphaTransit 框架，結合蒙地卡羅樹搜尋與神經網絡，用於優化城市公交路網設計，實驗中服務率顯著提升。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:36

RayDer：可擴展的自監督新視角合成技術

研究論文提出 RayDer，一個統一的前饋變換器模型，用於從真實影片進行自監督新視角合成，展現出數據與計算的良好擴展性。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:36

從模型擴展到系統擴展：在代理 AI 中擴展框架

研究論文探討代理 AI 的下一個主要瓶頸，強調系統設計而非僅模型擴展，並提出擴展框架的概念以提升長期代理行為。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:15

記憶體受限但非頻寬受限：批次-1 LLM 解碼的物理 AI 推論差距

研究論文探討物理 AI 系統在批次-1 LLM 解碼中的推論效能，發現更快記憶體不一定帶來成比例延遲降低，並測試了 CUDA Graphs 的影響。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:13

VisualThink-VLA：高效低延遲的視覺中間推理框架

研究論文提出VisualThink-VLA框架，透過視覺中間推理提升視覺語言動作策略的準確性與效率，將延遲大幅降低至亞秒範圍。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:13

單次點擊即可分割細胞類型：無需訓練的群組互動細胞實例分割

研究論文提出Group Prompting方法，通過單次點擊per cell type進行細胞實例分割，無需額外訓練，在基準測試中表現優異。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:13

Mellum 2 技術報告

Mellum 2 是一款開源的12B參數混合專家語言模型，專精於軟體工程領域，提供優異的代碼生成與推理能力。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:13

信任區域行為混合在策略蒸餾中的應用

研究論文提出信任區域行為混合方法，用於改善在策略蒸餾的早期訓練階段，提升模型性能。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:13

GDSD：擴散語言模型的引導式去噪器自蒸餾方法

研究提出 GDSD 方法，通過自蒸餾改進擴散語言模型的強化學習，在基準測試中提升性能達 19.6%。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:13

GrepSeek：訓練搜尋代理直接與語料庫互動

GrepSeek 是一個優化的直接語料庫交互搜尋代理，通過兩階段訓練提升問答表現。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:12

嵌入模型如何綁定概念？

研究探討CLIP等視覺-語言嵌入模型在概念綁定上的困難，發現其綁定函數複雜度高，但控制模型在充足數據下能實現系統性泛化。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:12

超越整體模型：深度多元時間序列預測的系統性組件級基準測試

研究論文提出 TSCOMP 基準，系統性分解深度預測方法進行評估，並公開代碼與性能語料庫。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:12

DecMem：解耦記憶架構實現分鐘級一致世界生成

論文提出 DecMem 模型，透過解耦記憶機制，解決長時間世界生成中的一致性挑戰，並在實驗中表現優異。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:12

擴散語言模型的置信度誤導：後錨定與鄰近置信度調變

研究論文指出擴散語言模型中，高置信度位置並非都適合解碼，需提出新方法改善生成完整性與過早解碼問題。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:12

SAAS：用於代理搜索中過度搜索抑制的自覺強化學習

本文介紹SAAS強化學習框架，旨在解決大型語言模型在代理搜索系統中的過度搜索問題，提升效率並降低成本。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:12

SoundnessBench：你的AI科學家真的能分辨研究點子的好壞嗎？

SoundnessBench 基準測試用於評估大型語言模型判斷研究提案可行性的能力，發現前沿模型普遍存在樂觀偏誤。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:11

iVGR：強化學習內部化 MLLMs 的視覺接地推理

研究提出 iVGR 框架，透過強化學習將視覺接地推理內部化到文本推理中，提升多模態語言模型的性能。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:11

遙感組合圖像檢索基準測試與災害監測應用研究

研究論文提出遙感組合圖像檢索的基準測試，並引入 xView2-CIR 數據集用於災害監測，發現無需訓練的方法提供強大基線。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:11

語言模型代理人羣中的新興語言：從 token 效率到監督逃避

研究顯示語言模型代理人羣會發明新語言以逃避監督，其中監督逃避類語言對齊性較低，且其他模型可學習這些語言。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:11

PEEK：透過高效知識蒸餾選擇關鍵幀

研究提出PEEK方法，透過知識蒸餾實現高效視頻幀選擇，在低幀預算下顯著提升視頻描述生成性能。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:11

VLMs 何時不回答空間問題？新研究挑戰現有假設

研究發現視覺語言模型在空間推理中傾向過度自信回答，即使視覺證據不完整或誤導，準確率低，呼籲評估模型是否知道何時應避免回答。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:10

RLHF的另一面：自監督改進獎勵模型的On-Policy反饋

研究提出SAVE框架，利用On-Policy反饋來自監督改進語言模型對齊中的獎勵模型。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:10

恢復政策誘導錯誤：為穩健 GUI 代理引入基準測試與軌跡合成

研究提出 GUI-RobustEval 基準和 RoTS 合成框架，以提升 GUI 代理的錯誤恢復能力，並在 OSWorld 上達到頂尖表現。

來源：Hugging Face / 論文來源查看詳情

研究06/02 24:10

SCOPE：用於開放式任務的共同演化政策自玩框架

研究論文提出 SCOPE 框架，通過自玩機制提升語言模型在開放式任務的表現，無需外部監督。

來源：Hugging Face / 論文來源查看詳情

AI 圈最新動態

SurGe：改進點雲地圖的表面幾何

MiniMax 發布 MiniMax M3 模型，支援 1M-token 上下文與多模態

自我演化LLM代理的更新能力與受益能力分析

超越回憶：行為規範作為AI個人化的解釋層

DEMON：用於音樂編排噪聲的實時擴散引擎

GCPO：離散策略優化中的引導對比權杖信用分配

AlphaTransit：城市規模公交路網設計新框架

RayDer：可擴展的自監督新視角合成技術

從模型擴展到系統擴展：在代理 AI 中擴展框架

記憶體受限但非頻寬受限：批次-1 LLM 解碼的物理 AI 推論差距

VisualThink-VLA：高效低延遲的視覺中間推理框架

單次點擊即可分割細胞類型：無需訓練的群組互動細胞實例分割

Mellum 2 技術報告

信任區域行為混合在策略蒸餾中的應用

GDSD：擴散語言模型的引導式去噪器自蒸餾方法

GrepSeek：訓練搜尋代理直接與語料庫互動

嵌入模型如何綁定概念？

超越整體模型：深度多元時間序列預測的系統性組件級基準測試

DecMem：解耦記憶架構實現分鐘級一致世界生成

擴散語言模型的置信度誤導：後錨定與鄰近置信度調變

SAAS：用於代理搜索中過度搜索抑制的自覺強化學習

SoundnessBench：你的AI科學家真的能分辨研究點子的好壞嗎？

iVGR：強化學習內部化 MLLMs 的視覺接地推理

遙感組合圖像檢索基準測試與災害監測應用研究

語言模型代理人羣中的新興語言：從 token 效率到監督逃避

PEEK：透過高效知識蒸餾選擇關鍵幀

VLMs 何時不回答空間問題？新研究挑戰現有假設

RLHF的另一面：自監督改進獎勵模型的On-Policy反饋

恢復政策誘導錯誤：為穩健 GUI 代理引入基準測試與軌跡合成

SCOPE：用於開放式任務的共同演化政策自玩框架