資源受限自適應序貫定價推斷
研究論文提出,資源受限的定價控制器在推斷固定價格時可能面臨困難,因為控制器的資源狀態可能將目標價格鄰域排除在可行集之外,即使每個實現的動作都具有已知的正密度。論文通過局部非識別結果和實現的資訊時鐘來形式化這種支持排除失敗。隨後,設計了一個目標感知定價控制器,該控制器能驗證可行的目標頻段並記錄連續局部密度。局部去偏差化產生學生化區間,其寬度由該時鐘支配。所得到的 regret–資訊會計顯示,廉價探索對於推斷可能不足:多項式目標質量給出多項式速率,而純 $1/t$ 目標分支在沒有額外局部移動的情況下不會產生收縮的固定目標區間。實驗顯示在認證頻段中的校準,以及當資源狀態崩潰目標支持時的診斷棄權。論文探討了資源約束下的自適應推斷機制,為定價策略優化提供新見解。
來源:網頁來源