自我實現的演算法:演算法決策中的動態選擇

講座概要:

線上學習演算法中常常面臨內生性問題,如模型誤差,隱變數等等。在一類經典動態決策問題中(上下文多臂決策機),由於決策影響可觀測的資料,而可觀測的資料則會影響未來的演算法學習結果,故演算法學習和演算法決策的交互會產生一種自我實現的偏差。講者將會提出一類使用工具變數的新演算法來去除這種偏差,以漸近逼近最優決策機制,同時得到對數形式的悔過成本。進一步地,我們推導了一組中心極限定理來對核心參數進行統計推斷。這些理論結果建立在一種新的技術以解構統計上資料和決策之間的相互依賴問題。

講者:

羅曄 副教授

香港大學數字經濟與創新研究所

Related Posts