自我实现的算法:算法决策中的动态选择

讲座概要:

在线学习算法中常常面临内生性问题,如模型误差,隐变量等等。在一类经典动态决策问题中(上下文多臂决策机),由于决策影响可观测的数据,而可观测的数据则会影响未来的算法学习结果,故算法学习和算法决策的交互会产生一种自我实现的偏差。讲者将会提出一类使用工具变量的新算法来去除这种偏差,以渐近逼近最优决策机制,同时得到对数形式的悔过成本。进一步地,我们推导了一组中心极限定理来对核心参数进行统计推断。这些理论结果建立在一种新的技术以解构统计上数据和决策之间的相互依赖问题。

讲者:

罗晔 副教授

香港大学数字经济与创新研究所

Related Posts