陈志堂
华为诺亚方舟实验室主任工程师
个人介绍:
陈志堂2010年本科毕业于中山大学自动化系,2014年在香港中文大学计算机科学与工程系获得博士学位。现为华为诺亚方舟实验室主任工程师。其研究兴趣包括核方法,深度学习,因果推理,强化学习,多智能体系统以及上述研究在通信网络的应用。
议题:
基于强化学习的因果结构发现
议题介绍:
从观测数据中发现变量之间的因果关系是很多科学研究的基础问题。基于评分的传统算法通过局部启发式算法搜索有向无环图,然而这些算法效果并不令人满意。受到近年来神经组合优化算法的启发,我们提出了一种基于强化学习的方法搜索最佳评分的有向无环图。我们提出的自编码-解码模型,输入观测数据输出因果图的邻接矩阵,并得到对应的评分作为强化学习的奖赏信号,用于更新强化学习搜索策略。合成数据和真实数据实验,证实了我们提出的强化学习搜索策略的有效性。