加入收藏  || English Version 
 
【校庆学术活动月】陈蔼祥学术报告

  发布日期:2019-09-17  浏览量:11


 

报告题目AlphaGo, AlphaGo Zero作战指挥部成员

报 告 陈蔼祥(广东财经大学)

报告时间2019920日(周五)上午10:30-11:30

报告地点:磬苑校区数学楼H306报告厅

报告摘要:围棋的搜索空间O(10343.8)是穷尽目前全球所有存储设备容量总和(3亿TB,O(1014.5))亦无法显式有效存储的巨型数据。AlphaGoAlphaGo Zero 的成功意味着人类掌握了用计算机从O(10343.8)这一天量级的可能策略空间中筛选出能击败人类能力的走子策略。 实现这一跨越的关键技术就是用深度强化学习技术武装的蒙特卡罗树搜索算法。本报告重点解剖了蒙特卡罗树搜索算法这一繁忙但有条不紊的作战指挥部的内部工作过程,内容包括政委Vθ(状态价值网络)和军师诸葛亮(策略网络)、狗头军师(另一个策略网络Pπ)及其快速小分队的强化学习成长过程,以及各成员分工协作并最终形成AlphaGo的走子决策过程。AlphaGo Zero 的指挥部则由一身兼多职的诸葛军师PVρ构成 (AlphaGo的作战指挥部精简机构的结果).

欢迎各位老师、同学届时前往!

  

数学科学学院

2019917


报告人简介:陈蔼祥,男,中山大学博士,广东财经大学统计与数学学院副院长,广东财经大学人工智能与深度学习研究所所长,韦恩州立大学访问学者,硕士生导师,广东省计算数学学会理事兼副秘书长,《软件学报》、《计算机学报》、《计算机研究与发展》、《计算机科学》审稿人。主要研究领域为深度学习、统计机器学习、智能规划、基于模型的诊断、自动推理,已在国内外权威刊物上发表论文20多篇,著作2部(《深度学习》(即将由清华大学出版社出版)、《自动规划:理论与实践》(清华大学出版社,译著))。主持国家统计局项目、广东省自然科学基金、广州市科技和信息化局应用基础研究项目、广东高校优秀青年创新人才培育项目各一项,参与多项国家自然科学基金项目和教育部重点项目。



 

打印此页】【顶部】【关闭
   
版权所有 © 2007-2017 安徽大学数学科学学院 All rights reserved 皖ICP备05018241号
地址:安徽省合肥市九龙路111号安徽大学磬苑校区理工楼H楼 邮编:230601 E-mail:math@ahu.edu.cn
访问统计:自2013年9月1日以来总访问:1000  后台管理