当前位置: 网站ABG欧博 >> 名师前沿课程 >> 正文
计算机类专业前沿系列名师专题课程 第七讲——强化学习基本原理与典型应用
发布时间:2024年06月03日 来源: 浏览量:

530日上午,欧博官网计算机与通信工程学院“计算机类专业前沿系列名师专题课程”的第讲圆满举行。本次讲座特别邀请了教育部青年长江学者、湖南芙蓉学者青年学者、湖南省优青,湖南大学刘璇教授刘璇老师为我们作了题为强化学习基本原理与典型应用”的精彩报告。我院师生共200余人参加了此次报告会,活动由计通学院副院长蔡烁主持。

蔡烁代表学院热烈欢迎刘璇老师的到来,并向参会师生介绍了刘璇老师在教学和科研方面的丰硕成果,以及目前的主要研究方向。

在讲座的开篇,刘璇教授首先介绍了什么是强化学习。她详细解释了强化学习的定义、基本概念和工作机制。强化学习是一种机器学习方法,通过智能体与环境的交互,不断调整策略,以最大化长期累积奖励。这种方法在解决复杂决策问题中显示出强大潜力。随后,刘教授深入剖析了强化学习的基本原理。她详细介绍了强化学习的核心要素,包括状态、动作、奖励、策略和价值函数。通过具体实例和图示,刘教授生动地讲解了推荐系统应用的经典算法,帮助听众理解这些算法如何通过不断试错和学习优化决策策略。接下来,刘教授探讨了强化学习的广泛应用前景。她列举了强化学习在机器人控制、自动驾驶、智能游戏、金融交易和医疗诊断等领域的成功案例,展示了强化学习在实际应用中的巨大潜力。特别是在群智决策领域,强化学习为优化集体智慧、提升决策效率提供了创新解决方案。最后,刘教授讲述了强化学习在群智决策中所面临的挑战。她指出,群智决策中的多智能体协同、实时动态环境以及数据稀缺等问题,给强化学习算法的设计和实现带来了巨大挑战。针对这些挑战,刘教授提出了几种可能的解决方案,并分享了她团队在这一领域的最新研究进展。

此次讲座内容丰富、深入浅出,不仅拓宽了与会者对强化学习的认知,也激发了他们对这一前沿领域的浓厚兴趣。刘璇教授的精彩演讲赢得了现场热烈的掌声,与会者纷纷表示受益匪浅。


人物介绍:刘璇,教育部青年长江学者,湖南省芙蓉学者青年学者,湖南省优青。主要从事人工智能、大数据、智能感知等领域研究工作。相关研究工作发表于TMCTPDSTCINFOCOMMOBIHOCIJCAI等顶级国际期刊和会议,已发表/录用论文70多篇。主持和参与国家重点研发计划以及国家自然科学基金项目多项。担任多个国内外学术会议相关程序委员和组织委员会委员,以及IEEE/ACMTRANS等多个国际期刊和会议审稿人

                        (图/文:赵阳洋、刘俊  一审:李秋桂 二审:蔡烁  三审:张锦)


2020© 欧博官网教务处版权所有
地址:欧博官网云塘校区一办公楼一楼
邮编:410004
电话:0731-85258568