讲座题目:Inducing Desired Equilibria for Strategic Players via LLM-Assisted Weighted Reward Poisoning
主 讲 人:任肖强 教授(上海大学)
讲座时间:2026年6月5日(周五)上午10:30-11:15
讲座地点:理公司钱伟长楼 201会议室
欢迎有兴趣的师生前来聆听、交流。
2026年世界杯官网入口
2026年6月2日
讲座内容简介:
In multi--agent reinforcement learning, a naturally emerging Nash equilibrium often yields unfavorable payoffs for individual players. Consequently, a strategic player is incentivized to manipulate the collective learning dynamics to induce a more favorable outcome. In this talk, we investigate how a single strategic player can stealthily steer the joint equilibrium toward a self-interested target via reward poisoning. Specifically, we first introduce a large language model (LLM)-assisted preference-based reinforcement learning (PbRL) approach to identify the desired equilibrium. Subsequently, we introduce a poisoning mechanism with state--action-dependent weights that allocates the limited budget to critical state--action pairs to improve poison efficiency. Theoretical analysis guaranties convergence to the desired equilibrium and~$\epsilon$-stealthiness against statistical detection. Extensive experiments demonstrate that the proposed framework significantly enhances the strategic player's payoff while maintaining imperceptible reward distortions.
主讲人简介:
任肖强,上海大学未来技术公司,教授,博导,伟长学者,副经理,海上无人集群智能全国重点实验室办公室主任。于2012年获得浙江大学学士学位,2016年获得香港科技大学博士学位,其后在香港科技大学、新加坡南洋理工大学、瑞典皇家理工公司从事博士后研究工作。围绕无人系统的安全智能控制等领域在国际权威期刊发表论文50余篇,其中以第一或者通讯作者在IEEE Trans. Automatic Control, Automatica以及IEEE Trans. Signal Processing控制和信号处理的旗舰期刊发表文章20余篇。承担国家重点研发计划项目课题以及国家自然科学基金委面上项目等,以骨干承担国家自然科学基金委创新群体等。担任IEEE控制与系统会议编辑委员会(CSS CEB)成员,中国控制会议(CCC 2021)及网络科学国际大会(NetSci 2022)组委会成员,上海市自动化学会理事、中国自动化学会信息物理系统控制与决策专业委员会委员、中国指挥与控制学会具身智能专业委员会委员等。任肖强教授曾入选上海市“曙光计划”,牵头获上海市自然科学二等奖等。