目录一、引言二、多智能体学习简介2.1多智能体学习系统组成 2.2多智能体学习概述 2.3多智能体学习研究方法分类 三、多智能体博弈学习框架 3.1多智能体博弈基础模型及元博弈 3.1.1多智能体博弈基础模型 3.1.2元博弈模型3.2均衡解概念与博弈动力学3.2.1均衡解概念3.2.2博弈动力学3.3多智能体博弈学习的挑战 3.3.1学习目标多样3.3.2环境(对手)非平稳 3.3.3均衡难解且易变四、多智能体博弈学习方法 4.1离线博弈策略学习方法4.1.1随机博弈策略学习方法 4.1.2扩展式博弈策略学习方法 4.1.3元博弈种群策略学习方法4.2在线博弈策略学习方法 4.2.1在