Posts tagged "Adversarial Search"

蒙特卡洛树搜索

• Adversarial Search, Games

蒙特卡洛树搜索 1. MCTS 核心思想 对于像围棋这样分支因子极大的应用,传统的Minimax及其变种算法因计算量过大而不再适用。蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS) 为此类问题提供了强大的解决方案。 MCTS基于两个核心理念: 1. 通过模拟进行评估 (Evaluation...

Expectimax 算法

• Adversarial Search, Games

Expectimax 算法 1. Expectimax 概念 Minimax算法的核心假设是对手总是做出最优选择,这使其在面对非最优或随机对手时显得过于悲观。例如,在棋牌或骰子游戏中,结果本身具有不确定性,Minimax的“最坏情况”分析不再适用。 Expectimax搜索是Minimax的泛化,专门用于处理这类不确定...

Minimax算法

• Adversarial Search, Games

Minimax 算法 1. Minimax 核心思想 Minimax(极小化极大)是一种在零和博弈中做出决策的经典算法。其核心思想是,在一个回合制、信息完全的对抗游戏中,我方(MAX玩家)总是希望最大化自己的收益,而对手(MIN玩家)则总是希望最小化我方的收益。算法假定对手每一步都会做出最优选择。 $a.$ 状态值...

对抗性搜索与游戏理论

• Adversarial Search, Games

对抗性搜索与游戏理论 1. 相关概念 在传统搜索问题中,智能体可以使用搜索算法确定最佳计划并直接执行以达到目标。但在对抗性环境中,智能体面临一个或多个试图阻止其达成目标的对手。由于无法确定性地预知对手的策略和反应,传统搜索算法不再适用,我们需要新的算法类别来解决对抗性搜索问题,也就是游戏。 2. 确定性零和游戏...