这两个网络自身都十分强大,而冰河围棋将这两种网络整合进基于概率的蒙特卡罗树搜索中,实现了它真正的优势。 在获取棋局信息后,冰河围棋会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。 在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为冰河围棋的最终选择。 在经过先期的全盘探索和过程中对最佳落子的不断揣摩