rc電路中uct怎麼算

來源:生活大全幫 2.08W

rc電路中uct怎麼算

UCT算法即上限置信區間算法,是一種博弈樹搜索算法,該算法將蒙特卡洛樹搜索方法與UCB公式結合,在超大規模博弈UCT算法與傳統搜索技術的最大區別在於不同的分支可以有不同的搜索深度。UCT算法在不同的深度獲取評估值。對於最有“希望”求解問題的分支,UCT算法的搜索深度可以很深,而對於“希望”不大的分支,其搜索深度可以很淺。當最有“希望”求解問題的分支數量遠少於“希望”不大的分支數量時,UCT算法就可以把搜索資源有效地用於最有“希望”求解問題的分支,從而獲得比傳統搜索算法更深的有效深度d′。這個具有神奇力量的“希望”是由樹是節點的訪問次數,也是節點被樹內選擇策略選中的次數。是節點n的訪問次數。c是一個手工設定的常數。c的作用是平衡UCT算法的利用需求和探索需求。

熱門標籤