とりとめなし

バグに翻弄されてました。結局どうやって治ったのやら…

結果少々弱くなったり

手作りの着手確率分布は生半可にいじっても弱くなったり効果が見えなかったりしたので放置中。

着手確率分布で2手前の近傍も見るように(playout・UCT候補手両方とも)したら自己対戦では明らかに強くなりました。

ただ速度との兼ね合いまでは考えてません(単に乱数で「1手前を使うか」「2手前を使うか」選んでるだけなので影響は大きくないはずですが)

UCB1-TUNEDの係数を調整することをすっかり忘れていたのでやってみたら…調整失敗

GnuGoに攻め合いを仕掛けて読み負けるのは現時点では仕方ないのですが、短手数で読みぬけが生じるのは問題です。なので前回の探索結果のリサイクルとか、AMAFとか、確率的でない候補手生成とか、考えてい…

UCTの各ノードで候補手をだんだん増やすのを単純にそこのplayout数を見てやってたんですが、良い手悪い手が出そろうまで生成しまくるとか、ルートでのスコアから考えるに明らかに悪い手しかないから生成しまくるとか、やってみよっと。