コンピュータ大貧民関連の文献・発表一覧

コンピュータ大貧民をテーマとする論文について大渡なりにまとめていきます。 自身のプログラム作成において有用だったものから順に並べる予定です。(書きかけ)

UECコンピュータ大貧民大会向けクライアント「snowl」の開発(須藤ら,2010)

UECda2010で圧勝した須藤氏のsnowlのアルゴリズムについて。着手後残り手札の構成要素による線形価値関数+softmax方策でシミュレーションしてpure Monte Carlo Search。着手履歴によって、手札分配時にカードごとの重み付け(効果は小さかった)。softmax方策関数以外にシミュレーション時の特別な工夫はなし。

方策関数の学習はSimuation Balancing。サンプル局面は不完全情報局面(主観的な局面情報のみ持っている状態)で教師の評価値として原始モンテカルロプログラムの対戦結果を利用(相手の手札は毎対戦配布)。

手札推定の重みの学習はMM法を利用。(この手法に追随した報告はない)