米長永世棋聖とコンピュータ将棋の解説をナビゲーションで見て

コンピュータ将棋が勝利してそれがすごいことだとは思うのですが、ちょっと思ったことがありまして書いてみます。

ちなみに、私は人工知能に関してはほぼ素人です。学生時代に同級生にそれ系の研究をしていた人がいて研究結果などを説明してもらった程度です。

なので、かなり間違ったことを考えているかもしれませんが・・・。

ブレードサーバーにかなりメモリが乗っていたな~

確かにブレード一つでPC一台分くらいなのでしょうか、あのメモリはすごいと思いました。

一枚最低でも2GBはあるでしょうから、x8で16GBですか・・・。

まあ、探索範囲が広くなればなるほどどうしても場面保存にメモリを使うのでそうなるのは必然なのでしょうが・・・。

一種の研究だと思うのでそれはそれで正しいのでしょうが・・・。

序盤の人間、終盤のコンピュータ

やはりこの構図は変わらないですね。棋譜を確認したわけではありませんが、米長永世棋聖の序盤作戦がうまくいっていた、という説明とコンピュータ側の飛車が行ったり来たりで攻めあぐんでいた、という説明からそう思いました。

また、米長永世棋聖のちょっとしたミスを見逃さずに一気に場面を展開する、というのもたしかにコンピュータの特長としてよくあるな~という感じでした。

そう考えるとまさに人間VSCPUの構図の戦いだったと言えると思いました。

ちょっと考えた「将棋で大局観を考える方法」

結局、これは場面に対して点数をつける「評価関数」の作り方が物を言うわけですね。

飛車の移動を繰り返していた場面なんかが特に特徴的で、この辺は評価関数の考え方を逆利用した米長永世棋聖の作戦勝ちだったわけですが・・・。

そう考えると、「序盤は評価関数的な要素ではない何かで場面を作っていく」というのが必要になるわけですか・・・。

このあたりはいわゆる「陣形」をあらかじめ決めてそれに向かって進める、みたいな考えでしょうか。

妙に思ったのが、評価関数を使うにしても「評価関数が点(その場面のみ)でつけるから問題なのであって、こういう場合は面や空間的な評価関数的な物を使えないだろうか?」と。

まあ、この考えも結局基本評価関数が鍵になるわけですが、たとえば手を読んでいる段階で「悪くなりそうな場面が多い」と考えられる状態に対して

たとえいい手があってもそれをならして計算して(ミニマックス法のようによい評価が一つでもあればそれを使う、ではなく)場面評価値+状況評価値(これが負になる)みたいな考え方を行う、という簡単な物です。

序盤に限ればこういう考え方もありのような気がします。

まあ、最先端の研究をしている人ならこれくらいは思いついていますよね?

私もこういう研究をしていればよかったのかな?

と思わないでもない人です。今やろうとしても知能レベルがたぶん足りません。悲しいです。


コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

この記事のトラックバック用URL