やしお

ふつうの会社員の日記です。

将棋の視界が広がる

 将棋のソフトが超つよくなってるというのはわくわくする。将棋ささないし、棋譜も読めないけど、でも理論体系のパラダイムシフトが起こるんだろうなと思わせてくれるのはわくわくする。


 戦法のシフトは以前にも起きていて、昔は「戦型をお互いに組み終えてから戦う」という方式だったのが、今は「お互いに戦型を組み上げる前に(最中に)戦う」という形に変わっている。それは、戦型に関する理論体系が十分に緻密になったために、もはや「戦型Aと戦型Bで戦った場合はAが有利」といったことが事前にわかるようになってしまった。そのため「勝つためのより有効な手段」を考えた時に、当然「戦型が組み上がる手前の時点」が検討されていくことになる。この前倒しの理論を急速に推し進めたのが羽生善治であって、また同世代の厚い棋士層がキャッチアップするためにさらに理論体系が精緻に築かれていった、というストーリーになっているらしい。そんなことを以前プロ棋士のお兄さんがユーチューブで解説しているのを見て、熱いストーリーだと思ってわくわくした。


 今のソフトがプロ棋士から見て「どうしてもその局面では損にしか見えない、でも結果的に得になってしまう手」を指しているという。「損にしか見えない」というのは「現行の理論体系では導かれない」ということだ。単に読みが人間の方が浅い、「読みが足りなかった」という話ではなく、全く読み得ない手。そしてその手は、別の(静的な)理論体系で導いているわけではなく、膨大な機械学習と演算によって結果論的に導かれている。
 同じようなことはどの分野でも起きていて、例えば気象予報の世界でももっと以前から、数値シミュレーションの結果で雨が降ることになっていて、気象理論上は誤りや不可解に見えるけれど、実際にそこに雨が降る、といったことが起きているそうだ。


 じゃあこの先どうなるのかなと想像すると、「ソフトが指す不可解だが有効な手や筋がきちんと説明されるような理論体系を人間の手で構築していく」ということになる。これはすごくわくわくする話だ。将棋というゲームのルール(前提・仮定)は全く変化していないのに、今まで人が見ていた将棋の姿とはまったく別の相貌が立ち上がってくる。「ああ、そうか。将棋って実はこんなゲームだったのか」と視界が広がっている。この世界自体は何も変わってないけど、今までニュートン力学の視界でしか見てなかった世界が、量子力学の確率的な世界や、相対論の質量がエネルギーであるような世界に拡張される、みたいな。そのとき、将棋という世界が今人が考えているよりもはるかに豊かで深いものに見えている。それは今の目で見た時に100年前、150年前の将棋が狭く見えるのと同じことだ。
 ちなみに20年前にチェスで、ディープブルー(IBMのコンピューター)が世界チャンピオンのカスパロフに勝っているけど、それはこれとは文脈が違う話になっている。今回の将棋が人を圧倒してるって話は先読みがすごいということではないけれど、ディープブルーは「先読みがすごい」という割と純粋というか直線的な能力で人に勝利しているから、チェスの理論体系のパラダイムシフトのきっかけにはなっていないんじゃないかと思う。これは組み合わせの空間の大きさがチェスより将棋の方が大きいという差に由来していて、「大局観」と「読みの深さ」の比重が将棋の方がより前者が大きくなっているせいで、純粋な計数能力(読みの深さ)だけでは追いつかなかったという風に理解している。


 三浦九段のソフト使用疑惑の話もこうした文脈から見てみるとごく自然に理解できるような気がする。ソフトの指し手のような、現在の理論体系で導かれる結論とはかけ離れた、しかもはるかに有効な手を人間が指すには、

  1. 現在の理論体系とは全く異なる、かつはるかに有効な理論体系を持っていて、しかも実践可能な水準で咀嚼している
  2. ソフトと同様の事前の膨大な機械学習と、対局最中の膨大な演算(並列探索)を人力で行っている

といういずれかの方法になる。しかし1については、最高峰の棋士たちが何年にもわたって研究してようやく構築できるかどうかという理論を、誰にも知られることなくわずかな期間で一人で構築することは不可能に見える。(しかもそれを理論書等で全く公表していない。)一方で2については、スマホ相当の演算能力を人間が有することは不可能に見える。従って現時点で「人間が指し得る」とは考えづらい、という結論に至るのだとしたら、ごく自然なことのように思える。


 将棋の「強さ」というのはある直線上のものだというのが一般的な理解なのかもしれない。上手-下手という一つの軸があって、その上に全てのプレーヤーが位置している(ランクやレートのような)という曖昧なイメージで捉えられているのかもしれない。実際、勝率や対戦成績という結果から一軸に還元することはできる。単に読みの深い/浅いによって強さが決まる、あとは心理的な駆け引き等といった従属的な要素があるというイメージかもしれない。こうした理解で見た場合だと、「スマホを使ったという決定的な証拠もつかんでないのに、プロ棋士が『こんな手指せないでしょ』って思うだけでクロ判定するなんて杜撰」と見えても不思議ではない。「こんな手は指せない」が、単に相対的な言い方でしかないように見えるかもしれない。その人の力ではまだ指せないだけ、という見え方になる。
 しかし現行の理論体系を共有している人達からすると「こんな手は指せない」は相対的なものではなく、もっと絶対的な意味で「現状で人はその手を指し得ない」と言っていることになる。こう、いきなり空間転送装置を見せられて「こんなの作れない」と言うとき、それは「うちの会社では作れない」という意味ではなくて、今ある理論体系からは作り得ないから、人類ではない何かによって作られたはずとしか言いようがない、実際に作り方を説明できない人が「ううん。僕が作ったよ!」と言われても信じようがない、というような。


 もちろん将棋というゲームの面から見た話とは全く別に、組織体(将棋連盟)の振舞い方が今の社会の「常識」からはズレているとか、こうした「現行の理論体系を共有している人達」からの景色をそうでない人達にいかに実証的に説明し得るのかとか、そういった世の中とのすり合わせにまつわる話はあるかもしれない。それはそれで別途解決すべき話だとしても、「クロだ」と言い得る妥当性自体は、もし上のように見れば損なわれていないことになる。


 ちがうちがう。つい話題だったからスマホ使用疑惑のこと考えてたけど、もっと明るい未来のことだった。
 競技中のソフト使用は制限されるのは当然で(マラソン大会でオートバイOKみたいな感じになっちゃうし)、AIや将棋ソフトは、将棋理論を拡張するための測定器として使えばいいだけのことだ。未知の現象を測定して「今の理論で説明できない、でも実際に現象は存在している、だから説明できる理論を作る」ってきっかけにどんどんしていって、気づいたら今よりもずっと広くて深い理論体系が出来上がってたら、すごくわくわくするなってこと。
 将棋に限らず、AIとかと人間のお付き合いの仕方は、そういうもんになってくんだろうなと想像して、わくわくしてるんだ。