これはドイツに旅行した時、ライン川下りの際に撮影。銀塩写真。チェスのルークに似ている。ルークは将棋の飛車と同じ動きができ、将棋と異なり自陣に2つある。駒の価値はクイーンに次いで高い。
今日の記事は、タイトルは「カスパロフとディープ・ブルー」だが、今年4月に行われた将棋の電王戦についても触れるためかなり長くなると思う。
カスパロフ(ガルリ・キモビッチ・カスパロフ)は、旧ソ連を代表する傑出したチェスの世界チャンピオンであった。
彼は1963年、カスピ海に面したアゼルバイジャン共和国の首都バクーで生まれた。幼少の頃からチェスの桁違いの才能を発揮し、7歳の頃、少年宮のチェスサークルに入り10歳の時にチェスの学校に入学、チェスの英才教育を受けた。なんと、ソ連には英才教育目的のチェス専門の学校があったのである。
1977年、14歳頃にソ連、ジュニアチャンピオンになり、翌年、1978年にはソコルスキー記念トーナメントで優勝しグランドマスターになった。このグランドマスターだが、日本の将棋のタイトルやトーナメント優勝者に与えられるものではなく、日本語で言う漠然とした「名人」と言う意味だと思う。
グランドマスターの起源はロシア皇帝のニコライ2世が1914年にサンクトペテルブルクの将棋大会で決勝に残った5名に与えた称号が原型である。なお、この5名は現在のグランドマスターに比べても断然、強かったと言われている。
当時のグランドマスターはワールドクラスのチェスプレーヤーを指す称号で曖昧なものだったが、その後、レーティングなどの規定が設けられたものの、グランドマスターの大安売りが起こり、今では世界で1000名以上のグランドマスターがいる。それでもなお、全チェスプレーヤーのうち、グランドマスターの称号を持つものは0.02%しかいない。現在、世界で最もグランドマスターが多い国はロシアである。
カスパロフが15歳で与えられたグランドマスターの称号は、現在のそれよりずっと価値が高かったのは間違いない。
カスパロフは1980年、世界ジュニアチェス選手権で優勝し、第19回ジュニア世界チャンピオンになった。その後1984年、初めて出場した世界選手権で勝ち進み、10年間、世界チャンピオンのタイトルを保持する同じソ連のアナトリー・カルポフに挑戦した。
この対戦は、当初カルポフが4連勝するが、その後引き分けが長く続き、結局48局で5勝3敗40引き分けのまま大会が中止された。1984年大会は、優勝者がいないまま、半年後に再戦が決定されたのである。
チェスの当時の大会は「6局先勝、局数無制限」とされており、当初4連敗したのにもかかわらず多くの引き分けを挟み3勝5敗まで追い上げた流れから、まだ若く体力があるカスパロフが勝勢であった。ところが、当初の大会規定を曲げて終わらせたのである。その理由は既に5ヶ月以上対戦が続いていたことで、健康面の影響も考慮されたのかもしれない。
チェスは、将棋とは異なり取った駒が使えない。だいたい白と黒に分かれているし。だから終盤、極端に駒が少なくなると、引き分けにせざるを得ないのである。これはアイスホッケーのペナルティに似ている。(アイスホッケーも両チーム極端に退場者が多い状況ではお互い攻めない)
翌1985年大会でカスパロフはカルポフを初戦から破り、5勝3敗15分で勝利した。その後、数回のカルポフのリターンマッチを辛くも退け、その後15年間も世界チャンピオンを維持したのである。当時、
歴代最強。何びとも彼には勝てない。
といわれたほどの天才であった。
オーストラリア、ゴールコーストの海岸に近いストリートに設置されていた公共のチェス盤。椅子も備え付けられている。
おじさんたちが実際に対戦している。
カスパロフとIBMの誇るスーパーコンピュータ、ディープ・ブルーとの対戦は、1997年に行われている。このディープ・ブルーはIBMによりチェスに特化したコンピュータであったという。これは今から考えると、IBMの商業的な思惑もあったと思われる。
この対戦だが、第1戦はカスパロフ先手でカスパロフの勝ち。チェスにおける先手番は、将棋と同じくはっきり有利とされている。
第2戦目、先手のディープ・ブルーやや有利で運命の第36手目を迎えた。次にディープ・ブルーにクイーンを敵陣深く送り込む手があり、それが決定打となりカスパロフが敗れる、と観戦のグランドマスターの誰もが予測した。
しかしディープ・ブルーはなかなか次の一手を指そうとしない。そして6分の考慮時間の後、全く違う手を指したのである。なぜクイーンを動かさないのか?その時のカスパロフの意外な手を見た驚きの表情と小さく首を振る仕種を映像は捉えていた。開始3時間44分、遂にカスパロフは投了に追い込まれた。
その後の分析で、クイーンを動かす手は悪手であることが判明した。カスパロフが鮮やかな返し手を読んでいたからである。ディープ・ブルーはどうしてこれを見抜き別の指し手を選んだのであろうか?
ディープ・ブルーの思考記録は後に明らかにされている。ディープ・ブルーはその前の35手目を指した際、既にカスパロフの次の一手を正確に予測しておりカスパロフが指す前から読み始めている。ディープ・ブルーは8手先の局面を瞬時に検索しており、その局面で最も高い得点+87になる局面を見通していた。その局面に持っていく手はクイーンを動かす手であることを読みきっていた。この間の検索時間は僅か5秒であった。
では、どうして最も高得点に繋がる手をディープ・ブルーは指さなかったのだろうか?
カスパロフが次の手を考えている間、ディープ・ブルーはもう一歩読みを進め、クイーンを動かした場合の9手先の検索を始めた。その結果+79という局面に行き着くことが判明した。この点数は一手前の+87に較べて8ポイントだけだが低くなっている。この検索の直後、カスパロフはディープ・ブルーの予想通りの手を指した。
ここでディープ・ブルーは3分の考慮時間を限度に10手先の検索を始め、53秒後10手先の局面が+74になることを確かめる。8手先が+87、9手先が+79、10手先が+74と少しずつ点数が下がることにディープ・ブルーは警戒心を抱いたのである。
ここで検索時間の3分が経過したことを知らせるアラームが点灯するが、ディープ・ブルーはパニックタイムと呼ばれる予備の時間を使ってさらに検索を続けた。その結果クイーンを動かす手は11手先には+48にしかならないことを突き止めた。
そこでディープ・ブルーはクイーンを動かすことを諦め、別の指し手を探し始めた。そして6分後11手先が+63になる局面を発見した。その局面に導く次の一手こそが第2局の勝敗を決定づけ、すべてのグランドマスターおよびカスパロフを驚嘆させた36手目のポーンを動かす一手だったのである。(ポーンは将棋の歩に近い)
1、2局で1勝1敗となり1日休んで第3、4局が行われた。しかし第2局での敗戦にショックを受けたカスパロフは集中力が保てず、有利な局面での決め手をつかむことができなかった。そして48手で引き分けとなる。第4局は互いに決め手を欠き、48手目ディープ・ブルーは引き分けを提案したが、カスパロフはこれを拒否した。しかしこの時すでにディープ・ブルーはすべての検索を終え、引き分けになることを読みきっていたのである。
4戦目までの戦績は1勝1敗2引き分けであったが、心理面の状況からディープ・ブルーの方が遥かに優位な状況と言えた。コンピュータは悪手の後悔や落胆などないからである。
最後の2戦でカスパロフに大変なボーンヘッドが出て(うっかり大駒を取られる)、結局2勝1敗3引き分けでディープ・ブルーに敗れたのである。
これはコンピュータが史上初めてチェスの世界チャンピオンに勝った大事件といえた。実際、ディープ・ブルーの勝利の直後、ニューヨーク市場のIBMの株価は22%も急騰している。
カスパロフはIBMに繰り返し再戦を申し入れたが、IBMは「プロジェクトの目的は達成した」と拒否し、ディープ・ブルーとの再戦はならなかったのである。
IBMはディープ・ブルーに巨額な開発費をかけたが、それに見合う利益をたぶん得ることができたであろう。世界的な宣伝効果があったからである。実際、勝利の直後、企業向けのスーパーコンピューターのレンタルで「ディープ・ブルーが就職先をさがしています」と言ったWeb広告を出していたらしい。そのような状況で、IBMが再戦を受け入れるわけがないとは言える。
当時のディープ・ブルーなどのコンピュータは1秒間に2億手を読むと言われていた。しかしヒトの場合、これは明らかに悪手という手は除外して読む。つまり、直感的にある範囲の手は排除するのである。
これらの精神的な作業は、その局面の大局観を構成する要素でもある。演算できない範囲ものを、直感や過去の経験から最初から除外することで補っている様にも見える。これは極めて人間らしい思考のありかたである。
カスパロフは、IBMが再戦を受け入れなかったこともあり、あの対戦は公平に行われたものか疑念を抱いていた。彼は、
「6番勝負の結果は事実だ。しかし、ディープ・ブルーは本当に自立したコンピュータだったのか、私は深い疑問を持っている」
と話している。つまり、コンピュータを補佐するグランドマスターレベルの人間がいたのではないか?と言う疑念である。
ニューヨークで行われた対戦では、テーブルを挟んで、ディープ・ブルーの指示に従って指すIBM側のスタッフが向き合っていた。しかしディープ・ブルー本体は別室に置かれていたのである。カスパロフはこうも主張する。
「もし、IBMがディープ・ブルーの勝利を歴史に刻もうと言うのであれば、全対局を通じてディープ・ブルーの思考過程を示すプリントアウトされたデータを公開すべきだ。つまり、勝負の最中に、人間の関与がなかったかどうかを証明する義務があるはずだ」
このタイプの疑念は、精神科的に言えば、了解可能なので正常範囲の反応だと思うが、将棋に限らず、パチンコやパチスロ、あるいはカジノのルーレットやブラックジャックに至るまで、参加者が抱きやすいものといえる。(実によく聴く話。店が操作しているとか。稀に操作が明らかになることがあるし)
カスパロフの疑念が本当かどうかだが、ディープ・ブルーが第1戦であっさり負けたこともあるのか、1戦目と2戦目の間に、IBMはディープ・ブルーの形成判断機能のパラメーターを修正している。修正以後、ディープ・ブルーは、コンピュータぽくない指し手を見せ始めたのである。つまり、「グランドマスターのように陣形を重視した指し手で応戦する」ようになったのであった。確かに、カスパロフが疑いを持つはずである。
後にカスパロフが要求した思考ログは後に明らかになっているが、パラメータは変更されたものの、彼が想像していたタイプの不正ではなかったようである。実際、IBMチームのマレイ・キャンベルは、プログラムを変更したのは認めたものの、「それがどのように指し手に影響するのかまではわからない」といった内容のコメントをしている。
つまり、パチスロで言うと設定の良い台のはずなのに全く出ないようなことがあるのと同じである。より上位の設定を変えても、結果がどうなるかまではわからないと言った感じか。
カスパロフが想像したグランドマスターレベルの人間のサポートであるが、ヨーロッパの人工知能の研究者は、
「もしレーティング2600のチェスの人工知能をそれよりも弱い1800前後の人間が補佐すれば、コンピュータのレーティングは2800以上になる。」
と指摘している。つまり、ある程度の力量を持つ人間が補佐するだけで大違いなのである。面白いのは、グランドマスターレベルの2名が相談し最良の指し手を選んで対局すると1名よりむしろ弱くなると言う話。しかしコンピュータ+人間だと断然強くなるのである。たぶん相補的に作用するのが良いんだと思う。
カスパロフにとって、気の毒な点はいくつかある。それは、ディープ・ブルーはカスパロフの棋譜を研究する機会が十分に与えられていたのに、カスパロフにはそれがなかったこと。また、ニューヨークで実施されたのも大変なアウェーの試合と言えた。これについては、カスパロフも、
「1局ごとに違う相手と対戦しているようだった。これまで戦ったどの相手とも違う棋風だった」と評している。
それに第2戦目のディープ・ブルーの予想外の指し手に混乱し敗戦。その後の対戦に悪影響を及ぼした面もかなりある。カスパロフは攻撃型のチェスプレーヤーであり、本人も終盤は序盤や中盤に比べ苦手とコメントしている。攻撃型であれば、受けが強いタイプに比べ、心理面の影響は大きいように思われる。少しコンピュータの対戦に慣れていれば、あの時代であれば、勝っていたか、あるいは悪くても引き分けに終わっていた可能性も高い。
カスパロフは、ディープ・ブルーは自分には勝ったが、色々なタイプのチェスプレーヤーがいる世界大会で勝ち抜くのは難しいのではないか?とコメントしている。
今年の将棋電王戦の結果は、カスパロフが被った不利がそのまま再現されている。それはコンピュータ側は対戦棋士の棋譜はとりわけ綿密に研究が可能だったが、その逆はなかった棋士がほとんどだったこと。実際、十分なコンピュータの情報が与えられた棋士は勝っている。
1局目、阿部光瑠四段vs竹内章氏の「習甦」
2局目、佐藤慎一四段vs山本一成氏の「ponanza」
3局目、船江恒平五段vs一丸貴則氏の「ツツカナ」
4局目、塚田泰明九段vs伊藤英紀氏の「Puella α」
5局目、三浦弘行八段vsGPS将棋開発チーム「GPS将棋」
この対戦はコンピュータ側が3勝1敗1引き分けで圧勝の結果に終わった。初戦の阿部4段のみ勝利し、4局目の塚田9段は互いに入玉し引き分けであった。将棋を知らない人はあまりわからないと思うが、チェスに比べ「引き分け」はかなり珍しい結果である。これは将棋は過去の対局の棋譜のデータベースを基に指し手を決めている面がかなりあり、入玉将棋の棋譜があまりないことも関係している。チェスのコンピュータにはなんと過去の数百年分の棋譜が入っていると言う。
2007年、Bonanzaと渡辺竜王の対戦が実現する。これは画期的なことであり、史上初めてタイトル保持者とコンピュータが真剣勝負をすることになったのである。(大和証券杯ネット将棋・最強戦の創設を記念し、渡辺明竜王との平手一番特別対局)。
これは渡辺竜王の話では、米長さんに頼まれて渋々、嫌だったけど対戦に応じたという。当たり前だが、この対戦は万一、竜王が負けた場合、失うものが大きすぎるが、コンピュータ側にはそれが皆無というのがある。
Bonanzaは当時海外に在住していた日本人の化学者、保木邦仁により製作されている。話題になったのは保木邦仁は将棋が弱いこと。棋力がないのに、強いソフトが作れるのである。
結果は渡辺竜王が勝ったが、終盤にBonanzaの明確な勝ち筋があったらしいのである。2007年当時、コンピュータソフトは、もしそういう風に指されていたら、渡辺竜王でさえ負けたかもしれないレベルに達していたと言える。渡辺竜王は、対戦後のコメントとして、Bonanzaがコンピュータと思えないような良手を指していたことと、強いと思われていた終盤に意外な見落としがあったことを挙げている。これは、製作者がいかなる環境で製作していたかと関係がある。
Bonanzaの製作者の保木邦仁は、2006年11月11日の第11回 ゲーム・プログラミングワークショップ2006でアルゴリズムの詳細を発表している。また、2009年1月、Bonanza Version 4.0.3の思考ルーチンのソースプログラムを公開。他の開発者の利用を認めたため、この思考ルーチンを利用して、他のソフトも飛躍的に強くなった。現在の将棋ソフトの強さは保木邦仁の貢献が大きいと思う。
なお、Bonanza製作にあたり、彼はコンピュータチェスの論文をベースとして思考ルーチンの基本部分を作成したと言われる。またそれまでコンピュータが採用していなかった、全幅検索を用いている。当時の他の将棋ソフトは、自然な指し手から選ぶ「選択検索」を採っていたのである。全幅検索とは常識だとありえない指し手まで検索することである。
つまり、「全幅検索」は極めてコンピュータっぽい。
また、Bonanzaは「評価関数のパラメータの自動生成」を行っている。これは保木邦仁本業である化学反応の制御理論を応用したものであるらしい。このような所にも、彼が海外に住んでいたことや、将棋にさほど詳しくなかったことが関係している。だからこそだが、それまでにない斬新な発想が生まれたとも言える。
彼は渡辺竜王との対戦後、「美しい棋譜を残すことができた」とコメントしている。敗れはしたが、そのソフトの強さが誰の目にもわかったからである。
今年の電王戦の最終戦だが、三浦弘行八段はプロ側がそれまで1勝2敗1引き分けで負けられない状況に追い込まれていたこともあり、プレッシャーのためか生彩を欠いていた。とてもコンディションが悪いように見えた。しかし、実際にGPS将棋が上位のプロレベルに強かったのも棋譜が証明している。
カスパロフがディープ・ブルーに敗れた当時、まだ将棋ソフトは全然弱かった。2000年当時の最強ソフト「東大将棋」でさえ、自分レベルでも簡単にひねられた。当時のコンピュータのソフトは、いつも同じ場面で悪手を打つので対応しやすいのである。つまり実に機械っぽい。
過去ログにマックを諦めてウインドウズに変わった理由の1つに、小型ノートパソコンをアップルが発売しそうにないと言う話を挙げている。その他に、この将棋ソフトをやってみたかったこともかなりある。
カスパロフによると、チェスは終盤になるとほとんど間違えないので、コンピュータが終盤に強いとは言えないらしい。これはチェスは終盤は駒が盤面に少ないのも関係しているような気がする。コンピュータが力を発揮するのは、圧倒的に中盤なんだという。
終盤でコンピュータが強いように見えるのは、実は双方に時間が残っていないことが多いからだと思う。その条件だと、やはり人間の方が不利である。先日、子供将棋名人戦が放映されていた。準決勝以降なので4人の子供が紹介されていた。解説は森内名人である。(現在、名人戦が行われている。3年連続で同じ対戦。森内名人が羽生3冠を3勝1敗でリード)
子供名人戦の準決勝だが、2戦とも共に元気よく攻めた子が敗れた。最終盤で、攻めた方に勝ち筋があったが、時間がなくて気付けなかったからである。敗れた体格の良い子は森内さんにそれを指摘されて泣きじゃくっていたが、基本的に将棋をする子供は負けず嫌いの子が多い。最後の優勝戦も攻めを受けている方が優勝する結果になり、ああいうのを観ると、終盤はコンピュータがあったら・・と思う。
カスパロフがディープ・ブルーに敗れた当時、将棋ソフトはあまり強くなかったこともあり、
将棋は取った駒が使えるので、チェスのようにコンピュータがプロに勝てるように簡単にはならないだろう。
と言われていた。しかし一部の意見には、「持ち駒が使えるのも演算の対象の延長上あるので、コンピュータの演算の速さが増していけばその辺りもクリアできはずだ」と言われていたのである。実際、その通りになっている。
今回の電王戦で驚いたのは、人間に大局観があるように、コンピュータにもある種の大局観があるように見えることである。特に最終戦に出てきたGPS将棋は、他の対戦ソフトのような機械っぽさが少なかった。
つまり、コンピュータの過去の棋譜の蓄積が大局観のような感覚?を生み出すようなところがあること。ひょっとしたら、コンピュータは進化すると、平凡ではない一部の人間の思考アルゴリズムと似て来るのかもしれないと思った。
過去にカスパロフは、新手や新戦法を発見するのはコンピュータでは難しいとコメントしている。カスパロフ自身は、よくコンピュータを使っており、新手の評価などに利用していたようである。チェスにはコンピュータ持込可の大会があり、そのタイプのチェスはアドバンス・チェスと呼ばれている。(ただし、同じ機種、同じソフトを利用する)
しかし、GPS将棋と三浦弘行八段の対戦では、コンピュータはある局面で、普通の棋士なら到底選ばないような指し手を見せたのである。これは、三浦弘行八段が自分が慣れた戦形に持っていく際に出現している。だから、その手が出た瞬間は三浦弘行八段有利という形勢判断であった。しかし、この指し手以後、さほど三浦弘行八段は優位にならなかったのである。
あの奇妙な一手が新手でなくて何であろう!
つまり、コンピュータにも新手や新戦法は発想できるように見えるのである。現在のコンピュータは、昔のようにトンチンカンではない「機械っぽくない新手を指している」と言える。つまり、「えっ?!」の範囲が人間の発想に近くなったと言えよう。
このようなことを考えていると、なんだか空恐ろしいと言うか、映画の「ブレードランナー」を思い浮かべてしまう。「空恐ろしい」とは、「言いようのない不安を感じて怖い」という意味である。
また、初戦に戦った阿部光瑠四段は対戦ソフトの「習甦」を貸して貰いソフトの棋風、戦法を研究していた。つまり、ソフトの癖というかある意味、バグのような欠点を突いて勝ったとも言える。あの対戦だけはソフト有利ではなく、むしろ棋士に有利だったと思う。その理由は、ソフトを実践で研究できるのは、対戦相手の棋譜を研究するより遥かに有利だからである。
今回の電王戦はプロ棋士の敗戦に終わったが、将棋界にとっても極めて好ましいイベントだったと思う。チェスの場合、もう15年も前にコンピュータに敗れているわけで、いずれ来るはずのものが実際に来たことでしかない。
それにあれだけの負けっぷりだと、今後はプロも妙なプレッシャーにもならないであろう。将棋界にとって衝撃的だったかもしれないが、あれほど将棋界が注目されることは、ここ10年くらいあまりなかったからである。
将棋ファンの裾野を広げるイベントが、悪いものであるはずはない。
数年後は、負けてもたいした傷にもならない若手棋士ではなく、A級棋士全員参加で開催してほしい。
だって、チェスは15年以上も前に、世界チャンピオンがコンピュータと戦っているのに。
参考
将棋の話
アマゾンの相場と紙ジャケ
統合失調症っぽくない妄想
↧
カスパロフとディープ・ブルー
↧