【Globali】
米グーグル、「アルファ碁」の新版を発表、自己学習だけでさらに進化(2017/10/20)
米グーグル傘下の英ディープマインドは、19日付の英科学誌ネイチャー電子版に掲載された論文で、同社開発の囲碁の人口知能プログラム「アルファ碁」の改良版である「アルファ碁ゼロ」について発表した。
アルファ碁は2016年3月、世界トップクラスの強豪とされる韓国人棋士Lee Sedol(イ・セドル)氏に圧勝した上、今年5月には世界最強の19歳の天才棋士Ke Jie(カ・ケツ)氏と対局して3対0の完封で勝利し、世界をあっと言わせた。この勝利をもって、グーグルはアルファ碁を引退させるとしていた。
しかしグーグル傘下のディープマインドは今般、その後継版として、より強力でさらに優れたプログラムである「アルファ碁ゼロ」を発表した。...
全部読む
アルファ碁は2016年3月、世界トップクラスの強豪とされる韓国人棋士Lee Sedol(イ・セドル)氏に圧勝した上、今年5月には世界最強の19歳の天才棋士Ke Jie(カ・ケツ)氏と対局して3対0の完封で勝利し、世界をあっと言わせた。この勝利をもって、グーグルはアルファ碁を引退させるとしていた。
しかしグーグル傘下のディープマインドは今般、その後継版として、より強力でさらに優れたプログラムである「アルファ碁ゼロ」を発表した。それはアルファ碁の能力を凌ぎ、人間の手を一切借りずに囲碁をマスターしたという。囲碁のルールを入力しただけで、囲碁を一から学習し、最終的には前身のアルファ碁と対局して100戦100勝だった。
新旧のプログラムはともに、強化学習と呼ばれる手法で学習を重ねた。より勝ちにつながりそうな好手を推奨するものだ。前身のアルファ碁には、人間のプロやアマチュア棋士による何千もの対局の棋譜を読み込ませて学習させたが、新しいアルファ碁ゼロは、自身による対局を何百万回も重ね、戦法を認識するまで無作為に手を打ち続けることだけにより学習した。最初の設定以外には、全く人間の力を借りなかったところが大きく異なる。学習能力は驚異的で、たった3日間で、韓国棋士に勝った時点のアルファ碁に勝ち、40日間でその後改良された全てのアルファ碁のプログラムにも勝利した。
アルファ碁ゼロが、一から自身を短期間で教育した能力は、医療や自動運転等、他の分野でも広い範囲に応用ができると期待されている。「我々にとって、アルファ碁は囲碁というゲームに単に勝利するだけではなかった。それはまた汎用アルゴリズムを構築するための大きな一歩だった。」とディープマインドのデミス・ハサビスCEOは述べている。
囲碁での成果に引き続き、現在アルファ碁ゼロは、アルツハイマー病やパーキンソン病などの病気を理解するためにタンパク質の組成を学習しているという。ディープマインドでは、アルファ碁関連のプログラムが人間を助けて、科学や医学の分野の研究をする日も遠くないと考えている。
閉じる
その他の最新記事