__Alpha Go vs 柯潔が意外にも接戦だった件__ [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
アルファ碁は一切の隙を与えない、完璧に勝ちに行く布陣で臨んだのか意外にも接戦だったな。
滅茶苦茶強くなってると言われてたが、そこまでの強さは感じなかった。 正直もう1年あれば
プロ相手に64連勝中のアルファ碁も
1年前は雑魚だったねってレベルまで行くんだろ
もう○○だったら負けてたとか虚しいだけだよ
プログラマが本気で囲碁攻略しようとしてるかどうかだけ
今回みたいに大企業が金とやる気出してチーム組んでアルファ碁みたいなの作れば
囲碁のトッププロの1000年が小規模チームに3年で消し飛ばされる
そのうち今の2017年版アルファ碁も雑魚でしかなかったってなるし ってかAIと人間が対局すること自体がおかしい
ゲームのチートユーザーと一般プレイヤーが戦うようなもの
負けて当然で、勝とうとするほうがおかしい 去年までプロ相手ならたまに負けてたアルファ碁も
今じゃプロ相手にギリギリの接戦になる程度にわざわざ自分で
凡ミスして戦局を調整しながら最後は1目半程度だけしっかり勝ちきる余裕あるもんな
去年の時点でプロでも勝てないのに
2017のアルファ碁はそれより3石分強いとかもう勝てるはずがない
大差になりそうになったら自分からミスしてギリギリの勝負にしてくれる接待機能付きだよ トップ倒すまでは興行として優秀だからおかしくはないんじゃないかな
戦わないと話題性は低いからAI戦術取り込むのも遅くなって囲碁の進化も遅れる AI戦術って言うけど最終的には
候補の手から先の展開を数千万パターンとかの中から一瞬で計算して
その中から一番安定して勝てる手を選び続けるようになるんだろAIは
最終段階まで行けばこの状況にはこれが最適ってのは分かるかもしれんが
その前にアルファ君引退しちゃったし
アルファ君はどう打たれてもすぐに先を計算して対応するから打てるけど人間には無理とか沢山あるだろう
人間が数百のパターン考える間にAIが1億パターンとか計算してるならどうしようもないよ 御城碁19連勝の本因坊秀策が現代に居ればマスターなどやっつけてくれたものを……… プロがAI戦術取り入れるのはAIを倒すのを目標としてなくて囲碁の進化のため
これから常識が変わってどんどん面白くなってくるはず 人間にAIに勝つのはもう無理だよ
どんな天才が出ても無理、本因坊でも無理
今のアルファ碁でトッププロ相手に3子置かせるくらいは強い
来年だと5子置いて互角くらいじゃないの
再来年だと更に強いだろう
2017の時点でトッププロ相手にミスしても手抜きでも勝てるくらいの強さ
開発が進めばこれから更に強くなる子供のような状態でこれ >>63
絶対的な100%じゃなくて統計上の100%っていうこと
全パターンが100億パターンあったとしても、5000通り検索してすべて結果が100%だったら
すべて100%である可能性が極めて高いっていう結論が得られるから
「出そうな手」だけを数千から数万パターン考えてシミュレートすれば実質的な100%は出せる 競馬もそうだが惜しいと勝つでは雲泥の差なんだよなあ 確率高い手で囲碁のベースが上がるのはいいけど悪手とか未知の手でも意地張り合って勝つとか
ああいう醍醐味が少なくなったら悲しいなあ 皆は見たことない手にばかり注目がいくけど
戦いの最中に打つアルファの一手を見る分には
「今までの碁の教えはほとんど正しかった」
の観を強くしましたけどね 実は自分の学んだ、この局面この一手、と、アルファの手は
ほぼ一致する
トッププロもこういうところは逃さないぜ という手もアルファも逃さない
序中盤の戦いはすごく勉強になる再復習になったというべきか
柯潔にしろイセドルにしろ結局3時間の国際線で相手をうまく打枕化して
勝つ語にすぎない だからアルファに勝てない
そうではなく布石50手の段階までは二日も三日もかけて恐ろしく良く考えてうち
その後普通に打てば、けっして後れを取ることはなかろう
そうすれば本気のアルファの寄席、神の寄席を見られたかもしれない 惜しい
俺はそう思う 人間側にミスが多すぎる
人間に、特に布石をしっかりやって、勝負を見てみたいのだが
もうアルファは人間とやらないんだってね 序盤から中盤の入り口くらいまでは、もしかしたら・・・と思わせるところも
あったんだけど、終盤になってどうやっても勝ち目がないことに気づかされた時の
絶望感。
カケツも心が折れるよね。 人工知能と同じ土俵でやってる今の人間が凄いのであって普通人工知能に持ち時間あっても人間は無制限やろ アルファ碁同士の棋譜公開 碁界騒然「見たことない」
http://www.asahi.com/articles/ASK610JLRK50UCVL03K.html?iref=sptop_8_01
> 手数が進んだ特殊な状況に限り有効とされていた
「星への三々(さんさん)入り」を序盤の早いうちに互いに打ち合ったり、
双方の石がぶつかり合って手抜きがしにくい接触戦のさなかに戦いを放置して他方面に転戦したり。
これまでの常識では考えられない着手の連続にプロ棋士らは驚愕(きょうがく)した。 >>85
イセドル戦の第4局はアルファ先生が自分で転んだんだけどね。
「コウ」の評価を正しく計算できない欠点は自己対戦では解決できずに、
そういう問題があることにハサビスたちも気づかないまま
欠点が残ったままイセドルと対局したからね。
他の4局は大差だったし、もう去年の時点で棋力の差はハッキリしてたと思う。
それより、カケツが第2局で100手目付近まで大きく離されずについていったのが
すごいと思う。人類が途中までとはいえ、ほぼ互角に戦った最初で最後の棋譜だからね。
(これも最後は大差になったけど・・・・) >接触戦のさなかに戦いを放置して他方面に転戦したり
これだな
接触戦が一段落して
そこでの一手の価値が低下したときに
他へ転ずるというのが常識なわけだけど、
その「価値」の見立てがこれまではアバウトすぎた
(わるく言えば、思考停止していた)ということが判明したわけだ コウがらみで乱れたのは2,3局目だろ?
4局目の勝利は、一本道の正着を見つけるのが苦手なAIの性質が出て酷く乱れたのが要因 セドルの勝利はまさにAI特有の弱点を突いた見事なものだったな
カケツ戦のAlphagoはその弱点を克服していたのか、カケツにそういう局面に誘導するチャンスがなかっただけなのかわからんけど、完敗と言っていいだろう
セドルの方が強いという気は全然ないけど、運命がセドルに微笑んだとしか言えない
セドルも普通に全敗して終わる可能性の方が高かった >>89,>>91
違うよ。アルファ碁は1か月間に2900万局を超える自己対戦で強くなっていったんだけど、
ある局面で自分の弱点(例えば自分が不利なのに有利だと判断するとか)は、
自分がその弱点部分をスルーするのと同時に対戦相手も(自分自身なので)スルーしてしまう。
で、弱点が修正されることなく残ってしまう。
(だからトッププロと対戦して自己対戦で修正できない弱点をさらけ出してもらう必要があった)
今年のバージョンではそういう弱点を自己対戦で修正するためのアルゴリズムを開発して
組み込んである。だからセドル戦のようなことはおこらない。
master戦はそれを確認するための、トップ棋士との60戦60連勝だった。
アルファ碁が苦手としていたあらゆる局面を自己対戦で修正し、人間には負けないレベルに
到達したことを証明したんだ。
自己対戦で自分の間違いを修正することができる、このことがこれからのAIの開発と進歩で
もっとも大きなポイントになるし、グーグルはその第一歩を歴史に残した。
これが大事。 >>92
なんか中の人というか、AIの自己紹介みたいな文章だな(褒めてる) >>92
じゃあそのアルゴリズムを作らないと
zenは一生終盤が弱いままなのか? というかこの一年でアルファ碁にそんなブレイクスルーが起きてたなんて初めて聞いたけど本当なの? >>92
そういうソースがあれば見せてほしい
2900万局で君の言うような欠陥があったとしても、それがセドル戦での発狂にどう繋がるかが全く説明できない
アルゴリズムの欠陥として長手数の詰碁的局面が苦手だったとしたら
評価関数の最適化だけで克服できるとは思えないんだよね
今までのアルファ碁が苦手としていた局面が偶然セドル戦で出てきただけ、なんてのもちょっと可能性としては考えにくい
頻繁にそんな局面が出るようなAlphagoであればもうちょっと楽に勝ててただろう
ソースがあれば謝ります そりゃセドル戦で4勝1敗だったアルファ碁のデータで
2017のアルファ碁と戦ったら石3つ置いてようやく戦えるとこまで来てるし
カケツと戦ったアルファ碁は1年前より圧倒的に強い
セドルに勝った直後のアルファ碁は
今のアルファ碁に歯が立たない
対戦するごとにバグや弱点は減って強さは増す一方で一生衰えない、それがAIだし 多少バグ残ってても
もう人間がどうこうできるレベルじゃないからどうでもいいだろう
ここ1年でプロ相手に64連勝だっけ?カケツが打っても歯が立たない
もうプロに1000連勝しても不思議じゃない
世界一の棋士相手にアルファ先生が指導碁を打ってあげてって感じじゃん アルファ碁の基本構造がセドル戦から変わっていないとするならば、
強化学習の対象はRL-PolicyとValueの2つ。
公開された50局の自己対局棋譜は強化学習でも何でもないただのテストプレイ。
この2つのディープネットワークは、アルファ碁の「直感」に相当する。
RL-Policyで、どの手を重点的に読むのかを選択する事で、持ち時間をどの手に
費やすかを決める。ここの精度が高まり、良いと評価した手と悪いと評価した手の
差が大きくなる事で、持ち時間をより狭い範囲の探索に集中でき、長い手筋を読む
力が増加する。ただし、間違いがあると手の見落としが生じる。
Valueはぱっと見の盤面の評価で良し悪しを判断すう。その事で、モンテカルロの
ロールアウト特有の隘路問題を避ける事ができる。
モンテカルロベースである以上、モンテカルロのランダムプレイは必要不可欠であり、
これまでのMCTSではロールアウト関数をより強いものにしようと言う努力がなされて
いたが、アルファ碁は恐らくロールアウト用のPolicyは手を簡素なものにして、上述の
直感の精度を、強化学習によって高める事で、強くなっていく方向。
個人的には、モンテカルロを除くと、かなり人間の思考に近づいていると思う。 アルファ碁の自己対決の50戦は白は何勝してる?
勝敗表無い? >>100
勝敗表は無いけど、白勝率8〜9割くらいだと思う。 >>102
うん。コミとか含めて話題になってる。
最初の10対戦が白9勝1敗、次の10対戦が白8勝2敗とかだったと記憶している。 人間は黒ばっか元気して白はあんまり研究してないんだろ >>95,>>96
米グーグルの人工知能(AI)「アルファ碁」が世界最強のプロ棋士、中国の柯潔(か・けつ)九段(19)との三番勝負で全勝した。
生みの親で同社グループのAIベンチャー、英ディープマインドの最高経営責任者(CEO)、デミス・ハサビス氏(40)は日本経済新聞の取材に応じ、
AI研究の進捗について「正しいはしごを登り始めた」と手応えを示した。
「このはしごはとても高く、何段あるかわからない。ただ、AIの歴史は誤ったはしごに登っては下りるの繰り返しだった。
『正しいはしご』にたどり着いたのは、大きい」
以上、ハサビス談
「深層学習」と「強化学習」の組み合わせというアルゴリズムの実用化が今回のアルファ碁のテーマの一つです。
master 版での対局と今回のカケツとの対局は、いわばその実証実験で、63連勝無敗の結果から
このアルゴリズムの有用性を目に見える形で実証できたと考えます。
詳細は今年中に発表する論文ですべて明らかにする予定です。 >>106
>>106と>>92にはかなり飛躍があると思うが… >>103
まあコミは人間が決めたものだからな
しょっちゅう変わってるし >>92
自己対局のイメージが間違っている。
学習しているのはポリシーネット部分。
学習というのは、ぶっちゃけ、ネットワーク内部のウェイトを計算により微調整する事。
ポリシーネットは、学習対象の他、過去に学習対象に負け越したものが一杯プール
されていて、それらが対戦相手となる。自己と対戦し続けているわけではない。
最初に学習対象のネットワークを用意したら、それのコピーをプールに入れる。
その2つで対戦させて強化学習。勝ち越しの閾値を超えたら、学習対象のコピーを
プールに追加して、2つのネットワークとランダムに対戦させる。勝ち越し閾値を超え
たら、同様にコピーをプールに追加して、3つのネットワークとランダムに対戦させる・・・。
コピーをプールに追加するのを世代と呼ぶ。
最初の論文で、10000世代まで強化学習させたと書いてあったはず。
最初の一番弱い奴までプールに入れてあるのは、>>92で言うところの自己対戦に
よる過学習を防ぐためのもの。対戦相手の多様性を保つための工夫。
また、ε-greedyを採用して、学習対象のネットワークは、一定確率で敢えてランダム
に手を着手して、今の手が最善なのか、違うかを確認している。これも過学習防止策。
これらは特別なアルゴリズムでもなければ、「特定の弱点を修正するための方法」は
大抵、別の大きな弊害をもたらす事から、そういう付け焼刃な対処をしていないと、
考えるのが自然。 AlphaGo 九段にはほぼ勝てないが
その上で勝つ為の正攻法 ( ある意味 AI ( AL ) の盲点 ) はなくはない ( → 柯潔 vs AlphaGo スレ ) さんたてのどこが…
プロにくくると、セドルのバクお情け1勝のあと全敗 ☆ 私たち日本人の、日本国憲法を改正しましょう。現在、
衆議員と参議院の両院で、改憲議員が3分の2を超えております。
総務省の、『憲法改正国民投票法』、でググってみてください。
国会の発議は可能です。平和は勝ち取るものです。お願い致します。☆☆ ■ このスレッドは過去ログ倉庫に格納されています