__Alpha Go vs 柯潔が意外にも接戦だった件__ [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
アルファ碁は一切の隙を与えない、完璧に勝ちに行く布陣で臨んだのか意外にも接戦だったな。
滅茶苦茶強くなってると言われてたが、そこまでの強さは感じなかった。 まあ勿論、柯潔が滅茶苦茶強いという事はあるが。
アルファ碁は鬼神の様な強さを想像したが、そこまででは無かった。 >>3
これ
AIは1目半で勝つように調整されてる
半目だとちょっとした手違いで発狂負けするかもしれない
2目半だとガチ接戦になって1目半以内の差になったら発狂して負けるかもしれない
誤差を加味して余裕をもって1目半
人間が勝つには半目差で終盤まで持っていかないといけない ハサビスがインタビューで言ってたとおりだよ。
勝ちの確率が最大になる手を選ぶようにプログラムしているのであって、
石の差が最大になるように勝ちの手順を選ぶわけではない。
序盤から中盤で有利になったとたんに緩んだようにみえたり、疑問手に見えるような手は
差が縮まっても、あるいはリードした分の一部を犠牲にしても全体として勝つ確率が最大、
つまり負ける可能性が最小、逆転される可能性が最小の手を選んでいるだけ。
だから途中で差が縮まったように見えても、逆転の目は全くない変化に入っているということ。
内容的には大差だよ。何度やっても勝てないレベルだよ。 ちくんが30手くらいでアルファ碁勝ち確定みたいなこといってたろ
相当さがある >>3
別ソフトも同じ判断してたな
途中からalphaGoの優勢が揺らがなかったみたい 俺クラスになれば分かるが、アルファ碁も伸びシロは余り無い感じだな。 >>9
>それで石塔しぼり
今のバージョンには通用しない。 柯潔と1000回やって1000勝出来る能力があるかどうかだな。 >>13
>柯潔と1000回やって1000勝出来る能力があるかどうかだな。
もちろん、アルファ碁にはあるんだが、柯潔には999連敗したあとに1000戦目を戦う気力は
ないと思う。 >>15
この天井を越えないとAIはいつまでも次のステージには立てないだろうな 人間が勝つのは簡単で、コミをアルファ碁側に黙って変えて
アルファ碁側が一目半勝ったと思ったら実は半目負けてた
とすればよい。 >>21
それで本当に狙って1目半か検証できるかもな アルファ碁が地を最大にして勝つようプログラムされてたなら、アルファ碁同士の対局で本当に適切なコミが明らかになるかもしれないのに残念 ちがうだろ
地の最大化を目的にしたら
たとえ勝率が下がろうとも
模様を思い切り広げて相手に入ってこさせて
無理に殺しにいくような打ち方をしてしまうぞ
適切なコミを知りたいなら、
コミを1目ずつずらしながら
勝率優先という条件で最強AI同士をたくさん対局させて、
ちょうど勝率が50:50に最も近づく地点を調べればいい モンテカルロから脱せたら最適コミわかるんやろうけどな 全自動接待モード内蔵により
虐殺されてる感
がないからいいんじゃね https://pbs.twimg.com/media/DAkDai-XUAEtKtY.jpg
今のmasterは対セドル版のアルファ碁に3子置かせても勝てるんだから
カケツやセドルなんかは5子置かせてもらっていい勝負
互先で勝てるわけがない >>12
セドルの石塔絞り攻撃も通用しなかったじゃんw 60番勝負の棋譜は貴重だな
カケツも当然研究してるだろうけど勝つためというより研鑽のためにいろいろやるだろ >>1
カケツとやって1目半
お前とやっても1目半
これに戦慄を覚えないようなら会話が成り立たんな 九段が五人集まってもアルファ碁が勝ったからな。
もう人間のレベルは完全に超越している。 >>1
年始の60戦でもMasterと半目差の対局あったやん
別に驚くことでもない 自己対戦内の勝率は黒がいいのかな、発表は無いけれど 年末の対局って半目・一目半以外の数え碁なかったっけ?
絶対半目一目半になるって書いてるやつばっかりだけども 極論を言うと「半目で勝つ」が指し手が最善の手なんだよ
アルファ碁は本当に「一目半で勝つ」を狙って指してるのか? 永遠に詰まらない一目半の差ってとこだね
ヨセになるとどんどん詰まっていくけど
逆転はしないのがアルファ碁
逆転する手を打たれるのがその他のAI
アルファ碁は勝敗不明の手順を避けるうまい手法を
採用しているように感じる
単純に完成度の差なのかもしれないが どうしようもないバカが多いな
べつに半目勝ちが最善なわけじゃない
そもそもこいつらは何をもってして「最善」なんていってんのかすら不明だが >>48を翻訳すると
なぜ「最善」なのか教えてください靴ペロペロ 鉄のゴールキーパーとの対局で六半とかあったはず
モンテカルロだからといって必ず0.5になるとかはない だから何度も言われてるけど、10目とかつけて勝つんじゃなくて
一目半だかでの勝ちを目指してるんだよ
無茶して形勢傾けるより、勝ち確の手を追求してるだけ
要結局は前から言われてるように金融取引だとか自動運転とか医療診断に応用するのが最終目標なんだから
正解までの道筋さえできたら後は事故やミス少なくする方向に行くんだよ 小さい差で勝つのは応用するものとか関係なく、もともと囲碁に関してはそうした方が強くなるというだけだ
最大目差で勝つほうが強くなるんなら、そういう風に作られてるよ ギリ勝ちも大勝も値打ちは同じ。
勝率を高めるようプログラムされてる。 別に1目半(中国ルールでは半目)の勝ちを目指しているわけではない。
途中で圧倒的な大差がついたら、終局に向かって勝率が高い紛れの無い手
を選択するうちに差が半目まで縮む事もあるというだけの事。
対戦相手が真剣に負け差を減らしてくると、半目差になっちゃうだけだと思う。
その辺の下手っぴだと、大差負けのままだと思う。 目指すっていうより「収束する」が正しい
終盤になればなるほど
「Aの手を選べば勝率100% 石は1個損する」
「Bの手を選べば勝率100% 石は1個得する」
こういう構図が増えてくる
アルファ碁はどちらにしても勝ちだから石の損得は気にせず選択する
結果、確率的に半目差に収束することが多いというだけ 圧倒的大差だろ
100局やっても一回も勝てないんじゃね? 別にカケツをボコボコにして
囲碁界を破壊するのが目的じゃないしな
とりあえず、誰が打ってもノーチャンス 第二戦は百手まで接戦だったらしいからアルファ碁にも限界あるんじゃない? >>59
人間業とは思えん
やっぱり強かったんだな >.>59
接戦というのは形勢に大きく差がつかなかったとアルファが自分で判断していただけで、
カケツがわずかでもリードした局面は一度もなかった。
by アルファ碁 アルファ碁が多少弱くなってもいいから市販化
されないかな >>56
100%はそれから先勝敗が決まるまでの全パターンを知らなくてはいけないから無理なので
経験したことのある?確率で差を見るとたまたまの偶然で99.82%と99.83%だったりすると後者を選ぶとか
そんあところはないのかな? DeepZenGoはヨセの損で逆転負けしていたわけで
ヨセで損をしても決して逆転は許さない
というのはキチンとプログラムされているってことだ 正直もう1年あれば
プロ相手に64連勝中のアルファ碁も
1年前は雑魚だったねってレベルまで行くんだろ
もう○○だったら負けてたとか虚しいだけだよ
プログラマが本気で囲碁攻略しようとしてるかどうかだけ
今回みたいに大企業が金とやる気出してチーム組んでアルファ碁みたいなの作れば
囲碁のトッププロの1000年が小規模チームに3年で消し飛ばされる
そのうち今の2017年版アルファ碁も雑魚でしかなかったってなるし ってかAIと人間が対局すること自体がおかしい
ゲームのチートユーザーと一般プレイヤーが戦うようなもの
負けて当然で、勝とうとするほうがおかしい 去年までプロ相手ならたまに負けてたアルファ碁も
今じゃプロ相手にギリギリの接戦になる程度にわざわざ自分で
凡ミスして戦局を調整しながら最後は1目半程度だけしっかり勝ちきる余裕あるもんな
去年の時点でプロでも勝てないのに
2017のアルファ碁はそれより3石分強いとかもう勝てるはずがない
大差になりそうになったら自分からミスしてギリギリの勝負にしてくれる接待機能付きだよ トップ倒すまでは興行として優秀だからおかしくはないんじゃないかな
戦わないと話題性は低いからAI戦術取り込むのも遅くなって囲碁の進化も遅れる AI戦術って言うけど最終的には
候補の手から先の展開を数千万パターンとかの中から一瞬で計算して
その中から一番安定して勝てる手を選び続けるようになるんだろAIは
最終段階まで行けばこの状況にはこれが最適ってのは分かるかもしれんが
その前にアルファ君引退しちゃったし
アルファ君はどう打たれてもすぐに先を計算して対応するから打てるけど人間には無理とか沢山あるだろう
人間が数百のパターン考える間にAIが1億パターンとか計算してるならどうしようもないよ 御城碁19連勝の本因坊秀策が現代に居ればマスターなどやっつけてくれたものを……… プロがAI戦術取り入れるのはAIを倒すのを目標としてなくて囲碁の進化のため
これから常識が変わってどんどん面白くなってくるはず 人間にAIに勝つのはもう無理だよ
どんな天才が出ても無理、本因坊でも無理
今のアルファ碁でトッププロ相手に3子置かせるくらいは強い
来年だと5子置いて互角くらいじゃないの
再来年だと更に強いだろう
2017の時点でトッププロ相手にミスしても手抜きでも勝てるくらいの強さ
開発が進めばこれから更に強くなる子供のような状態でこれ >>63
絶対的な100%じゃなくて統計上の100%っていうこと
全パターンが100億パターンあったとしても、5000通り検索してすべて結果が100%だったら
すべて100%である可能性が極めて高いっていう結論が得られるから
「出そうな手」だけを数千から数万パターン考えてシミュレートすれば実質的な100%は出せる 競馬もそうだが惜しいと勝つでは雲泥の差なんだよなあ 確率高い手で囲碁のベースが上がるのはいいけど悪手とか未知の手でも意地張り合って勝つとか
ああいう醍醐味が少なくなったら悲しいなあ 皆は見たことない手にばかり注目がいくけど
戦いの最中に打つアルファの一手を見る分には
「今までの碁の教えはほとんど正しかった」
の観を強くしましたけどね 実は自分の学んだ、この局面この一手、と、アルファの手は
ほぼ一致する
トッププロもこういうところは逃さないぜ という手もアルファも逃さない
序中盤の戦いはすごく勉強になる再復習になったというべきか
柯潔にしろイセドルにしろ結局3時間の国際線で相手をうまく打枕化して
勝つ語にすぎない だからアルファに勝てない
そうではなく布石50手の段階までは二日も三日もかけて恐ろしく良く考えてうち
その後普通に打てば、けっして後れを取ることはなかろう
そうすれば本気のアルファの寄席、神の寄席を見られたかもしれない 惜しい
俺はそう思う 人間側にミスが多すぎる
人間に、特に布石をしっかりやって、勝負を見てみたいのだが
もうアルファは人間とやらないんだってね 序盤から中盤の入り口くらいまでは、もしかしたら・・・と思わせるところも
あったんだけど、終盤になってどうやっても勝ち目がないことに気づかされた時の
絶望感。
カケツも心が折れるよね。 人工知能と同じ土俵でやってる今の人間が凄いのであって普通人工知能に持ち時間あっても人間は無制限やろ アルファ碁同士の棋譜公開 碁界騒然「見たことない」
http://www.asahi.com/articles/ASK610JLRK50UCVL03K.html?iref=sptop_8_01
> 手数が進んだ特殊な状況に限り有効とされていた
「星への三々(さんさん)入り」を序盤の早いうちに互いに打ち合ったり、
双方の石がぶつかり合って手抜きがしにくい接触戦のさなかに戦いを放置して他方面に転戦したり。
これまでの常識では考えられない着手の連続にプロ棋士らは驚愕(きょうがく)した。 >>85
イセドル戦の第4局はアルファ先生が自分で転んだんだけどね。
「コウ」の評価を正しく計算できない欠点は自己対戦では解決できずに、
そういう問題があることにハサビスたちも気づかないまま
欠点が残ったままイセドルと対局したからね。
他の4局は大差だったし、もう去年の時点で棋力の差はハッキリしてたと思う。
それより、カケツが第2局で100手目付近まで大きく離されずについていったのが
すごいと思う。人類が途中までとはいえ、ほぼ互角に戦った最初で最後の棋譜だからね。
(これも最後は大差になったけど・・・・) >接触戦のさなかに戦いを放置して他方面に転戦したり
これだな
接触戦が一段落して
そこでの一手の価値が低下したときに
他へ転ずるというのが常識なわけだけど、
その「価値」の見立てがこれまではアバウトすぎた
(わるく言えば、思考停止していた)ということが判明したわけだ コウがらみで乱れたのは2,3局目だろ?
4局目の勝利は、一本道の正着を見つけるのが苦手なAIの性質が出て酷く乱れたのが要因 セドルの勝利はまさにAI特有の弱点を突いた見事なものだったな
カケツ戦のAlphagoはその弱点を克服していたのか、カケツにそういう局面に誘導するチャンスがなかっただけなのかわからんけど、完敗と言っていいだろう
セドルの方が強いという気は全然ないけど、運命がセドルに微笑んだとしか言えない
セドルも普通に全敗して終わる可能性の方が高かった >>89,>>91
違うよ。アルファ碁は1か月間に2900万局を超える自己対戦で強くなっていったんだけど、
ある局面で自分の弱点(例えば自分が不利なのに有利だと判断するとか)は、
自分がその弱点部分をスルーするのと同時に対戦相手も(自分自身なので)スルーしてしまう。
で、弱点が修正されることなく残ってしまう。
(だからトッププロと対戦して自己対戦で修正できない弱点をさらけ出してもらう必要があった)
今年のバージョンではそういう弱点を自己対戦で修正するためのアルゴリズムを開発して
組み込んである。だからセドル戦のようなことはおこらない。
master戦はそれを確認するための、トップ棋士との60戦60連勝だった。
アルファ碁が苦手としていたあらゆる局面を自己対戦で修正し、人間には負けないレベルに
到達したことを証明したんだ。
自己対戦で自分の間違いを修正することができる、このことがこれからのAIの開発と進歩で
もっとも大きなポイントになるし、グーグルはその第一歩を歴史に残した。
これが大事。 >>92
なんか中の人というか、AIの自己紹介みたいな文章だな(褒めてる) >>92
じゃあそのアルゴリズムを作らないと
zenは一生終盤が弱いままなのか? というかこの一年でアルファ碁にそんなブレイクスルーが起きてたなんて初めて聞いたけど本当なの? >>92
そういうソースがあれば見せてほしい
2900万局で君の言うような欠陥があったとしても、それがセドル戦での発狂にどう繋がるかが全く説明できない
アルゴリズムの欠陥として長手数の詰碁的局面が苦手だったとしたら
評価関数の最適化だけで克服できるとは思えないんだよね
今までのアルファ碁が苦手としていた局面が偶然セドル戦で出てきただけ、なんてのもちょっと可能性としては考えにくい
頻繁にそんな局面が出るようなAlphagoであればもうちょっと楽に勝ててただろう
ソースがあれば謝ります そりゃセドル戦で4勝1敗だったアルファ碁のデータで
2017のアルファ碁と戦ったら石3つ置いてようやく戦えるとこまで来てるし
カケツと戦ったアルファ碁は1年前より圧倒的に強い
セドルに勝った直後のアルファ碁は
今のアルファ碁に歯が立たない
対戦するごとにバグや弱点は減って強さは増す一方で一生衰えない、それがAIだし 多少バグ残ってても
もう人間がどうこうできるレベルじゃないからどうでもいいだろう
ここ1年でプロ相手に64連勝だっけ?カケツが打っても歯が立たない
もうプロに1000連勝しても不思議じゃない
世界一の棋士相手にアルファ先生が指導碁を打ってあげてって感じじゃん アルファ碁の基本構造がセドル戦から変わっていないとするならば、
強化学習の対象はRL-PolicyとValueの2つ。
公開された50局の自己対局棋譜は強化学習でも何でもないただのテストプレイ。
この2つのディープネットワークは、アルファ碁の「直感」に相当する。
RL-Policyで、どの手を重点的に読むのかを選択する事で、持ち時間をどの手に
費やすかを決める。ここの精度が高まり、良いと評価した手と悪いと評価した手の
差が大きくなる事で、持ち時間をより狭い範囲の探索に集中でき、長い手筋を読む
力が増加する。ただし、間違いがあると手の見落としが生じる。
Valueはぱっと見の盤面の評価で良し悪しを判断すう。その事で、モンテカルロの
ロールアウト特有の隘路問題を避ける事ができる。
モンテカルロベースである以上、モンテカルロのランダムプレイは必要不可欠であり、
これまでのMCTSではロールアウト関数をより強いものにしようと言う努力がなされて
いたが、アルファ碁は恐らくロールアウト用のPolicyは手を簡素なものにして、上述の
直感の精度を、強化学習によって高める事で、強くなっていく方向。
個人的には、モンテカルロを除くと、かなり人間の思考に近づいていると思う。 アルファ碁の自己対決の50戦は白は何勝してる?
勝敗表無い? >>100
勝敗表は無いけど、白勝率8〜9割くらいだと思う。 >>102
うん。コミとか含めて話題になってる。
最初の10対戦が白9勝1敗、次の10対戦が白8勝2敗とかだったと記憶している。 人間は黒ばっか元気して白はあんまり研究してないんだろ >>95,>>96
米グーグルの人工知能(AI)「アルファ碁」が世界最強のプロ棋士、中国の柯潔(か・けつ)九段(19)との三番勝負で全勝した。
生みの親で同社グループのAIベンチャー、英ディープマインドの最高経営責任者(CEO)、デミス・ハサビス氏(40)は日本経済新聞の取材に応じ、
AI研究の進捗について「正しいはしごを登り始めた」と手応えを示した。
「このはしごはとても高く、何段あるかわからない。ただ、AIの歴史は誤ったはしごに登っては下りるの繰り返しだった。
『正しいはしご』にたどり着いたのは、大きい」
以上、ハサビス談
「深層学習」と「強化学習」の組み合わせというアルゴリズムの実用化が今回のアルファ碁のテーマの一つです。
master 版での対局と今回のカケツとの対局は、いわばその実証実験で、63連勝無敗の結果から
このアルゴリズムの有用性を目に見える形で実証できたと考えます。
詳細は今年中に発表する論文ですべて明らかにする予定です。 >>106
>>106と>>92にはかなり飛躍があると思うが… >>103
まあコミは人間が決めたものだからな
しょっちゅう変わってるし >>92
自己対局のイメージが間違っている。
学習しているのはポリシーネット部分。
学習というのは、ぶっちゃけ、ネットワーク内部のウェイトを計算により微調整する事。
ポリシーネットは、学習対象の他、過去に学習対象に負け越したものが一杯プール
されていて、それらが対戦相手となる。自己と対戦し続けているわけではない。
最初に学習対象のネットワークを用意したら、それのコピーをプールに入れる。
その2つで対戦させて強化学習。勝ち越しの閾値を超えたら、学習対象のコピーを
プールに追加して、2つのネットワークとランダムに対戦させる。勝ち越し閾値を超え
たら、同様にコピーをプールに追加して、3つのネットワークとランダムに対戦させる・・・。
コピーをプールに追加するのを世代と呼ぶ。
最初の論文で、10000世代まで強化学習させたと書いてあったはず。
最初の一番弱い奴までプールに入れてあるのは、>>92で言うところの自己対戦に
よる過学習を防ぐためのもの。対戦相手の多様性を保つための工夫。
また、ε-greedyを採用して、学習対象のネットワークは、一定確率で敢えてランダム
に手を着手して、今の手が最善なのか、違うかを確認している。これも過学習防止策。
これらは特別なアルゴリズムでもなければ、「特定の弱点を修正するための方法」は
大抵、別の大きな弊害をもたらす事から、そういう付け焼刃な対処をしていないと、
考えるのが自然。 AlphaGo 九段にはほぼ勝てないが
その上で勝つ為の正攻法 ( ある意味 AI ( AL ) の盲点 ) はなくはない ( → 柯潔 vs AlphaGo スレ ) さんたてのどこが…
プロにくくると、セドルのバクお情け1勝のあと全敗 ☆ 私たち日本人の、日本国憲法を改正しましょう。現在、
衆議員と参議院の両院で、改憲議員が3分の2を超えております。
総務省の、『憲法改正国民投票法』、でググってみてください。
国会の発議は可能です。平和は勝ち取るものです。お願い致します。☆☆ ■ このスレッドは過去ログ倉庫に格納されています