X



__Alpha Go vs 柯潔が意外にも接戦だった件__ [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0001 ◆XWA0cCl.Lw
垢版 |
2017/05/23(火) 17:45:21.43ID:xWkpVgoF
アルファ碁は一切の隙を与えない、完璧に勝ちに行く布陣で臨んだのか意外にも接戦だったな。
滅茶苦茶強くなってると言われてたが、そこまでの強さは感じなかった。
0002 ◆XWA0cCl.Lw
垢版 |
2017/05/23(火) 17:48:20.05ID:xWkpVgoF
まあ勿論、柯潔が滅茶苦茶強いという事はあるが。
アルファ碁は鬼神の様な強さを想像したが、そこまででは無かった。
0003名無し名人
垢版 |
2017/05/23(火) 19:06:38.71ID:WVKLMLsB
勝ち確後の舐めプだぞ
0004名無し名人
垢版 |
2017/05/23(火) 19:09:51.85ID:EXm4qFm6
AIには無理とされてる接待機能やぞ
0006名無し名人
垢版 |
2017/05/23(火) 20:07:18.11ID:fI3sOrxV
>>3
これ
AIは1目半で勝つように調整されてる
半目だとちょっとした手違いで発狂負けするかもしれない
2目半だとガチ接戦になって1目半以内の差になったら発狂して負けるかもしれない
誤差を加味して余裕をもって1目半
人間が勝つには半目差で終盤まで持っていかないといけない
0007名無し名人
垢版 |
2017/05/23(火) 20:20:39.47ID:38nxA9PD
ハサビスがインタビューで言ってたとおりだよ。

勝ちの確率が最大になる手を選ぶようにプログラムしているのであって、
石の差が最大になるように勝ちの手順を選ぶわけではない。

序盤から中盤で有利になったとたんに緩んだようにみえたり、疑問手に見えるような手は
差が縮まっても、あるいはリードした分の一部を犠牲にしても全体として勝つ確率が最大、
つまり負ける可能性が最小、逆転される可能性が最小の手を選んでいるだけ。

だから途中で差が縮まったように見えても、逆転の目は全くない変化に入っているということ。

内容的には大差だよ。何度やっても勝てないレベルだよ。
0008名無し名人
垢版 |
2017/05/23(火) 20:26:32.25ID:+IosSBko
ちくんが30手くらいでアルファ碁勝ち確定みたいなこといってたろ
相当さがある
0010名無し名人
垢版 |
2017/05/23(火) 22:14:12.19ID:/A3mh6gF
>>3
別ソフトも同じ判断してたな
途中からalphaGoの優勢が揺らがなかったみたい
0011 ◆XWA0cCl.Lw
垢版 |
2017/05/23(火) 22:27:49.55ID:xWkpVgoF
俺クラスになれば分かるが、アルファ碁も伸びシロは余り無い感じだな。
0012名無し名人
垢版 |
2017/05/23(火) 22:29:24.26ID:38nxA9PD
>>9
>それで石塔しぼり

今のバージョンには通用しない。
0013 ◆XWA0cCl.Lw
垢版 |
2017/05/23(火) 22:31:26.22ID:xWkpVgoF
柯潔と1000回やって1000勝出来る能力があるかどうかだな。
0014名無し名人
垢版 |
2017/05/23(火) 22:31:36.03ID:8F3WsZ6E
人間界辛いな
0015 ◆XWA0cCl.Lw
垢版 |
2017/05/23(火) 22:32:27.07ID:xWkpVgoF
まあ、人工知能の一つの天井は見えたな。
0016名無し名人
垢版 |
2017/05/23(火) 22:57:07.06ID:38nxA9PD
>>13
>柯潔と1000回やって1000勝出来る能力があるかどうかだな。

もちろん、アルファ碁にはあるんだが、柯潔には999連敗したあとに1000戦目を戦う気力は
ないと思う。
0017名無し名人
垢版 |
2017/05/23(火) 23:04:29.18ID:2rTi+aHd
>>15
この天井を越えないとAIはいつまでも次のステージには立てないだろうな
0018名無し名人
垢版 |
2017/05/23(火) 23:04:40.53ID:y4WUE4j3
>>16
すぐにまた入院するだろうな
0019名無し名人
垢版 |
2017/05/23(火) 23:06:21.54ID:Y2E9cdM1
ふむ
コンピューターは鬱にならんし疲れない
0020名無し名人
垢版 |
2017/05/24(水) 01:00:26.66ID:odHZtuz4
一発入れたいなあ
0021名無し名人
垢版 |
2017/05/24(水) 01:16:39.19ID:L9xgaK1b
人間が勝つのは簡単で、コミをアルファ碁側に黙って変えて
アルファ碁側が一目半勝ったと思ったら実は半目負けてた
とすればよい。
0022名無し名人
垢版 |
2017/05/24(水) 01:22:05.07ID:z3NYv1lj
>>21
それで本当に狙って1目半か検証できるかもな
0023名無し名人
垢版 |
2017/05/24(水) 01:42:20.43ID:4cruZ/af
アルファ碁が地を最大にして勝つようプログラムされてたなら、アルファ碁同士の対局で本当に適切なコミが明らかになるかもしれないのに残念
0024名無し名人
垢版 |
2017/05/24(水) 01:53:40.97ID:12l+ufDx
ちがうだろ

地の最大化を目的にしたら
たとえ勝率が下がろうとも
模様を思い切り広げて相手に入ってこさせて
無理に殺しにいくような打ち方をしてしまうぞ


適切なコミを知りたいなら、
コミを1目ずつずらしながら
勝率優先という条件で最強AI同士をたくさん対局させて、
ちょうど勝率が50:50に最も近づく地点を調べればいい
0025名無し名人
垢版 |
2017/05/24(水) 01:55:45.00ID:b4E2b4WU
モンテカルロから脱せたら最適コミわかるんやろうけどな
0026名無し名人
垢版 |
2017/05/24(水) 15:20:01.99ID:8jlMWWgE
全自動接待モード内蔵により
虐殺されてる感
がないからいいんじゃね
0028名無し名人
垢版 |
2017/05/24(水) 15:37:33.31ID:N4yT/kYN
>>12
セドルの石塔絞り攻撃も通用しなかったじゃんw
0029名無し名人
垢版 |
2017/05/25(木) 00:24:13.78ID:/2nY8zuv
60番勝負の棋譜は貴重だな
カケツも当然研究してるだろうけど勝つためというより研鑽のためにいろいろやるだろ
0030名無し名人
垢版 |
2017/05/25(木) 06:22:27.02ID:WC3FU6PQ
>>1
あなた天才ですね!
0031名無し名人
垢版 |
2017/05/25(木) 06:25:32.59ID:WC3FU6PQ
>>1
どれ位の棋力なんですか?
0032名無し名人
垢版 |
2017/05/25(木) 13:46:03.77ID:WC3FU6PQ
アルファ碁から見て、盤面右下が鍵になって来る!
0033名無し名人
垢版 |
2017/05/25(木) 19:43:20.89ID:gFkbPE3/
人類二連敗
負け越し決定
0034名無し名人
垢版 |
2017/05/25(木) 23:10:21.85ID:PKIQR03r
カケツが弱く思えるほどだ
0035名無し名人
垢版 |
2017/05/25(木) 23:29:44.37ID:KaJ4ui7s
>>1
カケツとやって1目半
お前とやっても1目半

これに戦慄を覚えないようなら会話が成り立たんな
0037名無し名人
垢版 |
2017/05/26(金) 04:28:13.88ID:KPVPtbz9
俺がやったら30目は負けるが
0038名無し名人
垢版 |
2017/05/26(金) 12:16:39.83ID:Uum+03vd
塔屋が全部持碁にしたようなものか
0039名無し名人
垢版 |
2017/05/26(金) 18:38:42.13ID:8bbaFql9
九段が五人集まってもアルファ碁が勝ったからな。
もう人間のレベルは完全に超越している。
0040名無し名人
垢版 |
2017/05/26(金) 19:23:41.15ID:EXnW9rVk
  _  ∩
( ゚∀゚)彡 置き石!置き石!
 ⊂彡
0041名無し名人
垢版 |
2017/05/26(金) 19:24:15.43ID:ZdveiLPB
もし明日カケツが勝ったらヤラセだよね
0042名無し名人
垢版 |
2017/05/26(金) 20:42:00.95ID:v7q1AQDX
>>1
年始の60戦でもMasterと半目差の対局あったやん
別に驚くことでもない
0043名無し名人
垢版 |
2017/05/26(金) 21:05:17.37ID:q/EKS+v4
自己対戦内の勝率は黒がいいのかな、発表は無いけれど
0044名無し名人
垢版 |
2017/05/26(金) 22:04:36.25ID:HnyjWy6a
年末の対局って半目・一目半以外の数え碁なかったっけ?
絶対半目一目半になるって書いてるやつばっかりだけども
0045名無し名人
垢版 |
2017/05/26(金) 23:03:39.40ID:Zkm/fNzY
人間がヨセの最中にミスったら開くんじゃね
0046名無し名人
垢版 |
2017/05/26(金) 23:23:11.69ID:5pixL5wP
極論を言うと「半目で勝つ」が指し手が最善の手なんだよ

アルファ碁は本当に「一目半で勝つ」を狙って指してるのか?
0047名無し名人
垢版 |
2017/05/26(金) 23:37:48.44ID:SOW+W0Ok
永遠に詰まらない一目半の差ってとこだね
ヨセになるとどんどん詰まっていくけど
逆転はしないのがアルファ碁
逆転する手を打たれるのがその他のAI

アルファ碁は勝敗不明の手順を避けるうまい手法を
採用しているように感じる
単純に完成度の差なのかもしれないが
0048名無し名人
垢版 |
2017/05/27(土) 00:13:29.66ID:SiguDCfr
どうしようもないバカが多いな
べつに半目勝ちが最善なわけじゃない

そもそもこいつらは何をもってして「最善」なんていってんのかすら不明だが
0049名無し名人
垢版 |
2017/05/27(土) 10:40:46.39ID:QEZJqL+u
>>48を翻訳すると

なぜ「最善」なのか教えてください靴ペロペロ
0050名無し名人
垢版 |
2017/05/27(土) 10:51:59.99ID:1258zHNJ
猿は山に帰れよ
0051名無し名人
垢版 |
2017/05/27(土) 11:01:57.67ID:5i/1Q0/F
鉄のゴールキーパーとの対局で六半とかあったはず
モンテカルロだからといって必ず0.5になるとかはない
0052名無し名人
垢版 |
2017/05/27(土) 21:17:31.78ID:L4OUZN3f
だから何度も言われてるけど、10目とかつけて勝つんじゃなくて
一目半だかでの勝ちを目指してるんだよ
無茶して形勢傾けるより、勝ち確の手を追求してるだけ

要結局は前から言われてるように金融取引だとか自動運転とか医療診断に応用するのが最終目標なんだから
正解までの道筋さえできたら後は事故やミス少なくする方向に行くんだよ
0053名無し名人
垢版 |
2017/05/27(土) 21:33:41.56ID:FUdkMn8L
小さい差で勝つのは応用するものとか関係なく、もともと囲碁に関してはそうした方が強くなるというだけだ
最大目差で勝つほうが強くなるんなら、そういう風に作られてるよ
0054名無し名人
垢版 |
2017/05/27(土) 21:45:09.30ID:Ms3XAr0v
ギリ勝ちも大勝も値打ちは同じ。
勝率を高めるようプログラムされてる。
0055名無し名人
垢版 |
2017/05/27(土) 22:15:16.93ID:yuFydSpH
別に1目半(中国ルールでは半目)の勝ちを目指しているわけではない。

途中で圧倒的な大差がついたら、終局に向かって勝率が高い紛れの無い手
を選択するうちに差が半目まで縮む事もあるというだけの事。

対戦相手が真剣に負け差を減らしてくると、半目差になっちゃうだけだと思う。
その辺の下手っぴだと、大差負けのままだと思う。
0056名無し名人
垢版 |
2017/05/28(日) 04:19:29.76ID:pJuG6SiP
目指すっていうより「収束する」が正しい

終盤になればなるほど
「Aの手を選べば勝率100% 石は1個損する」
「Bの手を選べば勝率100% 石は1個得する」

こういう構図が増えてくる
アルファ碁はどちらにしても勝ちだから石の損得は気にせず選択する

結果、確率的に半目差に収束することが多いというだけ
0057名無し名人
垢版 |
2017/05/28(日) 07:47:17.56ID:YiUxCClb
圧倒的大差だろ

100局やっても一回も勝てないんじゃね?
0058名無し名人
垢版 |
2017/05/28(日) 07:56:17.63ID:fGPr4dmr
別にカケツをボコボコにして

囲碁界を破壊するのが目的じゃないしな

とりあえず、誰が打ってもノーチャンス
0059名無し名人
垢版 |
2017/05/28(日) 08:10:49.04ID:/dHW3fgc
第二戦は百手まで接戦だったらしいからアルファ碁にも限界あるんじゃない?
0060名無し名人
垢版 |
2017/05/28(日) 08:21:39.69ID:pd7f+o8x
>>59
人間業とは思えん
やっぱり強かったんだな
0061名無し名人
垢版 |
2017/05/28(日) 08:55:35.30ID:Ybenc316
>.>59
接戦というのは形勢に大きく差がつかなかったとアルファが自分で判断していただけで、
カケツがわずかでもリードした局面は一度もなかった。

by アルファ碁
0062名無し名人
垢版 |
2017/05/28(日) 12:00:06.29ID:pf1Yi/pm
アルファ碁が多少弱くなってもいいから市販化
されないかな
0063名無し名人
垢版 |
2017/05/28(日) 18:16:51.29ID:wNUHRrZ8
>>56
100%はそれから先勝敗が決まるまでの全パターンを知らなくてはいけないから無理なので
経験したことのある?確率で差を見るとたまたまの偶然で99.82%と99.83%だったりすると後者を選ぶとか
そんあところはないのかな?
0064名無し名人
垢版 |
2017/05/28(日) 19:29:36.77ID:PpbW8H3e
DeepZenGoはヨセの損で逆転負けしていたわけで
ヨセで損をしても決して逆転は許さない
というのはキチンとプログラムされているってことだ
0065名無し名人
垢版 |
2017/05/29(月) 13:30:58.43ID:Zs++9N16
一局目半目だったのかよ
zenだったら負けてたろ
0066名無し名人
垢版 |
2017/05/29(月) 14:44:14.27ID:AFv66ftL
正直もう1年あれば
プロ相手に64連勝中のアルファ碁も
1年前は雑魚だったねってレベルまで行くんだろ
もう○○だったら負けてたとか虚しいだけだよ
プログラマが本気で囲碁攻略しようとしてるかどうかだけ

今回みたいに大企業が金とやる気出してチーム組んでアルファ碁みたいなの作れば
囲碁のトッププロの1000年が小規模チームに3年で消し飛ばされる
そのうち今の2017年版アルファ碁も雑魚でしかなかったってなるし
0067名無し名人
垢版 |
2017/05/29(月) 14:47:02.19ID:fIUEu1oA
ってかAIと人間が対局すること自体がおかしい
ゲームのチートユーザーと一般プレイヤーが戦うようなもの
負けて当然で、勝とうとするほうがおかしい
0068名無し名人
垢版 |
2017/05/29(月) 14:51:12.76ID:AFv66ftL
去年までプロ相手ならたまに負けてたアルファ碁も
今じゃプロ相手にギリギリの接戦になる程度にわざわざ自分で
凡ミスして戦局を調整しながら最後は1目半程度だけしっかり勝ちきる余裕あるもんな

去年の時点でプロでも勝てないのに
2017のアルファ碁はそれより3石分強いとかもう勝てるはずがない
大差になりそうになったら自分からミスしてギリギリの勝負にしてくれる接待機能付きだよ
0069名無し名人
垢版 |
2017/05/29(月) 15:03:47.21ID:8GqRUj92
トップ倒すまでは興行として優秀だからおかしくはないんじゃないかな
戦わないと話題性は低いからAI戦術取り込むのも遅くなって囲碁の進化も遅れる
0070名無し名人
垢版 |
2017/05/29(月) 15:14:52.37ID:AFv66ftL
AI戦術って言うけど最終的には
候補の手から先の展開を数千万パターンとかの中から一瞬で計算して
その中から一番安定して勝てる手を選び続けるようになるんだろAIは
最終段階まで行けばこの状況にはこれが最適ってのは分かるかもしれんが
その前にアルファ君引退しちゃったし
アルファ君はどう打たれてもすぐに先を計算して対応するから打てるけど人間には無理とか沢山あるだろう

人間が数百のパターン考える間にAIが1億パターンとか計算してるならどうしようもないよ
0071名無し名人
垢版 |
2017/05/29(月) 15:54:11.15ID:kQ6wEtKN
御城碁19連勝の本因坊秀策が現代に居ればマスターなどやっつけてくれたものを………
0072名無し名人
垢版 |
2017/05/29(月) 16:44:53.94ID:8GqRUj92
プロがAI戦術取り入れるのはAIを倒すのを目標としてなくて囲碁の進化のため
これから常識が変わってどんどん面白くなってくるはず
0073名無し名人
垢版 |
2017/05/29(月) 16:58:29.13ID:AFv66ftL
人間にAIに勝つのはもう無理だよ
どんな天才が出ても無理、本因坊でも無理

今のアルファ碁でトッププロ相手に3子置かせるくらいは強い
来年だと5子置いて互角くらいじゃないの
再来年だと更に強いだろう

2017の時点でトッププロ相手にミスしても手抜きでも勝てるくらいの強さ
開発が進めばこれから更に強くなる子供のような状態でこれ
0074名無し名人
垢版 |
2017/05/29(月) 22:30:40.30ID:IWsieGYD
>>63
絶対的な100%じゃなくて統計上の100%っていうこと
全パターンが100億パターンあったとしても、5000通り検索してすべて結果が100%だったら
すべて100%である可能性が極めて高いっていう結論が得られるから

「出そうな手」だけを数千から数万パターン考えてシミュレートすれば実質的な100%は出せる
0075名無し名人
垢版 |
2017/05/30(火) 22:44:38.31ID:SoGBBpv1
実質的な100ってなんやねん
0076名無し名人
垢版 |
2017/05/30(火) 23:35:16.72ID:mPfuOgZR
競馬もそうだが惜しいと勝つでは雲泥の差なんだよなあ
0077名無し名人
垢版 |
2017/05/30(火) 23:49:18.12ID:d2mp60Me
確率高い手で囲碁のベースが上がるのはいいけど悪手とか未知の手でも意地張り合って勝つとか
ああいう醍醐味が少なくなったら悲しいなあ
0078名無し名人
垢版 |
2017/05/31(水) 09:32:38.76ID:Xo1ycD7d
皆は見たことない手にばかり注目がいくけど
戦いの最中に打つアルファの一手を見る分には

「今までの碁の教えはほとんど正しかった」
の観を強くしましたけどね
0079名無し名人
垢版 |
2017/05/31(水) 09:37:54.19ID:Xo1ycD7d
実は自分の学んだ、この局面この一手、と、アルファの手は
ほぼ一致する
トッププロもこういうところは逃さないぜ という手もアルファも逃さない
序中盤の戦いはすごく勉強になる再復習になったというべきか

柯潔にしろイセドルにしろ結局3時間の国際線で相手をうまく打枕化して
勝つ語にすぎない だからアルファに勝てない
そうではなく布石50手の段階までは二日も三日もかけて恐ろしく良く考えてうち
その後普通に打てば、けっして後れを取ることはなかろう
そうすれば本気のアルファの寄席、神の寄席を見られたかもしれない 惜しい

俺はそう思う 人間側にミスが多すぎる
人間に、特に布石をしっかりやって、勝負を見てみたいのだが
もうアルファは人間とやらないんだってね
0080名無し名人
垢版 |
2017/05/31(水) 16:48:02.54ID:dMPPXm6I
終わってみれば全く接戦でなかった件
0081名無し名人
垢版 |
2017/05/31(水) 17:21:06.60ID:3P/bdUrP
序盤から中盤の入り口くらいまでは、もしかしたら・・・と思わせるところも
あったんだけど、終盤になってどうやっても勝ち目がないことに気づかされた時の
絶望感。

カケツも心が折れるよね。
0082名無し名人
垢版 |
2017/05/31(水) 18:41:53.98ID:qiPedbtt
>>79
お前えらそうだなw
0083名無し名人
垢版 |
2017/05/31(水) 21:45:08.75ID:hSZdFud0
人工知能と同じ土俵でやってる今の人間が凄いのであって普通人工知能に持ち時間あっても人間は無制限やろ
0084名無し名人
垢版 |
2017/06/02(金) 19:19:42.78ID:Y0eD1Y3T
アルファ碁同士の棋譜公開 碁界騒然「見たことない」
http://www.asahi.com/articles/ASK610JLRK50UCVL03K.html?iref=sptop_8_01
> 手数が進んだ特殊な状況に限り有効とされていた
「星への三々(さんさん)入り」を序盤の早いうちに互いに打ち合ったり、
双方の石がぶつかり合って手抜きがしにくい接触戦のさなかに戦いを放置して他方面に転戦したり。
これまでの常識では考えられない着手の連続にプロ棋士らは驚愕(きょうがく)した。
0085名無し名人
垢版 |
2017/06/02(金) 19:31:47.18ID:Ou4RvDFV
1勝出来たイセドルはマジで凄かったんだな
0086名無し名人
垢版 |
2017/06/02(金) 22:01:49.36ID:3YRPKPDD
>>85
イセドル戦の第4局はアルファ先生が自分で転んだんだけどね。
「コウ」の評価を正しく計算できない欠点は自己対戦では解決できずに、
そういう問題があることにハサビスたちも気づかないまま
欠点が残ったままイセドルと対局したからね。

他の4局は大差だったし、もう去年の時点で棋力の差はハッキリしてたと思う。

それより、カケツが第2局で100手目付近まで大きく離されずについていったのが
すごいと思う。人類が途中までとはいえ、ほぼ互角に戦った最初で最後の棋譜だからね。
(これも最後は大差になったけど・・・・)
0087名無し名人
垢版 |
2017/06/02(金) 22:57:43.70ID:ylC9WcjU
大差だった
0088名無し名人
垢版 |
2017/06/03(土) 04:04:32.75ID:OCT4A8T9
>接触戦のさなかに戦いを放置して他方面に転戦したり


これだな

接触戦が一段落して
そこでの一手の価値が低下したときに
他へ転ずるというのが常識なわけだけど、
その「価値」の見立てがこれまではアバウトすぎた
(わるく言えば、思考停止していた)ということが判明したわけだ
0089名無し名人
垢版 |
2017/06/03(土) 04:36:21.05ID:bM21FqD9
コウがらみで乱れたのは2,3局目だろ?
4局目の勝利は、一本道の正着を見つけるのが苦手なAIの性質が出て酷く乱れたのが要因
0090名無し名人
垢版 |
2017/06/03(土) 11:32:14.80ID:MdKGUYG3
乱れて大差なら更に糸色望が増すw
0091名無し名人
垢版 |
2017/06/03(土) 13:19:02.00ID:5p+FmHZP
セドルの勝利はまさにAI特有の弱点を突いた見事なものだったな
カケツ戦のAlphagoはその弱点を克服していたのか、カケツにそういう局面に誘導するチャンスがなかっただけなのかわからんけど、完敗と言っていいだろう
セドルの方が強いという気は全然ないけど、運命がセドルに微笑んだとしか言えない
セドルも普通に全敗して終わる可能性の方が高かった
0092名無し名人
垢版 |
2017/06/03(土) 13:43:48.59ID:PnadPsh/
>>89,>>91

違うよ。アルファ碁は1か月間に2900万局を超える自己対戦で強くなっていったんだけど、
ある局面で自分の弱点(例えば自分が不利なのに有利だと判断するとか)は、
自分がその弱点部分をスルーするのと同時に対戦相手も(自分自身なので)スルーしてしまう。

で、弱点が修正されることなく残ってしまう。
(だからトッププロと対戦して自己対戦で修正できない弱点をさらけ出してもらう必要があった)

今年のバージョンではそういう弱点を自己対戦で修正するためのアルゴリズムを開発して
組み込んである。だからセドル戦のようなことはおこらない。

master戦はそれを確認するための、トップ棋士との60戦60連勝だった。
アルファ碁が苦手としていたあらゆる局面を自己対戦で修正し、人間には負けないレベルに
到達したことを証明したんだ。

自己対戦で自分の間違いを修正することができる、このことがこれからのAIの開発と進歩で
もっとも大きなポイントになるし、グーグルはその第一歩を歴史に残した。
これが大事。
0093名無し名人
垢版 |
2017/06/03(土) 14:12:40.24ID:KqH0r2OX
>>92
なんか中の人というか、AIの自己紹介みたいな文章だな(褒めてる)
0094名無し名人
垢版 |
2017/06/03(土) 14:15:59.18ID:TlrPyihp
>>92
じゃあそのアルゴリズムを作らないと
zenは一生終盤が弱いままなのか?
0095名無し名人
垢版 |
2017/06/03(土) 14:27:34.94ID:ZHve5NSC
というかこの一年でアルファ碁にそんなブレイクスルーが起きてたなんて初めて聞いたけど本当なの?
0096名無し名人
垢版 |
2017/06/03(土) 14:37:32.39ID:5p+FmHZP
>>92
そういうソースがあれば見せてほしい
2900万局で君の言うような欠陥があったとしても、それがセドル戦での発狂にどう繋がるかが全く説明できない
アルゴリズムの欠陥として長手数の詰碁的局面が苦手だったとしたら
評価関数の最適化だけで克服できるとは思えないんだよね
今までのアルファ碁が苦手としていた局面が偶然セドル戦で出てきただけ、なんてのもちょっと可能性としては考えにくい
頻繁にそんな局面が出るようなAlphagoであればもうちょっと楽に勝ててただろう
ソースがあれば謝ります
0097名無し名人
垢版 |
2017/06/03(土) 15:42:17.07ID:ltKl2CE2
そりゃセドル戦で4勝1敗だったアルファ碁のデータで
2017のアルファ碁と戦ったら石3つ置いてようやく戦えるとこまで来てるし
カケツと戦ったアルファ碁は1年前より圧倒的に強い

セドルに勝った直後のアルファ碁は
今のアルファ碁に歯が立たない
対戦するごとにバグや弱点は減って強さは増す一方で一生衰えない、それがAIだし
0098名無し名人
垢版 |
2017/06/03(土) 15:45:35.29ID:ltKl2CE2
多少バグ残ってても
もう人間がどうこうできるレベルじゃないからどうでもいいだろう
ここ1年でプロ相手に64連勝だっけ?カケツが打っても歯が立たない
もうプロに1000連勝しても不思議じゃない

世界一の棋士相手にアルファ先生が指導碁を打ってあげてって感じじゃん
0099名無し名人
垢版 |
2017/06/03(土) 16:13:34.14ID:kB4mI8fb
アルファ碁の基本構造がセドル戦から変わっていないとするならば、
強化学習の対象はRL-PolicyとValueの2つ。

公開された50局の自己対局棋譜は強化学習でも何でもないただのテストプレイ。

この2つのディープネットワークは、アルファ碁の「直感」に相当する。

RL-Policyで、どの手を重点的に読むのかを選択する事で、持ち時間をどの手に
費やすかを決める。ここの精度が高まり、良いと評価した手と悪いと評価した手の
差が大きくなる事で、持ち時間をより狭い範囲の探索に集中でき、長い手筋を読む
力が増加する。ただし、間違いがあると手の見落としが生じる。

Valueはぱっと見の盤面の評価で良し悪しを判断すう。その事で、モンテカルロの
ロールアウト特有の隘路問題を避ける事ができる。

モンテカルロベースである以上、モンテカルロのランダムプレイは必要不可欠であり、
これまでのMCTSではロールアウト関数をより強いものにしようと言う努力がなされて
いたが、アルファ碁は恐らくロールアウト用のPolicyは手を簡素なものにして、上述の
直感の精度を、強化学習によって高める事で、強くなっていく方向。

個人的には、モンテカルロを除くと、かなり人間の思考に近づいていると思う。
0100名無し名人
垢版 |
2017/06/03(土) 19:47:40.42ID:8Y7w/WGB
アルファ碁の自己対決の50戦は白は何勝してる?
勝敗表無い?
0101名無し名人
垢版 |
2017/06/03(土) 20:01:30.14ID:kB4mI8fb
>>100
勝敗表は無いけど、白勝率8〜9割くらいだと思う。
0102名無し名人
垢版 |
2017/06/03(土) 20:14:02.44ID:8Y7w/WGB
>>101
え!?
そんなに違うの??
0103名無し名人
垢版 |
2017/06/03(土) 20:16:54.96ID:kB4mI8fb
>>102
うん。コミとか含めて話題になってる。

最初の10対戦が白9勝1敗、次の10対戦が白8勝2敗とかだったと記憶している。
0104名無し名人
垢版 |
2017/06/03(土) 21:05:55.64ID:lwGKpo3D
人間は黒ばっか元気して白はあんまり研究してないんだろ
0105名無し名人
垢版 |
2017/06/03(土) 21:06:29.81ID:lwGKpo3D
>>104
元気じゃなくて研究な
0106名無し名人
垢版 |
2017/06/04(日) 10:45:26.98ID:+SyOSP9b
>>95,>>96


米グーグルの人工知能(AI)「アルファ碁」が世界最強のプロ棋士、中国の柯潔(か・けつ)九段(19)との三番勝負で全勝した。
生みの親で同社グループのAIベンチャー、英ディープマインドの最高経営責任者(CEO)、デミス・ハサビス氏(40)は日本経済新聞の取材に応じ、
AI研究の進捗について「正しいはしごを登り始めた」と手応えを示した。

「このはしごはとても高く、何段あるかわからない。ただ、AIの歴史は誤ったはしごに登っては下りるの繰り返しだった。
『正しいはしご』にたどり着いたのは、大きい」

以上、ハサビス談

「深層学習」と「強化学習」の組み合わせというアルゴリズムの実用化が今回のアルファ碁のテーマの一つです。
master 版での対局と今回のカケツとの対局は、いわばその実証実験で、63連勝無敗の結果から
このアルゴリズムの有用性を目に見える形で実証できたと考えます。

詳細は今年中に発表する論文ですべて明らかにする予定です。
0107名無し名人
垢版 |
2017/06/04(日) 10:51:35.04ID:1hGFvGhD
>>106

>>106>>92にはかなり飛躍があると思うが…
0108名無し名人
垢版 |
2017/06/04(日) 11:21:12.68ID:0QsAMV4L
>>103
まあコミは人間が決めたものだからな
しょっちゅう変わってるし
0109名無し名人
垢版 |
2017/06/04(日) 16:31:10.12ID:OAau0fg8
>>92
自己対局のイメージが間違っている。

学習しているのはポリシーネット部分。
学習というのは、ぶっちゃけ、ネットワーク内部のウェイトを計算により微調整する事。

ポリシーネットは、学習対象の他、過去に学習対象に負け越したものが一杯プール
されていて、それらが対戦相手となる。自己と対戦し続けているわけではない。

最初に学習対象のネットワークを用意したら、それのコピーをプールに入れる。
その2つで対戦させて強化学習。勝ち越しの閾値を超えたら、学習対象のコピーを
プールに追加して、2つのネットワークとランダムに対戦させる。勝ち越し閾値を超え
たら、同様にコピーをプールに追加して、3つのネットワークとランダムに対戦させる・・・。
コピーをプールに追加するのを世代と呼ぶ。

最初の論文で、10000世代まで強化学習させたと書いてあったはず。

最初の一番弱い奴までプールに入れてあるのは、>>92で言うところの自己対戦に
よる過学習を防ぐためのもの。対戦相手の多様性を保つための工夫。

また、ε-greedyを採用して、学習対象のネットワークは、一定確率で敢えてランダム
に手を着手して、今の手が最善なのか、違うかを確認している。これも過学習防止策。

これらは特別なアルゴリズムでもなければ、「特定の弱点を修正するための方法」は
大抵、別の大きな弊害をもたらす事から、そういう付け焼刃な対処をしていないと、
考えるのが自然。
0110YAMAGUTIseisei
垢版 |
2017/06/04(日) 17:25:18.95ID:dPvdSMQk
AlphaGo 九段にはほぼ勝てないが
その上で勝つ為の正攻法 ( ある意味 AI ( AL ) の盲点 ) はなくはない ( → 柯潔 vs AlphaGo スレ )
0111名無し名人
垢版 |
2017/06/25(日) 07:45:11.20ID:n3nTBtQV
さんたてのどこが…
プロにくくると、セドルのバクお情け1勝のあと全敗
0112名無し名人
垢版 |
2017/06/30(金) 14:11:04.99ID:7Jjmc6fZ
>>111
プロどころか他のAIでも勝てないだろ
0113名無し名人
垢版 |
2017/11/27(月) 21:47:17.14ID:l77a2QwQ
☆ 私たち日本人の、日本国憲法を改正しましょう。現在、
衆議員と参議院の両院で、改憲議員が3分の2を超えております。
総務省の、『憲法改正国民投票法』、でググってみてください。
国会の発議は可能です。平和は勝ち取るものです。お願い致します。☆☆
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況