＿＿Alpha Go　vs　柯潔が意外にも接戦だった件＿＿ [無断転載禁止]©2ch.net

◆XWA0cCl.Lw · 2017/05/23(火) 17:45:21.43

アルファ碁は一切の隙を与えない、完璧に勝ちに行く布陣で臨んだのか意外にも接戦だったな。
滅茶苦茶強くなってると言われてたが、そこまでの強さは感じなかった。

◆XWA0cCl.Lw · 2017/05/23(火) 17:48:20.05

まあ勿論、柯潔が滅茶苦茶強いという事はあるが。
アルファ碁は鬼神の様な強さを想像したが、そこまででは無かった。

**名無し名人** · 2017/05/23(火) 19:06:38.71

勝ち確後の舐めプだぞ

**名無し名人** · 2017/05/23(火) 19:09:51.85

AIには無理とされてる接待機能やぞ

**名無し名人** · 2017/05/23(火) 19:14:59.15

>>1
越田死ね

**名無し名人** · 2017/05/23(火) 20:07:18.11

>>3
これ
AIは1目半で勝つように調整されてる
半目だとちょっとした手違いで発狂負けするかもしれない
2目半だとガチ接戦になって1目半以内の差になったら発狂して負けるかもしれない
誤差を加味して余裕をもって1目半
人間が勝つには半目差で終盤まで持っていかないといけない

**名無し名人** · 2017/05/23(火) 20:20:39.47

ハサビスがインタビューで言ってたとおりだよ。

勝ちの確率が最大になる手を選ぶようにプログラムしているのであって、
石の差が最大になるように勝ちの手順を選ぶわけではない。

序盤から中盤で有利になったとたんに緩んだようにみえたり、疑問手に見えるような手は
差が縮まっても、あるいはリードした分の一部を犠牲にしても全体として勝つ確率が最大、
つまり負ける可能性が最小、逆転される可能性が最小の手を選んでいるだけ。

だから途中で差が縮まったように見えても、逆転の目は全くない変化に入っているということ。

内容的には大差だよ。何度やっても勝てないレベルだよ。

**名無し名人** · 2017/05/23(火) 20:26:32.25

ちくんが30手くらいでアルファ碁勝ち確定みたいなこといってたろ
相当さがある

**名無し名人** · 2017/05/23(火) 22:00:19.43

>>7
それで石塔しぼり

**名無し名人** · 2017/05/23(火) 22:14:12.19

>>3
別ソフトも同じ判断してたな
途中からalphaGoの優勢が揺らがなかったみたい

◆XWA0cCl.Lw · 2017/05/23(火) 22:27:49.55

俺クラスになれば分かるが、アルファ碁も伸びシロは余り無い感じだな。

**名無し名人** · 2017/05/23(火) 22:29:24.26

>>9
＞それで石塔しぼり

今のバージョンには通用しない。

◆XWA0cCl.Lw · 2017/05/23(火) 22:31:26.22

柯潔と1000回やって1000勝出来る能力があるかどうかだな。

**名無し名人** · 2017/05/23(火) 22:31:36.03

人間界辛いな

◆XWA0cCl.Lw · 2017/05/23(火) 22:32:27.07

まあ、人工知能の一つの天井は見えたな。

**名無し名人** · 2017/05/23(火) 22:57:07.06

>>13
＞柯潔と1000回やって1000勝出来る能力があるかどうかだな。

もちろん、アルファ碁にはあるんだが、柯潔には９９９連敗したあとに１０００戦目を戦う気力は
ないと思う。

**名無し名人** · 2017/05/23(火) 23:04:29.18

>>15
この天井を越えないとAIはいつまでも次のステージには立てないだろうな

**名無し名人** · 2017/05/23(火) 23:04:40.53

>>16
すぐにまた入院するだろうな

**名無し名人** · 2017/05/23(火) 23:06:21.54

ふむ
コンピューターは鬱にならんし疲れない

**名無し名人** · 2017/05/24(水) 01:00:26.66

一発入れたいなあ

**名無し名人** · 2017/05/24(水) 01:16:39.19

人間が勝つのは簡単で、コミをアルファ碁側に黙って変えて
アルファ碁側が一目半勝ったと思ったら実は半目負けてた
とすればよい。

**名無し名人** · 2017/05/24(水) 01:22:05.07

>>21
それで本当に狙って1目半か検証できるかもな

**名無し名人** · 2017/05/24(水) 01:42:20.43

アルファ碁が地を最大にして勝つようプログラムされてたなら、アルファ碁同士の対局で本当に適切なコミが明らかになるかもしれないのに残念

**名無し名人** · 2017/05/24(水) 01:53:40.97

ちがうだろ

地の最大化を目的にしたら
たとえ勝率が下がろうとも
模様を思い切り広げて相手に入ってこさせて
無理に殺しにいくような打ち方をしてしまうぞ

適切なコミを知りたいなら、
コミを1目ずつずらしながら
勝率優先という条件で最強AI同士をたくさん対局させて、
ちょうど勝率が50:50に最も近づく地点を調べればいい

**名無し名人** · 2017/05/24(水) 01:55:45.00

モンテカルロから脱せたら最適コミわかるんやろうけどな

**名無し名人** · 2017/05/24(水) 15:20:01.99

全自動接待モード内蔵により
虐殺されてる感
がないからいいんじゃね

**名無し名人** · 2017/05/24(水) 15:23:05.73

https://pbs.twimg.com/media/DAkDai-XUAEtKtY.jpg
今のmasterは対セドル版のアルファ碁に３子置かせても勝てるんだから
カケツやセドルなんかは５子置かせてもらっていい勝負

互先で勝てるわけがない

**名無し名人** · 2017/05/24(水) 15:37:33.31

>>12
セドルの石塔絞り攻撃も通用しなかったじゃんｗ

**名無し名人** · 2017/05/25(木) 00:24:13.78

60番勝負の棋譜は貴重だな
カケツも当然研究してるだろうけど勝つためというより研鑽のためにいろいろやるだろ

**名無し名人** · 2017/05/25(木) 06:22:27.02

>>1
あなた天才ですね！

**名無し名人** · 2017/05/25(木) 06:25:32.59

>>1
どれ位の棋力なんですか？

**名無し名人** · 2017/05/25(木) 13:46:03.77

アルファ碁から見て、盤面右下が鍵になって来る！

**名無し名人** · 2017/05/25(木) 19:43:20.89

人類二連敗
負け越し決定

**名無し名人** · 2017/05/25(木) 23:10:21.85

カケツが弱く思えるほどだ

**名無し名人** · 2017/05/25(木) 23:29:44.37

>>1
カケツとやって1目半
お前とやっても1目半

これに戦慄を覚えないようなら会話が成り立たんな

**名無し名人** · 2017/05/26(金) 03:12:46.68

カケツ弱すぎ

**名無し名人** · 2017/05/26(金) 04:28:13.88

俺がやったら30目は負けるが

**名無し名人** · 2017/05/26(金) 12:16:39.83

塔屋が全部持碁にしたようなものか

**名無し名人** · 2017/05/26(金) 18:38:42.13

九段が五人集まってもアルファ碁が勝ったからな。
もう人間のレベルは完全に超越している。

**名無し名人** · 2017/05/26(金) 19:23:41.15

　 _ 　∩
(　ﾟ∀ﾟ)彡　置き石！置き石！
　⊂彡

**名無し名人** · 2017/05/26(金) 19:24:15.43

もし明日カケツが勝ったらヤラセだよね

**名無し名人** · 2017/05/26(金) 20:42:00.95

>>1
年始の６０戦でもMasterと半目差の対局あったやん
別に驚くことでもない

**名無し名人** · 2017/05/26(金) 21:05:17.37

自己対戦内の勝率は黒がいいのかな、発表は無いけれど

**名無し名人** · 2017/05/26(金) 22:04:36.25

年末の対局って半目・一目半以外の数え碁なかったっけ？
絶対半目一目半になるって書いてるやつばっかりだけども

**名無し名人** · 2017/05/26(金) 23:03:39.40

人間がヨセの最中にミスったら開くんじゃね

**名無し名人** · 2017/05/26(金) 23:23:11.69

極論を言うと「半目で勝つ」が指し手が最善の手なんだよ

アルファ碁は本当に「一目半で勝つ」を狙って指してるのか？

**名無し名人** · 2017/05/26(金) 23:37:48.44

永遠に詰まらない一目半の差ってとこだね
ヨセになるとどんどん詰まっていくけど
逆転はしないのがアルファ碁
逆転する手を打たれるのがその他のＡＩ

アルファ碁は勝敗不明の手順を避けるうまい手法を
採用しているように感じる
単純に完成度の差なのかもしれないが

**名無し名人** · 2017/05/27(土) 00:13:29.66

どうしようもないバカが多いな
べつに半目勝ちが最善なわけじゃない

そもそもこいつらは何をもってして「最善」なんていってんのかすら不明だが

**名無し名人** · 2017/05/27(土) 10:40:46.39

>>48を翻訳すると

なぜ「最善」なのか教えてください靴ﾍﾟﾛﾍﾟﾛ

**名無し名人** · 2017/05/27(土) 10:51:59.99

猿は山に帰れよ

**名無し名人** · 2017/05/27(土) 11:01:57.67

鉄のゴールキーパーとの対局で六半とかあったはず
モンテカルロだからといって必ず0.5になるとかはない

**名無し名人** · 2017/05/27(土) 21:17:31.78

だから何度も言われてるけど、10目とかつけて勝つんじゃなくて
一目半だかでの勝ちを目指してるんだよ
無茶して形勢傾けるより、勝ち確の手を追求してるだけ

要結局は前から言われてるように金融取引だとか自動運転とか医療診断に応用するのが最終目標なんだから
正解までの道筋さえできたら後は事故やミス少なくする方向に行くんだよ

**名無し名人** · 2017/05/27(土) 21:33:41.56

小さい差で勝つのは応用するものとか関係なく、もともと囲碁に関してはそうした方が強くなるというだけだ
最大目差で勝つほうが強くなるんなら、そういう風に作られてるよ

**名無し名人** · 2017/05/27(土) 21:45:09.30

ギリ勝ちも大勝も値打ちは同じ。
勝率を高めるようプログラムされてる。

**名無し名人** · 2017/05/27(土) 22:15:16.93

別に１目半（中国ルールでは半目）の勝ちを目指しているわけではない。

途中で圧倒的な大差がついたら、終局に向かって勝率が高い紛れの無い手
を選択するうちに差が半目まで縮む事もあるというだけの事。

対戦相手が真剣に負け差を減らしてくると、半目差になっちゃうだけだと思う。
その辺の下手っぴだと、大差負けのままだと思う。

**名無し名人** · 2017/05/28(日) 04:19:29.76

目指すっていうより「収束する」が正しい

終盤になればなるほど
「Aの手を選べば勝率100％　石は1個損する」
「Bの手を選べば勝率100％　石は1個得する」

こういう構図が増えてくる
アルファ碁はどちらにしても勝ちだから石の損得は気にせず選択する

結果、確率的に半目差に収束することが多いというだけ

**名無し名人** · 2017/05/28(日) 07:47:17.56

圧倒的大差だろ

100局やっても一回も勝てないんじゃね？

**名無し名人** · 2017/05/28(日) 07:56:17.63

別にカケツをボコボコにして

囲碁界を破壊するのが目的じゃないしな

とりあえず、誰が打ってもノーチャンス

**名無し名人** · 2017/05/28(日) 08:10:49.04

第二戦は百手まで接戦だったらしいからアルファ碁にも限界あるんじゃない？

**名無し名人** · 2017/05/28(日) 08:21:39.69

>>59
人間業とは思えん
やっぱり強かったんだな

**名無し名人** · 2017/05/28(日) 08:55:35.30

>.>59
接戦というのは形勢に大きく差がつかなかったとアルファが自分で判断していただけで、
カケツがわずかでもリードした局面は一度もなかった。

by アルファ碁

**名無し名人** · 2017/05/28(日) 12:00:06.29

アルファ碁が多少弱くなってもいいから市販化
されないかな

**名無し名人** · 2017/05/28(日) 18:16:51.29

>>56
１００％はそれから先勝敗が決まるまでの全パターンを知らなくてはいけないから無理なので
経験したことのある？確率で差を見るとたまたまの偶然で９９．８２％と９９．８３％だったりすると後者を選ぶとか
そんあところはないのかな？

**名無し名人** · 2017/05/28(日) 19:29:36.77

DeepZenGoはヨセの損で逆転負けしていたわけで
ヨセで損をしても決して逆転は許さない
というのはキチンとプログラムされているってことだ

**名無し名人** · 2017/05/29(月) 13:30:58.43

一局目半目だったのかよ
zenだったら負けてたろ

**名無し名人** · 2017/05/29(月) 14:44:14.27

正直もう1年あれば
プロ相手に64連勝中のアルファ碁も
1年前は雑魚だったねってレベルまで行くんだろ
もう○○だったら負けてたとか虚しいだけだよ
プログラマが本気で囲碁攻略しようとしてるかどうかだけ

今回みたいに大企業が金とやる気出してチーム組んでアルファ碁みたいなの作れば
囲碁のトッププロの1000年が小規模チームに3年で消し飛ばされる
そのうち今の2017年版アルファ碁も雑魚でしかなかったってなるし

**名無し名人** · 2017/05/29(月) 14:47:02.19

ってかAIと人間が対局すること自体がおかしい
ゲームのチートユーザーと一般プレイヤーが戦うようなもの
負けて当然で、勝とうとするほうがおかしい

**名無し名人** · 2017/05/29(月) 14:51:12.76

去年までプロ相手ならたまに負けてたアルファ碁も
今じゃプロ相手にギリギリの接戦になる程度にわざわざ自分で
凡ミスして戦局を調整しながら最後は1目半程度だけしっかり勝ちきる余裕あるもんな

去年の時点でプロでも勝てないのに
2017のアルファ碁はそれより3石分強いとかもう勝てるはずがない
大差になりそうになったら自分からミスしてギリギリの勝負にしてくれる接待機能付きだよ

**名無し名人** · 2017/05/29(月) 15:03:47.21

トップ倒すまでは興行として優秀だからおかしくはないんじゃないかな
戦わないと話題性は低いからAI戦術取り込むのも遅くなって囲碁の進化も遅れる

**名無し名人** · 2017/05/29(月) 15:14:52.37

AI戦術って言うけど最終的には
候補の手から先の展開を数千万パターンとかの中から一瞬で計算して
その中から一番安定して勝てる手を選び続けるようになるんだろAIは
最終段階まで行けばこの状況にはこれが最適ってのは分かるかもしれんが
その前にアルファ君引退しちゃったし
アルファ君はどう打たれてもすぐに先を計算して対応するから打てるけど人間には無理とか沢山あるだろう

人間が数百のパターン考える間にAIが1億パターンとか計算してるならどうしようもないよ

**名無し名人** · 2017/05/29(月) 15:54:11.15

御城碁19連勝の本因坊秀策が現代に居ればマスターなどやっつけてくれたものを………

**名無し名人** · 2017/05/29(月) 16:44:53.94

プロがAI戦術取り入れるのはAIを倒すのを目標としてなくて囲碁の進化のため
これから常識が変わってどんどん面白くなってくるはず

**名無し名人** · 2017/05/29(月) 16:58:29.13

人間にAIに勝つのはもう無理だよ
どんな天才が出ても無理、本因坊でも無理

今のアルファ碁でトッププロ相手に３子置かせるくらいは強い
来年だと５子置いて互角くらいじゃないの
再来年だと更に強いだろう

２０１７の時点でトッププロ相手にミスしても手抜きでも勝てるくらいの強さ
開発が進めばこれから更に強くなる子供のような状態でこれ

**名無し名人** · 2017/05/29(月) 22:30:40.30

>>63
絶対的な100％じゃなくて統計上の100％っていうこと
全パターンが100億パターンあったとしても、5000通り検索してすべて結果が100％だったら
すべて100％である可能性が極めて高いっていう結論が得られるから

「出そうな手」だけを数千から数万パターン考えてシミュレートすれば実質的な100％は出せる

**名無し名人** · 2017/05/30(火) 22:44:38.31

実質的な100ってなんやねん

**名無し名人** · 2017/05/30(火) 23:35:16.72

競馬もそうだが惜しいと勝つでは雲泥の差なんだよなあ

**名無し名人** · 2017/05/30(火) 23:49:18.12

確率高い手で囲碁のベースが上がるのはいいけど悪手とか未知の手でも意地張り合って勝つとか
ああいう醍醐味が少なくなったら悲しいなあ

**名無し名人** · 2017/05/31(水) 09:32:38.76

皆は見たことない手にばかり注目がいくけど
戦いの最中に打つアルファの一手を見る分には

「今までの碁の教えはほとんど正しかった」
の観を強くしましたけどね

**名無し名人** · 2017/05/31(水) 09:37:54.19

実は自分の学んだ、この局面この一手、と、アルファの手は
ほぼ一致する
トッププロもこういうところは逃さないぜ　という手もアルファも逃さない
序中盤の戦いはすごく勉強になる再復習になったというべきか

柯潔にしろイセドルにしろ結局３時間の国際線で相手をうまく打枕化して
勝つ語にすぎない　だからアルファに勝てない
そうではなく布石５０手の段階までは二日も三日もかけて恐ろしく良く考えてうち
その後普通に打てば、けっして後れを取ることはなかろう
そうすれば本気のアルファの寄席、神の寄席を見られたかもしれない　惜しい

俺はそう思う　人間側にミスが多すぎる
人間に、特に布石をしっかりやって、勝負を見てみたいのだが
もうアルファは人間とやらないんだってね

**名無し名人** · 2017/05/31(水) 16:48:02.54

終わってみれば全く接戦でなかった件

**名無し名人** · 2017/05/31(水) 17:21:06.60

序盤から中盤の入り口くらいまでは、もしかしたら・・・と思わせるところも
あったんだけど、終盤になってどうやっても勝ち目がないことに気づかされた時の
絶望感。

カケツも心が折れるよね。

**名無し名人** · 2017/05/31(水) 18:41:53.98

>>79
お前えらそうだなｗ

**名無し名人** · 2017/05/31(水) 21:45:08.75

人工知能と同じ土俵でやってる今の人間が凄いのであって普通人工知能に持ち時間あっても人間は無制限やろ

**名無し名人** · 2017/06/02(金) 19:19:42.78

アルファ碁同士の棋譜公開　碁界騒然「見たことない」
http://www.asahi.com/articles/ASK610JLRK50UCVL03K.html?iref=sptop_8_01
＞　手数が進んだ特殊な状況に限り有効とされていた
「星への三々（さんさん）入り」を序盤の早いうちに互いに打ち合ったり、
双方の石がぶつかり合って手抜きがしにくい接触戦のさなかに戦いを放置して他方面に転戦したり。
これまでの常識では考えられない着手の連続にプロ棋士らは驚愕（きょうがく）した。

**名無し名人** · 2017/06/02(金) 19:31:47.18

１勝出来たイセドルはマジで凄かったんだな

**名無し名人** · 2017/06/02(金) 22:01:49.36

>>85
イセドル戦の第4局はアルファ先生が自分で転んだんだけどね。
「コウ」の評価を正しく計算できない欠点は自己対戦では解決できずに、
そういう問題があることにハサビスたちも気づかないまま
欠点が残ったままイセドルと対局したからね。

他の４局は大差だったし、もう去年の時点で棋力の差はハッキリしてたと思う。

それより、カケツが第2局で１００手目付近まで大きく離されずについていったのが
すごいと思う。人類が途中までとはいえ、ほぼ互角に戦った最初で最後の棋譜だからね。
（これも最後は大差になったけど・・・・）

**名無し名人** · 2017/06/02(金) 22:57:43.70

大差だった

**名無し名人** · 2017/06/03(土) 04:04:32.75

＞接触戦のさなかに戦いを放置して他方面に転戦したり

これだな

接触戦が一段落して
そこでの一手の価値が低下したときに
他へ転ずるというのが常識なわけだけど、
その「価値」の見立てがこれまではアバウトすぎた
（わるく言えば、思考停止していた）ということが判明したわけだ

**名無し名人** · 2017/06/03(土) 04:36:21.05

コウがらみで乱れたのは2,3局目だろ？
4局目の勝利は、一本道の正着を見つけるのが苦手なAIの性質が出て酷く乱れたのが要因

**名無し名人** · 2017/06/03(土) 11:32:14.80

乱れて大差なら更に糸色望が増すw

**名無し名人** · 2017/06/03(土) 13:19:02.00

セドルの勝利はまさにAI特有の弱点を突いた見事なものだったな
カケツ戦のAlphagoはその弱点を克服していたのか、カケツにそういう局面に誘導するチャンスがなかっただけなのかわからんけど、完敗と言っていいだろう
セドルの方が強いという気は全然ないけど、運命がセドルに微笑んだとしか言えない
セドルも普通に全敗して終わる可能性の方が高かった

**名無し名人** · 2017/06/03(土) 13:43:48.59

>>89,>>91

違うよ。アルファ碁は１か月間に２９００万局を超える自己対戦で強くなっていったんだけど、
ある局面で自分の弱点（例えば自分が不利なのに有利だと判断するとか）は、
自分がその弱点部分をスルーするのと同時に対戦相手も（自分自身なので）スルーしてしまう。

で、弱点が修正されることなく残ってしまう。
（だからトッププロと対戦して自己対戦で修正できない弱点をさらけ出してもらう必要があった）

今年のバージョンではそういう弱点を自己対戦で修正するためのアルゴリズムを開発して
組み込んである。だからセドル戦のようなことはおこらない。

master戦はそれを確認するための、トップ棋士との６０戦６０連勝だった。
アルファ碁が苦手としていたあらゆる局面を自己対戦で修正し、人間には負けないレベルに
到達したことを証明したんだ。

自己対戦で自分の間違いを修正することができる、このことがこれからのＡＩの開発と進歩で
もっとも大きなポイントになるし、グーグルはその第一歩を歴史に残した。
これが大事。

**名無し名人** · 2017/06/03(土) 14:12:40.24

>>92
なんか中の人というか、AIの自己紹介みたいな文章だな（褒めてる）

**名無し名人** · 2017/06/03(土) 14:15:59.18

>>92
じゃあそのアルゴリズムを作らないと
zenは一生終盤が弱いままなのか？

**名無し名人** · 2017/06/03(土) 14:27:34.94

というかこの一年でアルファ碁にそんなブレイクスルーが起きてたなんて初めて聞いたけど本当なの？

**名無し名人** · 2017/06/03(土) 14:37:32.39

>>92
そういうソースがあれば見せてほしい
2900万局で君の言うような欠陥があったとしても、それがセドル戦での発狂にどう繋がるかが全く説明できない
アルゴリズムの欠陥として長手数の詰碁的局面が苦手だったとしたら
評価関数の最適化だけで克服できるとは思えないんだよね
今までのアルファ碁が苦手としていた局面が偶然セドル戦で出てきただけ、なんてのもちょっと可能性としては考えにくい
頻繁にそんな局面が出るようなAlphagoであればもうちょっと楽に勝ててただろう
ソースがあれば謝ります

**名無し名人** · 2017/06/03(土) 15:42:17.07

そりゃセドル戦で4勝1敗だったアルファ碁のデータで
2017のアルファ碁と戦ったら石３つ置いてようやく戦えるとこまで来てるし
カケツと戦ったアルファ碁は１年前より圧倒的に強い

セドルに勝った直後のアルファ碁は
今のアルファ碁に歯が立たない
対戦するごとにバグや弱点は減って強さは増す一方で一生衰えない、それがAIだし

**名無し名人** · 2017/06/03(土) 15:45:35.29

多少バグ残ってても
もう人間がどうこうできるレベルじゃないからどうでもいいだろう
ここ1年でプロ相手に64連勝だっけ？カケツが打っても歯が立たない
もうプロに1000連勝しても不思議じゃない

世界一の棋士相手にアルファ先生が指導碁を打ってあげてって感じじゃん

**名無し名人** · 2017/06/03(土) 16:13:34.14

アルファ碁の基本構造がセドル戦から変わっていないとするならば、
強化学習の対象はRL-PolicyとValueの２つ。

公開された５０局の自己対局棋譜は強化学習でも何でもないただのテストプレイ。

この２つのディープネットワークは、アルファ碁の「直感」に相当する。

RL-Policyで、どの手を重点的に読むのかを選択する事で、持ち時間をどの手に
費やすかを決める。ここの精度が高まり、良いと評価した手と悪いと評価した手の
差が大きくなる事で、持ち時間をより狭い範囲の探索に集中でき、長い手筋を読む
力が増加する。ただし、間違いがあると手の見落としが生じる。

Valueはぱっと見の盤面の評価で良し悪しを判断すう。その事で、モンテカルロの
ロールアウト特有の隘路問題を避ける事ができる。

モンテカルロベースである以上、モンテカルロのランダムプレイは必要不可欠であり、
これまでのMCTSではロールアウト関数をより強いものにしようと言う努力がなされて
いたが、アルファ碁は恐らくロールアウト用のPolicyは手を簡素なものにして、上述の
直感の精度を、強化学習によって高める事で、強くなっていく方向。

個人的には、モンテカルロを除くと、かなり人間の思考に近づいていると思う。

**名無し名人** · 2017/06/03(土) 19:47:40.42

アルファ碁の自己対決の50戦は白は何勝してる？
勝敗表無い？

**名無し名人** · 2017/06/03(土) 20:01:30.14

>>100
勝敗表は無いけど、白勝率８～９割くらいだと思う。

**名無し名人** · 2017/06/03(土) 20:14:02.44

>>101
え！？
そんなに違うの？？

**名無し名人** · 2017/06/03(土) 20:16:54.96

>>102
うん。コミとか含めて話題になってる。

最初の１０対戦が白９勝１敗、次の１０対戦が白８勝２敗とかだったと記憶している。

**名無し名人** · 2017/06/03(土) 21:05:55.64

人間は黒ばっか元気して白はあんまり研究してないんだろ

**名無し名人** · 2017/06/03(土) 21:06:29.81

>>104
元気じゃなくて研究な

**名無し名人** · 2017/06/04(日) 10:45:26.98

>>95,>>96

米グーグルの人工知能（ＡＩ）「アルファ碁」が世界最強のプロ棋士、中国の柯潔（か・けつ）九段（19）との三番勝負で全勝した。
生みの親で同社グループのＡＩベンチャー、英ディープマインドの最高経営責任者（ＣＥＯ）、デミス・ハサビス氏（40）は日本経済新聞の取材に応じ、
ＡＩ研究の進捗について「正しいはしごを登り始めた」と手応えを示した。

「このはしごはとても高く、何段あるかわからない。ただ、ＡＩの歴史は誤ったはしごに登っては下りるの繰り返しだった。
『正しいはしご』にたどり着いたのは、大きい」

以上、ハサビス談

「深層学習」と「強化学習」の組み合わせというアルゴリズムの実用化が今回のアルファ碁のテーマの一つです。
master 版での対局と今回のカケツとの対局は、いわばその実証実験で、６３連勝無敗の結果から
このアルゴリズムの有用性を目に見える形で実証できたと考えます。

詳細は今年中に発表する論文ですべて明らかにする予定です。

**名無し名人** · 2017/06/04(日) 10:51:35.04

>>106

>>106と>>92にはかなり飛躍があると思うが…

**名無し名人** · 2017/06/04(日) 11:21:12.68

>>103
まあコミは人間が決めたものだからな
しょっちゅう変わってるし

**名無し名人** · 2017/06/04(日) 16:31:10.12

>>92
自己対局のイメージが間違っている。

学習しているのはポリシーネット部分。
学習というのは、ぶっちゃけ、ネットワーク内部のウェイトを計算により微調整する事。

ポリシーネットは、学習対象の他、過去に学習対象に負け越したものが一杯プール
されていて、それらが対戦相手となる。自己と対戦し続けているわけではない。

最初に学習対象のネットワークを用意したら、それのコピーをプールに入れる。
その２つで対戦させて強化学習。勝ち越しの閾値を超えたら、学習対象のコピーを
プールに追加して、２つのネットワークとランダムに対戦させる。勝ち越し閾値を超え
たら、同様にコピーをプールに追加して、３つのネットワークとランダムに対戦させる・・・。
コピーをプールに追加するのを世代と呼ぶ。

最初の論文で、１００００世代まで強化学習させたと書いてあったはず。

最初の一番弱い奴までプールに入れてあるのは、>>92で言うところの自己対戦に
よる過学習を防ぐためのもの。対戦相手の多様性を保つための工夫。

また、ε-greedyを採用して、学習対象のネットワークは、一定確率で敢えてランダム
に手を着手して、今の手が最善なのか、違うかを確認している。これも過学習防止策。

これらは特別なアルゴリズムでもなければ、「特定の弱点を修正するための方法」は
大抵、別の大きな弊害をもたらす事から、そういう付け焼刃な対処をしていないと、
考えるのが自然。

**YAMAGUTIseisei** · 2017/06/04(日) 17:25:18.95

AlphaGo 九段にはほぼ勝てないが
その上で勝つ為の正攻法 ( ある意味 AI ( AL ) の盲点 ) はなくはない ( → 柯潔 vs AlphaGo スレ )

**名無し名人** · 2017/06/25(日) 07:45:11.20

さんたてのどこが…
プロにくくると、セドルのバクお情け1勝のあと全敗

**名無し名人** · 2017/06/30(金) 14:11:04.99

>>111
プロどころか他のAIでも勝てないだろ

**名無し名人** · 2017/11/27(月) 21:47:17.14

☆ 私たち日本人の、日本国憲法を改正しましょう。現在、
衆議員と参議院の両院で、改憲議員が３分の２を超えております。
総務省の、『憲法改正国民投票法』、でググってみてください。
国会の発議は可能です。平和は勝ち取るものです。お願い致します。☆☆

**名無し名人** · 2019/01/23(水) 16:10:41.28

誘導だ
https://medaka.5ch.net/test/read.cgi/gamestones/1451601094/

**停止しました。。。** · NG

真・スレッドストッパー。。。(￣ー￣)ﾆﾔﾘｯ