コンピューター囲碁ソフトについて語るスレ52
■ このスレッドは過去ログ倉庫に格納されています
0124名無し名人
垢版 |
2017/10/19(木) 09:43:26.44ID:QMyUYECZ
>>123
何で変える必要が?
ゼロベースとかただの趣味レベルの話だし、人類ごときに勝つのにそんな大層なことやる必要無いだろ
0125名無し名人
垢版 |
2017/10/19(木) 09:53:15.77ID:RYduzfgI
ZENはともかくとして絶芸のテンセントとかはGoogleと五分の技術力示すためにやってるんだからいつまでたっても追い付けないんじゃ面子にかかわるでしょ
0126名無し名人
垢版 |
2017/10/19(木) 09:55:29.87ID:L5Nm3pV1
これはどうカテゴリー分けして使えばいいのだろう?

コンピューター囲碁ソフトについて語るスレ52
http://medaka.5ch.net/test/read.cgi/gamestones/1508065320/
1 名無し名人 2017/10/15(日)

コンピューター囲碁ソフトについて語るスレ52
http://medaka.5ch.net/test/read.cgi/gamestones/1508253193/
1 名無し名人 2017/10/18(水)

市販囲碁ソフトについて語るスレ5
http://medaka.5ch.net/test/read.cgi/gamestones/1500985978/
0127名無し名人
垢版 |
2017/10/19(木) 10:05:58.38ID:CYq8sL4Q
上はコンピュータ囲碁ソフト全般なんでも。
真ん中は捨てるべき重複スレ。本スレが終わった時に残ってたら廃物利用してもよい。
下はコンピュータ囲碁ソフトの中で製品として市販されているもの。
0128名無し名人
垢版 |
2017/10/19(木) 10:09:25.84ID:xtWM0e8O
柯潔と対局したアルファ碁のバージョンってMASTERだっけ?
だとしたらZEROってとんでもねーな
0129名無し名人
垢版 |
2017/10/19(木) 10:14:47.05ID:aSVi99FH
カケツが何子置いたら勝てるんだろ
0130名無し名人
垢版 |
2017/10/19(木) 10:16:48.35ID:YBUC40wt
ついにレーティング5000超えたか
0131名無し名人
垢版 |
2017/10/19(木) 10:34:52.53ID:VPb2rUmU
>アルファ碁ゼロは、棋譜のデータに頼らず、人間の初心者以下の状態から強化学習だけで上達する。
>490万回の自己対局の後、李九段に勝ったAIと対局して、100戦全勝。2900万回の自己対局の後では、
>今年初めまでに日本の井山裕太・現七冠を含むトップ棋士らに60戦全勝したAI「アルファ碁マスター」も圧倒した。

最強AI「アルファ碁ゼロ」、人間の棋譜頼らず強くなる
http://www.asahi.com/articles/ASKBF55WWKBFULBJ00H.html

AI「最初人間の棋譜学習して強くなろうと思ったけど時間の無駄やった。ゼロから全部AIだけで学習した方が強かったわ。(テヘ」
0132名無し名人
垢版 |
2017/10/19(木) 10:37:18.94ID:VPb2rUmU
人間の棋譜、AlphaGo にとってむしろノイズだった可能性ぇ・・・
0133名無し名人
垢版 |
2017/10/19(木) 10:38:14.45ID:U0zp5U1+
いままで買った本全部捨てなきゃいけないな
0134名無し名人
垢版 |
2017/10/19(木) 10:52:48.89ID:jog9qh7j
>>133
これから10年で布石、定石本は大きく変わるだろうね
0135名無し名人
垢版 |
2017/10/19(木) 11:05:15.91ID:fOr+Hc0F
Empirical analysis of AlphaGo Zero trainingWe applied
our reinforcement learning pipeline to train our program AlphaGo Zero.
Training started from completely random behaviour and continued
without human intervention for approximately three days.

最初は完全ランダム

No legal moves are excluded
? even those filling in the player’s own eyes
0136名無し名人
垢版 |
2017/10/19(木) 11:13:45.88ID:FAhfencX
人類最強のカケツ君がコンピュータに指導碁打たれる時代が
こんなに早く来るなんて予想出来たのは日本では将棋の羽生名人くらいか・・・
0137名無し名人
垢版 |
2017/10/19(木) 11:16:57.68ID:RvDZ/rUA
既出ですが、、、



囲碁ウォーズ公式 (@igowars)
2017/10/19 8:51
AlphaGoの新しい論文だそうです。


AlphaGo Zero: Learning from scratch | DeepMind
https://deepmind.com/blog/alphago-zero-learning-scratch/
…Nature : Nature Research
http://www.nature.com/nature/journal/v550/n7676/full/nature24270.html

人間の棋譜を一切使わず学習しセドル戦のAlphaGoに100-0、Masterに89-11とか

https://twitter.com/igowars/status/920799457985232896
0138名無し名人
垢版 |
2017/10/19(木) 11:25:20.41ID:FAhfencX
AI囲碁は体力無限の化物が精神と時の部屋で
囲碁だけ研究してレベルアップしているようなもの
そんな環境で育った化物の思考や戦略は
人間の知能じゃ理解不能かも知れない

AI囲碁はもうこれ以上強くならなくていい
先手必勝という完全解析がされてしまったら
冷めてしまう人は一定数いるだろう

それよりもAIの超高度な棋譜を人間レベルでも分かるように
解説出来る語学力をAIは身につけてもらいたい
これの方が囲碁のレベルをアップさせ続けるよりも
よっぽど人類の為になる
0139名無し名人
垢版 |
2017/10/19(木) 11:26:38.68ID:zaO0KBC7
zeroの棋譜公開されてるみたいですがどこから見れるかわかる人教えてください
0140名無し名人
垢版 |
2017/10/19(木) 11:31:33.74ID:zaO0KBC7
>>139
自己解決しました
ネイチャーの論文からダウンロードできました
0141名無し名人
垢版 |
2017/10/19(木) 11:37:19.99ID:6vQseBkT
40日経過版のアルファ碁ゼロだが
黒番は小目や三々も打ってるな
白番はほとんど二連星だが例外もある
0142名無し名人
垢版 |
2017/10/19(木) 11:40:02.66ID:3Bxb1xKG
なんで互先でやるんだろうな
打込み碁でやってくれた方が強さが分かりやすいのに
論文のレビュアーは囲碁知らないだろうからインパクトに欠けるってことか
0143名無し名人
垢版 |
2017/10/19(木) 11:40:52.03ID:6vQseBkT
ごめんまちがえた
アルファ碁ゼロ対アルファ碁(セドル)
の棋譜だった
0144名無し名人
垢版 |
2017/10/19(木) 11:48:08.12ID:2FV+IkqY
1ヶ月で人間の10万年先は行くな。もう、囲碁について人間が語る資格はない。
0145名無し名人
垢版 |
2017/10/19(木) 11:58:24.79ID:bahVmyat
>>142
置石によるハンデの付け方がそもそも妥当なのかという問題が生じる
0147名無し名人
垢版 |
2017/10/19(木) 12:30:13.16ID:uNuPsYhE
今までよくさ、機械学習だなんて大袈裟なこと言ってるけどやってることはただの最適化プログラムで人のやる"学習"とは程遠いよって言ってたがこれはもう"学習"と認めざるを得ないな
仮にこれを否定したら人のやる学習はどんなに高尚なんだってなったら何も言えない
そして何より困ったことにその学習性能が人を遥かに超えてる
残り僅かに残されてる人の優位性は"意思"や"意識"とかなんだろうが産業面、軍事面では無用の長物なんだろうな
0148名無し名人
垢版 |
2017/10/19(木) 12:33:05.47ID:VPb2rUmU
AlphaGo Zero 同士の対決。
序盤はやはり Alpha Go Zero 同士でも三線目や四戦目辺りから打ち始めてる。

良かった。ゼロから始めた Alpha Go 師匠もそこに辿り着いたという事は、
人間の辿り着いた棋理のうち、そこは正解だったという事か。

「そこから既に間違えてるぞ、人間」となってたら、流石にどうにもならんところであるw

Extended Data Figure 5: AlphaGo Zero (40 blocks) self-play games.
http://www.nature.com/nature/journal/v550/n7676/fig_tab/nature24270_SF5.html
0150名無し名人
垢版 |
2017/10/19(木) 12:46:13.10ID:BoKRD+Gm
中央放置の人間じゃ勝てるわきゃないわな
人間は端っこのチマチマした戦いが精一杯
0151名無し名人
垢版 |
2017/10/19(木) 12:50:10.07ID:6vQseBkT
囲碁は深いから6000だっていけると思うぜ
要はアルファ碁ゼロに100戦100勝のアルゴリズムが作れればいいんだから
0152名無し名人
垢版 |
2017/10/19(木) 12:50:50.69ID:LCuN37fG
>>150
名人戦最終局でプロが白優勢を主張する中
コンピューターは黒有利を断言してたしな
人に中央を扱いこなすのは無理だろうな
0153名無し名人
垢版 |
2017/10/19(木) 12:54:05.50ID:BoKRD+Gm
人間の処理能力だと中央は広すぎるんだろうなぁ
端の戦いx多数って理解の仕方しか出来ない
大局観とか何言ってたんだ?って話
0154名無し名人
垢版 |
2017/10/19(木) 12:57:05.03ID:w4rCYkWC
人間をベースにして学習させると弱いってことが証明されてしまったか
完全に詰みだな
0155名無し名人
垢版 |
2017/10/19(木) 12:57:52.15ID:vJSLX6jI
頭真っ白から3日で頂点かよ
人間が4000年かかってるのに
0156名無し名人
垢版 |
2017/10/19(木) 12:59:10.28ID:6vQseBkT
しかし2年前にAIがプロに互先で初勝利というのを聞いたときは
大ニュースだと思ったが
そこからまさかこれほどAIが未知の棋力の領域を広げるとは

どんだけAIが強くなっても
人間と100戦すればまぐれで数局は負けるもんだと思ってたよ
0157名無し名人
垢版 |
2017/10/19(木) 13:01:37.65ID:lwoV/mtP
グーグルのマシンで3日なら
個人開発者なら一ヶ月くらいで超えるのかな?
0158名無し名人
垢版 |
2017/10/19(木) 13:02:21.50ID:VPb2rUmU
ていうか、人間が良かれと思って積み上げてきた膨大なデータ群より、
ランダムに石ばら撒くところから評価し直した方が圧倒的に強くなったって
これもう悲劇なのか喜劇なのか分かんねーなwww
0159名無し名人
垢版 |
2017/10/19(木) 13:02:29.80ID:wJ0HCZSN
プロ棋士の方々 本当にお疲れ様でしたってはなしだな
0160名無し名人
垢版 |
2017/10/19(木) 13:03:38.50ID:vJSLX6jI
とりあえずこのコンピューターにはこの世がシミュレーションであるかどうかも証明して欲しい
0161名無し名人
垢版 |
2017/10/19(木) 13:15:16.29ID:bKwQLiNZ
ツイッターに突然トレンドに上がったから何事かと思ったらとんでもないことになってんな
0162名無し名人
垢版 |
2017/10/19(木) 13:18:05.28ID:u395RQgc
強さの主因はネットワーク構造だから、他のソフトもそこはすぐ真似できる

AlphaGo Zeroの棋譜、200万局学習させて
resnet、VP統合 4300
resnet、VP分離 3700
cnn、VP統合 3700
cnn、VP分離 3100

一番最後のがv18のネットワーク構造
0163名無し名人
垢版 |
2017/10/19(木) 13:19:15.27ID:w4rCYkWC
さっきBS1でプログラマーが新定石がたくさん発見されました、と嬉しそうに語ってたけど
流石にこの情報は非公開のままになるだろうな
0164名無し名人
垢版 |
2017/10/19(木) 13:22:40.17ID:N2QCQasy
家庭用パソコン使ったソフトでも、プロ九段より強い時代なんだな…。
そろそろオワコンなのか?
0165名無し名人
垢版 |
2017/10/19(木) 13:23:27.35ID:k88kpJ7G
あるふぁごぜろと井山七冠の一番手直り二十番碁をきぼん
0166名無し名人
垢版 |
2017/10/19(木) 13:27:31.66ID:LCuN37fG
何度同じ事を言えば意が済むのかね
機械がいくら強くなっても人同士が競い合う魅力は変わらない
0167名無し名人
垢版 |
2017/10/19(木) 13:28:18.50ID:w4rCYkWC
いや
3日で100戦100勝じゃなく
そこまで到達できたのは40日後だよ
0168名無し名人
垢版 |
2017/10/19(木) 13:28:55.82ID:VlT8wGWd
AGZeroはAG Lee(Elo 3500)に3日、AG Master(Elo 4800) に21日で到達 40日でElo5000程度まで到達
学習局数が500万局とする

人間が研究付きで対局できるのが1日3局程度とする
毎日対局したとして500万局に到達するのに約4566年かかる
職業棋士が江戸時代と共に始まったとして約400年
AG Lee前後で伸び率がかなり落ちる事と
学習期間が400/4566で人間トップが大体セドルくらいと考えると人間のプロも頑張ってると言えなくもない
0169名無し名人
垢版 |
2017/10/19(木) 13:29:17.14ID:N2QCQasy
井山の師匠は、きみが教えると井山が弱くなるから教えるなと言われたらしいが、
コンピュータも人間から教えられてたから
弱くなっていたという皮肉。
人間は口出し無用の世界に入った。
0170名無し名人
垢版 |
2017/10/19(木) 13:32:27.06ID:RvDZ/rUA
手塚治虫愛のコスモゾーン冒頭を見ると実感できるのだが、人工知能は人間の教育に力を発揮するべきだろう。
https://1.bp.blogspot.com/-a3riPKt2c6g/Vz1-wT_uo5I/AAAAAAAA-7o/-2h_PEzflFIn4Jln2U-JewUmf7T5tEtKACLcB/s1600/hinotori2772a.gif


囲碁を知らない子供が二人
二つのAIが半年教育する
子供が対戦し
勝った子供の教師AIが勝者
デバイスが大事になる
0171名無し名人
垢版 |
2017/10/19(木) 13:34:41.94ID:N2QCQasy
コンピューターは、縄文時代以前から老いることなく、ひたすら碁を打ってきた仙人みたいな存在だろ
寿命たかたが100年の人間は5子置いて勝てれば上出来。
0172名無し名人
垢版 |
2017/10/19(木) 13:35:40.27ID:QMyUYECZ
〜1年後〜

アルファ碁ゼロ2「スマン去年使ってた定石あれゴミだったわ」
0173名無し名人
垢版 |
2017/10/19(木) 13:39:13.15ID:wJ0HCZSN
もし、仮にAlphaGoが現段階でセドルやカケツとの対局が極秘に行われていて世間的にまったく認知されていないとしたら日本、中国、韓国棋院はひた隠しにするんだろうか
0174名無し名人
垢版 |
2017/10/19(木) 13:43:23.47ID:FAhfencX
>>172
〜10年後〜

アルファ碁ゼロ5
「スマン、囲碁完全解析しちゃって、飽きたわ。
 もっと競技性高くてルールも単純明快で
 流行るボードゲーム作ったので公開する」
0175名無し名人
垢版 |
2017/10/19(木) 13:55:46.23ID:uNuPsYhE
zenの加藤がツイッターで言い訳がましい発言連発しててクソワロタwwww
お前みたいなポンコツの老いぼれは指咥えて見てろやwwww
0176名無し名人
垢版 |
2017/10/19(木) 13:56:40.18ID:k88kpJ7G
棋譜見たけどマスターのほうが知っちゃかめっチャカに打って減った糞に欠陥憑かれてボロボロになってるだけにしか見えんかったな

はやく井山さんと打ち込み二十番碁を
0177名無し名人
垢版 |
2017/10/19(木) 13:59:58.94ID:jog9qh7j
とりあえずAIには何ですぐ三々に入るのかを解説してほしいわw
0178名無し名人
垢版 |
2017/10/19(木) 14:04:32.51ID:Eu82i/cL
ソフトに人間が負けても、”追いつけるかも”と、ほんの少しでも思えれば
熱は冷めないどころか共通の敵を見つけた気分になって盛り上がる
しかし、絶対に追いつけないと分かってしまうと、縮こまり、熱は冷め、離れていく

韓国でイセドルが負けつつも1勝をあげたことで少々の囲碁ブームが起きたが
カケツが完全に破れてしまい、差が拡大していると分かって韓国の囲碁人気は
イセドルとアルファ碁の対局前よりも急落した
そして今回のゼロちゃん登場で根も絶たれるだろう
0179名無し名人
垢版 |
2017/10/19(木) 14:07:21.81ID:jog9qh7j
良くも悪くもマイペースな日本は囲碁人気が上がることも下がる事もないだろう
0180名無し名人
垢版 |
2017/10/19(木) 14:13:04.52ID:u/O7poc2
>>157
無理だと思うよ。
マシン1台のスペックなら大差がなくても、個人じゃGoogleクラスのクラスタ組めないよ。
だから半年とか1年、下手したらそれでも全然無理かもしれない。
0182名無し名人
垢版 |
2017/10/19(木) 14:15:46.43ID:u/O7poc2
チェスはとうの昔に人間じゃ手も足も出なくなってるけど、
別にゲームとしてすたれたという話は聞かんから、

不正対策をタイトル戦や大会ではやりましょう。

となるだけで特に何ら大きな変化はないと思う。
0183名無し名人
垢版 |
2017/10/19(木) 14:16:34.74ID:PCoGLuol
惜しい
もうちょっとでこのスレらしいIDだった
0185名無し名人
垢版 |
2017/10/19(木) 14:28:45.83ID:k88kpJ7G
>>138
AIの解説「変化図によると後240手後にここにあったほうがいいでしょう」
「ここでは相手が必ずここに打ってきますのでこう打ったのです」
「先生、なぜ相手はそう打つんですか?」
「それはですね…とざっと変化図50万図ほど示して・・・これ以外に打つ場合に最善尽くしても半目負けちゃうでしょう?」
「ははぁ…なるほど…」
0186名無し名人
垢版 |
2017/10/19(木) 14:38:41.57ID:Eu82i/cL
チェスがゲームとして廃れることはないが
人気が落ちてチェス界は少なからずダメージ負ったけどな
0187名無し名人
垢版 |
2017/10/19(木) 14:48:16.23ID:6WflYrLx
三目並べを学習するマッチ箱は1960年に実現してたのに
評価関数やら先読みやら、何十年も回り道して感じがするな
https://ja.wikipedia.org/wiki/ドナルド・ミッキー#.E6.88.A6.E5.BE.8C

マッチ箱からここまで直行しなかったのは、計算機の能力不足によるものだったんだろうか?
0188名無し名人
垢版 |
2017/10/19(木) 14:49:45.98ID:xtWM0e8O
>>186
ソフトから逃げまくることで実力差を隠し人気を維持してる将棋界は賢いなwww
0189名無し名人
垢版 |
2017/10/19(木) 14:52:59.93ID:rEDo1eF/
Zero vs MasterたまにMasterも勝ってるな
中央の大模様に殴りこんでからの攻防が特に意味不明だ
誰も解説できんだろ
0190名無し名人
垢版 |
2017/10/19(木) 14:58:51.09ID:jog9qh7j
人類が機械人間にでもならない限り理解不能だなこりゃ
0191名無し名人
垢版 |
2017/10/19(木) 15:10:21.45ID:3Bxb1xKG
野狐で
AlphaZero の対局総譜が並べられてる
現状10局位だけど入手可能な分全部やってくれるかな?
0193名無し名人
垢版 |
2017/10/19(木) 15:23:26.93ID:jog9qh7j
黒がかかったら即コスミつけるのか
もう布石に関しては人間様は1どころかZEROから研究し直しだなこりゃ
0194名無し名人
垢版 |
2017/10/19(木) 15:25:50.87ID:qasdZbRK
アルファ碁、さらに進化=自己学習のみで最強に―グーグル
https://headlines.yahoo.co.jp/hl?a=20171019-00000005-jij-eurp
https://deepmind.com/blog/alphago-zero-learning-scratch/
https://storage.googleapis.com/deepmind-live-cms/documents/AlphaGo%2520Zero%2520Training%2520Time.gif
AlphaGo Zeroはセドル戦の時のレーティング3700の旧AlphaGoと100回やって100勝。

トッププロ相手に60連勝したmasterのレーティングが4800以上、
AlphaGo Zeroはmasterと100回やって勝率89%です。

AlphaGo Zeroはレーティング5000以上。トッププロに5子です。

なんでAlphaGo Zeroは家庭用のソフトにして発売しないんだ?
AlphaGo Zeroは天頂や銀星なんかより遥かに強いだろ。
0195名無し名人
垢版 |
2017/10/19(木) 15:28:55.72ID:w2dwMJKQ
トッププロに5子って…
プロって必要なんだろうか
0196名無し名人
垢版 |
2017/10/19(木) 15:31:54.28ID:BoKRD+Gm
>>181
こういうのが中央重視なんだろうな
そりゃ子どもが考えても一番広いのはどこか分かるわw
0199名無し名人
垢版 |
2017/10/19(木) 15:39:50.31ID:+cw5rwW3
ゼロからできるんなら九路やらせたいな
0200名無し名人
垢版 |
2017/10/19(木) 15:41:41.55ID:MPy5WK0X
レーティング5000て

人間は最高いくつまで行った事あるの
0203名無し名人
垢版 |
2017/10/19(木) 15:56:56.76ID:6WflYrLx
>>201
オセロも6×6は解析済みだけど、8×8が解析されたとは聞かないからどうかな
0204名無し名人
垢版 |
2017/10/19(木) 16:00:37.73ID:NZzAcFTi
前のアルファ碁ではシチョウに関しては、特別扱いしていたけど、
今度のはどうなんだろね。
0205名無し名人
垢版 |
2017/10/19(木) 16:05:06.98ID:DXQaQUae
MASTERが敗勢の最終盤に無意味な放り込みをやりまくってるのはちょっと笑えるな
どれだけ強くなってもあれは治らんのかな
ゼロのほうも負けそうだったらやるんだろうか
0206名無し名人
垢版 |
2017/10/19(木) 16:24:12.50ID:N2/anK7F
むしろ恐れるのは、このAIと人間の圧倒的な棋力の差を見せ付けられて

プロ棋士志望の少年少女が、「棋士」という職業を見限る事。

かつては神のような棋力の持ち主と崇拝されていた名人や本因坊が、
AIに掛かると赤子の手を捩じるように潰されたら、プロ棋士などくだらない職業と
感じるのはごく自然だろう。
0207名無し名人
垢版 |
2017/10/19(木) 16:37:06.92ID:ydCa8ZCU
>>194
トッププロに5子じゃ絶対に人類は勝てないやん。最後に勝ったセドルは後年に評価されてそう。
0208名無し名人
垢版 |
2017/10/19(木) 16:40:17.33ID:MPy5WK0X
ちなみにイ・セドルと闘った時と比べて、CPUは1/22に減らされてる
0209名無し名人
垢版 |
2017/10/19(木) 16:42:30.94ID:D0oqK5ra
逆に碁AIの研究者になる可能性も
0210名無し名人
垢版 |
2017/10/19(木) 16:47:13.78ID:gj44n2qu
>>167

After 72 hours, we evaluated AlphaGo Zero
against the exact version of AlphaGo Lee that defeated Lee Sedol, under the 2 hour time controls
and match conditions as were used in the man-machine match in Seoul (see Methods). AlphaGo
Zero used a single machine with 4 Tensor Processing Units (TPUs) 29, while AlphaGo Lee was
distributed over many machines and used 48 TPUs.
AlphaGo Zero defeated AlphaGo Lee by 100 games to 0
0211名無し名人
垢版 |
2017/10/19(木) 16:53:39.69ID:Pdi52doz
>>181
それ学習初期の棋譜だから、ランダムに打ってるのと同じ

40日間の学習を20棋譜で表してる
20層の方は72時間を20棋譜
0212名無し名人
垢版 |
2017/10/19(木) 16:59:05.80ID:Z0Qs/XLB
ここまで圧倒的大差だとプロ志望者は減るかもな
趣味でやる奴は別に減らんだろうが
0213名無し名人
垢版 |
2017/10/19(木) 17:01:40.55ID:ocNIbGwp
>>169
井山に教えるなと言われたのは院生師範だった後藤
0214名無し名人
垢版 |
2017/10/19(木) 17:19:24.54ID:hQ/3Zi4s
Re: AlphaGo Zero 投稿者:山下 投稿日:2017年10月19日(木)07時44分48秒
衝撃ですね・・・。
内容は囲碁の知識などは一切なしで、ルールのみから作ったものが
セドル版のAlphaGoに100-0で勝つほど強くなったそうです。

1. 人間の知識などはいっさいなく、囲碁のルールのみ、からの自己対戦による強化学習
2. 入力は黒と白の石の配置のみ。ダメの数とかは一切なし。
3. Policy、Value、などと分割せずに、1つのネットワーク。
4. モンテカルロ法(Rollout)は使っていない。

個人的には 4. が衝撃でした。
以下はメモです。
人間がよく打つ隅の定石を見つけた(5つの例)。
33に入る定石は5手目に黒がケイマに飛ぶ形を最終的に好む
学習の初期は石を取ることを好み、次に死活の基礎を学び、最終的にバランスが取れた美しい手を打つ
学習から36時間でセドル戦のバージョンに追いついた。
セドル版には100-0で勝つ。
プロの手の一致率は48%ぐらいと低い。プロの手から学習したものは54%ぐらい。
ResNetが単なるConvolutionより優秀で、PolicyとValueを一つのネットワークで評価するのが優秀。


出力はValueとPolicy。一つのネットワーク。
入力は石の配置と着手履歴(棋譜)。
0から7手前までの黒、白の配置と手番(17面)
ResNetを使ってる。Batch Normalizationあり。
40 Residual Block
1 Block は (3x3 256, BN, ReLU)が2つ。つまり 80層のConvolution
ZeroはMasterに89勝11敗
MasterはZeroと同じ手法で作られているが、人が作ったRolloutは使っていた。


学習段階ではMCTSを使ってる。
学習の中に先読みを取り入れた、新しい強化学習
--------------------------------------------------------
自己対戦の棋譜はこちらにあるようです。
AlphaGo Zeroの自己対戦の棋譜
https://www.nature.com/nature/journal/v550/n7676/extref/nature24270-s2.zip
http://524.teacup.com/yss/bbs/
0216名無し名人
垢版 |
2017/10/19(木) 17:20:45.37ID:LyVqj1pB
>>194
アルファ碁Zeroって任天堂switchみたいで格好いい
0217名無し名人
垢版 |
2017/10/19(木) 17:27:58.13ID:qasdZbRK
グーグルがAlphaGo masterはセドル戦の時の旧AlphaGoに4子で勝てるって言っていたよ。
セドル戦の時の旧AlphaGoと柯潔が互角だとしてAlphaGo ZeroはAlphaGo masteに勝率89%で一子は強いだろうから柯潔に5子です。

https://deepmind.com/blog/alphago-zero-learning-scratch/
AlphaGo Zeroレーティング5000以上です。

https://www.goratings.org/ja/
柯潔はレーティング3667です。
0218名無し名人
垢版 |
2017/10/19(木) 17:34:00.63ID:kddkTv+t
いい加減「囲碁入門スクール」「指導碁」してくれる囲碁ソフトが発売されれば良い
そうすれば囲碁の面白さに気づいてソフトを買う人も増えてくるだろう
プロから直接学ぶよりもコストが下がるだろう
0219名無し名人
垢版 |
2017/10/19(木) 17:37:33.11ID:uNuPsYhE
>>216
zeroのネーミングなんて他でもある(コカコーラゼロとか)のにパイオニアであるDeepMindが名前付けると格好よく聞こえるね
1でもない2でもない10でもない
それらすべての数と一線を画す存在
始源の0
名付けて AlphaGo Zero

やっぱりいいわ響きが違う
0220名無し名人
垢版 |
2017/10/19(木) 17:39:18.54ID:rYCTFlvo
>>218
それやったらプロ棋士がいよいよ要らなくなるから是が非でも棋院は阻止するだろうな
でも、現状の天頂7の機能でもある程度の棋力があれば自分で学べそうだけどな
0221名無し名人
垢版 |
2017/10/19(木) 17:41:22.60ID:qasdZbRK
AlphaGo Zeroに9子で勝ったらアマ6段はあると思う。
0222名無し名人
垢版 |
2017/10/19(木) 17:54:08.89ID:hQ/3Zi4s
>>214
> 4. モンテカルロ法(Rollout)は使っていない。
> 個人的には 4. が衝撃でした。

モンテカルロを使ってないってことは読みはどうやってるんだろ?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況