局所的な極大値でないことを示すには独立試行が何回か必要だと思うけど 0275名無し名人2017/10/19(木) 21:48:46.42ID:Y0XMeA88>>214 自分もモンテカルロを使ってないというのが一番ビックリ 進歩が早いわけだ 0276名無し名人2017/10/19(木) 21:52:59.68ID:Q25v+wBl ゼロの論文、ざっと目を通しただけだけれども、 終局までのシミュレーションをやってないというだけで ノードの生成にモンテカルロ法を使ってないとかどこにも書いていないような… 0277名無し名人2017/10/19(木) 21:54:59.35ID:27giFKwF 前の自己対局に比べたら手抜きがかなり減ってるな 先に打った石の顔を立てるっていう原則が一応人間で見てわかる範囲で打たれている 0278名無し名人2017/10/19(木) 21:58:48.46ID:Q25v+wBl というか AlphaGo Zero uses a much simpler variant of the asynchronous policy and value MCTS algorithm (APV-MCTS) used in AlphaGo Fan and AlphaGo Lee と元祖AlphaGoよりずっと単純なMCTS(モンテカルロ木探索)を使っていますと、 モンテカルロ系だと明記されてない? 0279名無し名人2017/10/19(木) 22:04:06.55ID:2woG8vRI もはやドラゴンボール並みのインフレだな 0280名無し名人2017/10/19(木) 22:10:13.45ID:A7O3govw 人間の発想は偏ってしまう部分があるから
AlphaGo Zero does not use “rollouts” - fast, random games used by other Go programs to predict which player will win from the current board position. Instead, it relies on its high quality neural networks to evaluate positions.
・It uses one neural network rather than two. Earlier versions of AlphaGo used a “policy network” to select the next move to play and a ”value network” to predict the winner of the game from each position. These are combined in AlphaGo Zero, allowing it to be trained and evaluated more efficiently.
ポリシーネットワークとバリューネットワークが組み合わさって一つになったとある わからないがこれが画期的に有能でrolloutsは不要になったのかも 0288名無し名人2017/10/19(木) 23:07:40.79ID:QMyUYECZ 最後のほうまで直観で打つんだろ 0289名無し名人2017/10/19(木) 23:19:49.70ID:2woG8vRI もう次の段階は適切なコミなら100%持碁、半で差を付けたら一方が勝率100%しかないな さすがにこれは数年大丈夫w? 0290名無し名人2017/10/19(木) 23:21:48.96ID:9JYoqRVO>>278 AlphaGo Zero uses a much simpler variant of the asynchronous policy and value MCTS algorithm (APV-MCTS) used in AlphaGo Fan and AlphaGo Lee 元祖AlphaGoに使用されたAPV_MCTSより遥かに簡単な異型を使用している。 0291名無し名人2017/10/19(木) 23:42:55.48ID:TG6yAKvO そういや、読み無しで3055 Eloだからスマホでプロに勝てるね 100局面探索させればトッププロにも勝てそう 0292名無し名人2017/10/19(木) 23:45:31.49ID:1nVvEGjW 4隅打ったら早めに33 ゼロよりもずっと前からやってる俺のほうが先駆者で天才 0293名無し名人2017/10/19(木) 23:47:23.52ID:1nVvEGjW すぐに33に入る俺を馬鹿にしてた奴ら、どうだ見たことか 0294名無し名人2017/10/19(木) 23:52:19.46ID:67HmMDK2>>280 それをやるには人生は短すぎる 0295名無し名人2017/10/19(木) 23:52:32.10ID:zjdRL1RJ Full StrengthのMasterとの20局、黒でも白でも2連星なんだな。Zeroは。 0296名無し名人2017/10/20(金) 00:17:15.20ID:Jvr3I1CX 草野球にノーランライアンが来たみたいな場違い感 それやっちゃダメでしょって奴 0297名無し名人2017/10/20(金) 00:32:32.69ID:pZQ0tNXP ライアンというより大砲で撃ってくるようなイメージ 0298名無し名人2017/10/20(金) 00:47:24.45ID:c2sRVfz9 ゼロの大好きな星を4か所も置いてプロに勝てない置碁なんて やっぱり後の打ち方が変なのだろう 0299名無し名人2017/10/20(金) 00:57:50.34ID:iBdx19rj 早めに33、稼いでから荒らし 俺の碁の正しさが証明された 0300名無し名人2017/10/20(金) 01:22:34.19ID:XQEutBXB 人間の作った囲碁理論は意味ないどころか邪魔なだけの存在でしたとさ(完) 0301名無し名人2017/10/20(金) 01:28:14.73ID:u5vQMs+X>>297 https://www.youtube.com/watch?v=UBtfinJ7Aa40302名無し名人2017/10/20(金) 01:32:59.80ID:4OE3zFIQ 初手天元はやっぱりごみなんだね 0303名無し名人2017/10/20(金) 02:20:42.46ID:iEoI7oxo レーティング