コンピューター囲碁ソフトについて語るスレ52
■ このスレッドは過去ログ倉庫に格納されています
>>123 何で変える必要が? ゼロベースとかただの趣味レベルの話だし、人類ごときに勝つのにそんな大層なことやる必要無いだろ ZENはともかくとして絶芸のテンセントとかはGoogleと五分の技術力示すためにやってるんだからいつまでたっても追い付けないんじゃ面子にかかわるでしょ 上はコンピュータ囲碁ソフト全般なんでも。 真ん中は捨てるべき重複スレ。本スレが終わった時に残ってたら廃物利用してもよい。 下はコンピュータ囲碁ソフトの中で製品として市販されているもの。 柯潔と対局したアルファ碁のバージョンってMASTERだっけ? だとしたらZEROってとんでもねーな >アルファ碁ゼロは、棋譜のデータに頼らず、人間の初心者以下の状態から強化学習だけで上達する。 >490万回の自己対局の後、李九段に勝ったAIと対局して、100戦全勝。2900万回の自己対局の後では、 >今年初めまでに日本の井山裕太・現七冠を含むトップ棋士らに60戦全勝したAI「アルファ碁マスター」も圧倒した。 最強AI「アルファ碁ゼロ」、人間の棋譜頼らず強くなる http://www.asahi.com/articles/ASKBF55WWKBFULBJ00H.html AI「最初人間の棋譜学習して強くなろうと思ったけど時間の無駄やった。ゼロから全部AIだけで学習した方が強かったわ。(テヘ」 人間の棋譜、AlphaGo にとってむしろノイズだった可能性ぇ・・・ >>133 これから10年で布石、定石本は大きく変わるだろうね Empirical analysis of AlphaGo Zero trainingWe applied our reinforcement learning pipeline to train our program AlphaGo Zero. Training started from completely random behaviour and continued without human intervention for approximately three days. 最初は完全ランダム No legal moves are excluded ? even those filling in the player’s own eyes 人類最強のカケツ君がコンピュータに指導碁打たれる時代が こんなに早く来るなんて予想出来たのは日本では将棋の羽生名人くらいか・・・ 既出ですが、、、 囲碁ウォーズ公式 (@igowars) 2017/10/19 8:51 AlphaGoの新しい論文だそうです。 AlphaGo Zero: Learning from scratch | DeepMind https://deepmind.com/blog/alphago-zero-learning-scratch/ …Nature : Nature Research http://www.nature.com/nature/journal/v550/n7676/full/nature24270.html 人間の棋譜を一切使わず学習しセドル戦のAlphaGoに100-0、Masterに89-11とか https://twitter.com/igowars/status/920799457985232896 AI囲碁は体力無限の化物が精神と時の部屋で 囲碁だけ研究してレベルアップしているようなもの そんな環境で育った化物の思考や戦略は 人間の知能じゃ理解不能かも知れない AI囲碁はもうこれ以上強くならなくていい 先手必勝という完全解析がされてしまったら 冷めてしまう人は一定数いるだろう それよりもAIの超高度な棋譜を人間レベルでも分かるように 解説出来る語学力をAIは身につけてもらいたい これの方が囲碁のレベルをアップさせ続けるよりも よっぽど人類の為になる zeroの棋譜公開されてるみたいですがどこから見れるかわかる人教えてください >>139 自己解決しました ネイチャーの論文からダウンロードできました 40日経過版のアルファ碁ゼロだが 黒番は小目や三々も打ってるな 白番はほとんど二連星だが例外もある なんで互先でやるんだろうな 打込み碁でやってくれた方が強さが分かりやすいのに 論文のレビュアーは囲碁知らないだろうからインパクトに欠けるってことか ごめんまちがえた アルファ碁ゼロ対アルファ碁(セドル) の棋譜だった 1ヶ月で人間の10万年先は行くな。もう、囲碁について人間が語る資格はない。 >>142 置石によるハンデの付け方がそもそも妥当なのかという問題が生じる 今までよくさ、機械学習だなんて大袈裟なこと言ってるけどやってることはただの最適化プログラムで人のやる"学習"とは程遠いよって言ってたがこれはもう"学習"と認めざるを得ないな 仮にこれを否定したら人のやる学習はどんなに高尚なんだってなったら何も言えない そして何より困ったことにその学習性能が人を遥かに超えてる 残り僅かに残されてる人の優位性は"意思"や"意識"とかなんだろうが産業面、軍事面では無用の長物なんだろうな AlphaGo Zero 同士の対決。 序盤はやはり Alpha Go Zero 同士でも三線目や四戦目辺りから打ち始めてる。 良かった。ゼロから始めた Alpha Go 師匠もそこに辿り着いたという事は、 人間の辿り着いた棋理のうち、そこは正解だったという事か。 「そこから既に間違えてるぞ、人間」となってたら、流石にどうにもならんところであるw Extended Data Figure 5: AlphaGo Zero (40 blocks) self-play games. http://www.nature.com/nature/journal/v550/n7676/fig_tab/nature24270_SF5.html 中央放置の人間じゃ勝てるわきゃないわな 人間は端っこのチマチマした戦いが精一杯 囲碁は深いから6000だっていけると思うぜ 要はアルファ碁ゼロに100戦100勝のアルゴリズムが作れればいいんだから >>150 名人戦最終局でプロが白優勢を主張する中 コンピューターは黒有利を断言してたしな 人に中央を扱いこなすのは無理だろうな 人間の処理能力だと中央は広すぎるんだろうなぁ 端の戦いx多数って理解の仕方しか出来ない 大局観とか何言ってたんだ?って話 人間をベースにして学習させると弱いってことが証明されてしまったか 完全に詰みだな 頭真っ白から3日で頂点かよ 人間が4000年かかってるのに しかし2年前にAIがプロに互先で初勝利というのを聞いたときは 大ニュースだと思ったが そこからまさかこれほどAIが未知の棋力の領域を広げるとは どんだけAIが強くなっても 人間と100戦すればまぐれで数局は負けるもんだと思ってたよ グーグルのマシンで3日なら 個人開発者なら一ヶ月くらいで超えるのかな? ていうか、人間が良かれと思って積み上げてきた膨大なデータ群より、 ランダムに石ばら撒くところから評価し直した方が圧倒的に強くなったって これもう悲劇なのか喜劇なのか分かんねーなwww プロ棋士の方々 本当にお疲れ様でしたってはなしだな とりあえずこのコンピューターにはこの世がシミュレーションであるかどうかも証明して欲しい ツイッターに突然トレンドに上がったから何事かと思ったらとんでもないことになってんな 強さの主因はネットワーク構造だから、他のソフトもそこはすぐ真似できる AlphaGo Zeroの棋譜、200万局学習させて resnet、VP統合 4300 resnet、VP分離 3700 cnn、VP統合 3700 cnn、VP分離 3100 一番最後のがv18のネットワーク構造 さっきBS1でプログラマーが新定石がたくさん発見されました、と嬉しそうに語ってたけど 流石にこの情報は非公開のままになるだろうな 家庭用パソコン使ったソフトでも、プロ九段より強い時代なんだな…。 そろそろオワコンなのか? あるふぁごぜろと井山七冠の一番手直り二十番碁をきぼん 何度同じ事を言えば意が済むのかね 機械がいくら強くなっても人同士が競い合う魅力は変わらない いや 3日で100戦100勝じゃなく そこまで到達できたのは40日後だよ AGZeroはAG Lee(Elo 3500)に3日、AG Master(Elo 4800) に21日で到達 40日でElo5000程度まで到達 学習局数が500万局とする 人間が研究付きで対局できるのが1日3局程度とする 毎日対局したとして500万局に到達するのに約4566年かかる 職業棋士が江戸時代と共に始まったとして約400年 AG Lee前後で伸び率がかなり落ちる事と 学習期間が400/4566で人間トップが大体セドルくらいと考えると人間のプロも頑張ってると言えなくもない 井山の師匠は、きみが教えると井山が弱くなるから教えるなと言われたらしいが、 コンピュータも人間から教えられてたから 弱くなっていたという皮肉。 人間は口出し無用の世界に入った。 コンピューターは、縄文時代以前から老いることなく、ひたすら碁を打ってきた仙人みたいな存在だろ 寿命たかたが100年の人間は5子置いて勝てれば上出来。 〜1年後〜 アルファ碁ゼロ2「スマン去年使ってた定石あれゴミだったわ」 もし、仮にAlphaGoが現段階でセドルやカケツとの対局が極秘に行われていて世間的にまったく認知されていないとしたら日本、中国、韓国棋院はひた隠しにするんだろうか >>172 〜10年後〜 アルファ碁ゼロ5 「スマン、囲碁完全解析しちゃって、飽きたわ。 もっと競技性高くてルールも単純明快で 流行るボードゲーム作ったので公開する」 zenの加藤がツイッターで言い訳がましい発言連発しててクソワロタwwww お前みたいなポンコツの老いぼれは指咥えて見てろやwwww 棋譜見たけどマスターのほうが知っちゃかめっチャカに打って減った糞に欠陥憑かれてボロボロになってるだけにしか見えんかったな はやく井山さんと打ち込み二十番碁を とりあえずAIには何ですぐ三々に入るのかを解説してほしいわw ソフトに人間が負けても、”追いつけるかも”と、ほんの少しでも思えれば 熱は冷めないどころか共通の敵を見つけた気分になって盛り上がる しかし、絶対に追いつけないと分かってしまうと、縮こまり、熱は冷め、離れていく 韓国でイセドルが負けつつも1勝をあげたことで少々の囲碁ブームが起きたが カケツが完全に破れてしまい、差が拡大していると分かって韓国の囲碁人気は イセドルとアルファ碁の対局前よりも急落した そして今回のゼロちゃん登場で根も絶たれるだろう 良くも悪くもマイペースな日本は囲碁人気が上がることも下がる事もないだろう >>157 無理だと思うよ。 マシン1台のスペックなら大差がなくても、個人じゃGoogleクラスのクラスタ組めないよ。 だから半年とか1年、下手したらそれでも全然無理かもしれない。 Zero vs Zeroの棋譜すげえな 初めての子どもでももうちょっとマシだろってのからある http://iup.2ch-library.com/i/i1860408-1508389832.jpg 50手まで チェスはとうの昔に人間じゃ手も足も出なくなってるけど、 別にゲームとしてすたれたという話は聞かんから、 不正対策をタイトル戦や大会ではやりましょう。 となるだけで特に何ら大きな変化はないと思う。 >>138 AIの解説「変化図によると後240手後にここにあったほうがいいでしょう」 「ここでは相手が必ずここに打ってきますのでこう打ったのです」 「先生、なぜ相手はそう打つんですか?」 「それはですね…とざっと変化図50万図ほど示して・・・これ以外に打つ場合に最善尽くしても半目負けちゃうでしょう?」 「ははぁ…なるほど…」 チェスがゲームとして廃れることはないが 人気が落ちてチェス界は少なからずダメージ負ったけどな 三目並べを学習するマッチ箱は1960年に実現してたのに 評価関数やら先読みやら、何十年も回り道して感じがするな https://ja.wikipedia.org/wiki/ ドナルド・ミッキー#.E6.88.A6.E5.BE.8C マッチ箱からここまで直行しなかったのは、計算機の能力不足によるものだったんだろうか? >>186 ソフトから逃げまくることで実力差を隠し人気を維持してる将棋界は賢いなwww Zero vs MasterたまにMasterも勝ってるな 中央の大模様に殴りこんでからの攻防が特に意味不明だ 誰も解説できんだろ 人類が機械人間にでもならない限り理解不能だなこりゃ 野狐で AlphaZero の対局総譜が並べられてる 現状10局位だけど入手可能な分全部やってくれるかな? 黒がかかったら即コスミつけるのか もう布石に関しては人間様は1どころかZEROから研究し直しだなこりゃ アルファ碁、さらに進化=自己学習のみで最強に―グーグル https://headlines.yahoo.co.jp/hl?a=20171019-00000005-jij-eurp https://deepmind.com/blog/alphago-zero-learning-scratch/ https://storage.googleapis.com/deepmind-live-cms/documents/AlphaGo%2520Zero%2520Training%2520Time.gif AlphaGo Zeroはセドル戦の時のレーティング3700の旧AlphaGoと100回やって100勝。 トッププロ相手に60連勝したmasterのレーティングが4800以上、 AlphaGo Zeroはmasterと100回やって勝率89%です。 AlphaGo Zeroはレーティング5000以上。トッププロに5子です。 なんでAlphaGo Zeroは家庭用のソフトにして発売しないんだ? AlphaGo Zeroは天頂や銀星なんかより遥かに強いだろ。 >>181 こういうのが中央重視なんだろうな そりゃ子どもが考えても一番広いのはどこか分かるわw レーティング5000て 人間は最高いくつまで行った事あるの >>201 オセロも6×6は解析済みだけど、8×8が解析されたとは聞かないからどうかな 前のアルファ碁ではシチョウに関しては、特別扱いしていたけど、 今度のはどうなんだろね。 MASTERが敗勢の最終盤に無意味な放り込みをやりまくってるのはちょっと笑えるな どれだけ強くなってもあれは治らんのかな ゼロのほうも負けそうだったらやるんだろうか むしろ恐れるのは、このAIと人間の圧倒的な棋力の差を見せ付けられて プロ棋士志望の少年少女が、「棋士」という職業を見限る事。 かつては神のような棋力の持ち主と崇拝されていた名人や本因坊が、 AIに掛かると赤子の手を捩じるように潰されたら、プロ棋士などくだらない職業と 感じるのはごく自然だろう。 >>194 トッププロに5子じゃ絶対に人類は勝てないやん。最後に勝ったセドルは後年に評価されてそう。 ちなみにイ・セドルと闘った時と比べて、CPUは1/22に減らされてる >>167 After 72 hours, we evaluated AlphaGo Zero against the exact version of AlphaGo Lee that defeated Lee Sedol, under the 2 hour time controls and match conditions as were used in the man-machine match in Seoul (see Methods). AlphaGo Zero used a single machine with 4 Tensor Processing Units (TPUs) 29, while AlphaGo Lee was distributed over many machines and used 48 TPUs. AlphaGo Zero defeated AlphaGo Lee by 100 games to 0 >>181 それ学習初期の棋譜だから、ランダムに打ってるのと同じ 40日間の学習を20棋譜で表してる 20層の方は72時間を20棋譜 ここまで圧倒的大差だとプロ志望者は減るかもな 趣味でやる奴は別に減らんだろうが >>169 井山に教えるなと言われたのは院生師範だった後藤 Re: AlphaGo Zero 投稿者:山下 投稿日:2017年10月19日(木)07時44分48秒 衝撃ですね・・・。 内容は囲碁の知識などは一切なしで、ルールのみから作ったものが セドル版のAlphaGoに100-0で勝つほど強くなったそうです。 1. 人間の知識などはいっさいなく、囲碁のルールのみ、からの自己対戦による強化学習 2. 入力は黒と白の石の配置のみ。ダメの数とかは一切なし。 3. Policy、Value、などと分割せずに、1つのネットワーク。 4. モンテカルロ法(Rollout)は使っていない。 個人的には 4. が衝撃でした。 以下はメモです。 人間がよく打つ隅の定石を見つけた(5つの例)。 33に入る定石は5手目に黒がケイマに飛ぶ形を最終的に好む 学習の初期は石を取ることを好み、次に死活の基礎を学び、最終的にバランスが取れた美しい手を打つ 学習から36時間でセドル戦のバージョンに追いついた。 セドル版には100-0で勝つ。 プロの手の一致率は48%ぐらいと低い。プロの手から学習したものは54%ぐらい。 ResNetが単なるConvolutionより優秀で、PolicyとValueを一つのネットワークで評価するのが優秀。 出力はValueとPolicy。一つのネットワーク。 入力は石の配置と着手履歴(棋譜)。 0から7手前までの黒、白の配置と手番(17面) ResNetを使ってる。Batch Normalizationあり。 40 Residual Block 1 Block は (3x3 256, BN, ReLU)が2つ。つまり 80層のConvolution ZeroはMasterに89勝11敗 MasterはZeroと同じ手法で作られているが、人が作ったRolloutは使っていた。 学習段階ではMCTSを使ってる。 学習の中に先読みを取り入れた、新しい強化学習 -------------------------------------------------------- 自己対戦の棋譜はこちらにあるようです。 AlphaGo Zeroの自己対戦の棋譜 https://www.nature.com/nature/journal/v550/n7676/extref/nature24270-s2.zip http://524.teacup.com/yss/bbs/ >>194 アルファ碁Zeroって任天堂switchみたいで格好いい グーグルがAlphaGo masterはセドル戦の時の旧AlphaGoに4子で勝てるって言っていたよ。 セドル戦の時の旧AlphaGoと柯潔が互角だとしてAlphaGo ZeroはAlphaGo masteに勝率89%で一子は強いだろうから柯潔に5子です。 https://deepmind.com/blog/alphago-zero-learning-scratch/ AlphaGo Zeroレーティング5000以上です。 https://www.goratings.org/ja/ 柯潔はレーティング3667です。 いい加減「囲碁入門スクール」「指導碁」してくれる囲碁ソフトが発売されれば良い そうすれば囲碁の面白さに気づいてソフトを買う人も増えてくるだろう プロから直接学ぶよりもコストが下がるだろう >>216 zeroのネーミングなんて他でもある(コカコーラゼロとか)のにパイオニアであるDeepMindが名前付けると格好よく聞こえるね 1でもない2でもない10でもない それらすべての数と一線を画す存在 始源の0 名付けて AlphaGo Zero やっぱりいいわ響きが違う >>218 それやったらプロ棋士がいよいよ要らなくなるから是が非でも棋院は阻止するだろうな でも、現状の天頂7の機能でもある程度の棋力があれば自分で学べそうだけどな AlphaGo Zeroに9子で勝ったらアマ6段はあると思う。 >>214 > 4. モンテカルロ法(Rollout)は使っていない。 > 個人的には 4. が衝撃でした。 モンテカルロを使ってないってことは読みはどうやってるんだろ? ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる