【俺たちの】Leela普及委員会【無料ソフト】Part.2
■ このスレッドは過去ログ倉庫に格納されています
LeelaZeroとは AlphaGoZeroの論文に大いに触発されたLeelaの作者がこの論文に沿ってLeelaをお手本無しで 最低限のルールしか教えてない状態から自己対局のみで鍛え上げようというプロジェクト。 AlphaGoZeroがEloRatingで5185の棋力を実現するために2900万局の自己対戦をしたとのことで、 個人の設備でチンタラやっていたら100年かかるため、俺らのPCの計算資源をちょっとずつ 分けてくれ!という界王拳みたいなことを言い始める。 自己対戦で1局15分として1日で約100局、常時2000台のPCが参加してくれたら1日約20万局になり 半年もあればAlphaGoZeroの自己対局数に届く計算になる。 あくまで計算上の話だが。 だが実情としては 633 clients in past 24 hours, 227 in past hour. 825618 total submitted games. (59430 in past 24 hours, 2424 in past hour.) ぶっちゃけ全然足りないのでお前らのPCの計算資源を少しずつ分けてほしい。 事が成ればElo6000クラスの囲碁の神が俺らのPCに無料で降臨するという夢のある話だ。 LeelaZeroへの協力のやり方 1.>1にあるLeelaZero公式からLeelaZeroの最新版とAutoGTPの詰め合わせをDLする。 2.解凍する。 3.解答先のフォルダにあるAutoGTPを起動する。 後は全て自動で自己対戦して結果を開発者あてに送信してくれる。 LeelaWatcherの使い方がイマイチわからん /゚ 。 / . ゚ , ' 。 ・ ` ー _ - ' ゜ 。 . 。 ゚ : 。 ゚ . ヾ冖フ ヾス [ ,] [ ] 、_ノ、_人_人_人_人_人_人_人_人_人_人_ |. i /l,ィ .! ノ . ! }.r`'j7 ! _) 皆、オラにPCの余剰計算能力を分けてくれ! ! `、亠 { ヽ } _l _,l_,j '^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^ ヽシ_,-i { /`´~バ} . / j ! ∧ '"/`,イ ! ヽ'/l_ j / \,/ }\,! .ァ、ヽィ <`-イ . |. `iT. ヽ j \ll' `' LeelaZeroとは AlphaGoZeroの論文に大いに触発されたLeelaの作者がこの論文に沿ってLeelaをお手本無しで 最低限のルールしか教えてない状態から自己対局のみで鍛え上げようというプロジェクト。 AlphaGoZeroがEloRatingで5185の棋力を実現するために2900万局の自己対戦をした。 しかし個人の設備でチンタラやっていたら100年はかかる。 そこで、俺らのPCの計算資源をちょっとずつ分けて 元気玉みたいなグリッドコンピューティングの方法で協力しようってわけ LeelaZeroへの協力のやり方 1.http://zero.sjeng.org/ にあるLeelaZero公式からLeelaZeroの最新版とAutoGTPの詰め合わせをDLする。 2.解凍する。 3.解答先のフォルダにあるAutoGTPを起動する。 後は全て自動で自己対戦して結果を開発者あてに送信してくれる。 前スレで変え忘れたって言ってたよ >>7 では変わってるみたいだが まぁ、新しいスレだしテンプレもそのうち整備されるだろ というか人の入れ替わりなんてそんな無いんだからそんな神経質になることないだろ 前レスの最初の頃からここの住人です。 ちょっと難しい話が多く、テンプレで少しの説明を願います。 LeelaZero+545cとAQ2.1.1との対局です 一手5秒で GTX890ti LeelaZero 54勝46敗 GTX970 LeelaZero 53勝47敗 となりました 誤差もあるので、ソフト同士の勝敗ではほぼAQに並んだと思えます CGOSのEloで3700ぐらいはあるってことかな ちょっと伸び過ぎのような気もするが >>16 毎回嘘くさいんだけど 200も無駄にやらずに10局で良いから時間を長くして一手15秒とかにして棋譜載せなよ もしくはCGOSで100局試しなよ Guiからは動くけどAQってコマンドラインからじゃ動かなくないか? GoGuiToolじゃ動かないと思うがどうやって動かしてるんだろう? ふと思ったんだが、三コウとかは分からないとして長生も分からず延々と打っちゃう? >>24 GTPプロトコルに対応してるプログラムは基本的に全部GoGUITool(gogui-twogtp)で走るよ パンダでLZがまた負けた シチョウが弱点ってバレてるから 嵌め手みたいに簡単に序盤で負ける >>27 guiからは動くけどjavaにコマンドラインで渡して動かすのは無理じゃない? windows版でもコマンドラインでやると動かないし AQ以外は動いてるからAQだけなんかおかしいと思うが 2.1.1でちゃんと動いてる? >>29 うちの環境のWindowsのバイナリだとたまに挙動がおかしくなることはある gogui-twogtpって引数でワーキングディレクトリ設定できたっけ?もしかしたらそこで引っかかるのかもしれないな >>30 エンジン登録上はちゃんとワーキングAQと同じフォルダに指定してるけどコマンドライン上は分からない とりあえずsabakiでまったりやるわ 黒白交互に2回ずつやった限りだと18827fa7がAQより強いみたいだから20になれば4000超えるかもね leelazeroのクローンがKGSで7dなのにAQは越えてないだろ >>32 人間と打つのはまた違うってだけだろ 自分でやってみれば良いじゃん シチョウであっさり負けることもあるけどシチョウが出てこない碁だと18827fa7はAQより強いよ AQ側に問題があって極端にleelazeroに相性が悪いかもしれんだろ CGOSで3800オーバーしたのか? >>16 の追試も兼ねてAQ2.1.1と18827fa7で10局だけ打たせてみた CGOSルール(持ち時間900秒)で結果はAQの6勝4敗でした 現時点でどちらが強いかの議論をするなら10局では足らなさそう データと棋譜 https://bimaculata.000webhostapp.com/index.html お互いにponderingなし、スレッド数2、ハードはi5-6500とGTX1070です >>39 全部leelaの方が打つ時間短いな 家庭用としては優秀だ シチョウアタリで逃げれたと思ったら折り返してまたシチョウで取られてるのワロタ >>39 あんな言われ方で文句も言わず追試もして結果も出してくれるとは良いお人だ CGOSでp1600で試してくれるのが最も信憑性がある 同じ100局でやるなら 20 blocks x 256 filtersとか40とかて実際どれくらい対局数減るのかテストしてもらいたい 早く大きく出来るならその方がいい 飽きて人が減っていく前に self play における "resignation_percent": "XX", は設定されている場合とされていない場合があるね "options_hash": "fd7105", > resign無し "resignation_percent": "0" "options_hash": "a4325b", > resign有り "resignation_percent": "10" >>46 cgosはハードが千差万別だからね ソフトの比較なら同一ハードで、対局条件を変えつつ比較する方が良いのでは p1600で放流しても、1600同士の比較でしかないし 紆余曲折あったけど 後半くらいから長期的に見ればほぼ一定で上がってきてるし 4月中には上位5位くらいには届きそう Googleって3日ぐらいでレート5000ぐらいになったらしいけど 家庭用パソコン何台分ぐらいの計算量なの? 早速、0f6a8c5fと打ってみたが やっぱりシチョウが読めてないな 一応p16000でやってみたけど http://gokifu.net/t2.php?s=6621520870374553 人間の棋譜から学習した256×20のネットワーク使ったleelazeroもシチョウ読めないし(http://www.yss-aya.com/cgos/19x19/cross/LZH256x20-t4-nolim.html ) leelazeroの探索部本体のバグの可能性も排除できない もちろん学習途上の可能性が一番高いけど うーん、AlphaGoZeroはどうだったんだろな? CGOSでもそこそこのとこに行くけどシチョウは分からないのは興味深い 人間はすぐさまシチョウ教えられるのにな(笑) Alphazeroの学習がなぜ伸びが止まってからも40日かけたのか それはシチョウを学ぶまで待ってたんじゃないか つまりR5000越えるまでzero学習だとシチョウ分からない説 アルファ碁ゼロはMCTSでロールアウトしないからLeelaZeroと異なる方法でシチョウを学習したのかもしれない ここで気づいたけどLeelaZeroってプレイアウトとかやってる時点でアルファ碁ゼロとぜんぜん違う実装なんじゃないのか 俺が深刻な誤解をしてるだけか? マスターに完勝出来るまでが49日だったんじゃないの? グラフでもマスターに追いついたあとはほとんど近いところだったし というかpassしてたのがfailになってる 一応ベストになってるけど pass扱いにはなってるわ failの後とか対局数増えたりしてるのもあるからpssになった後遅れて入ってきたデータで少し下がった感じだろうかね なるほど てか、-k kifuで棋譜が自動保存されるのさっき知った これ面白いな http://zero.sjeng.org/viewmatch/89b40f40f0c7a558f0945df64b05bab560e4fa42e0f5ec72769f4d8804ca6a7f?viewer=wgo http://zero.sjeng.org/viewmatch/cc8017b51012110a3c2e1e2e3bff8fa140d3c9d86735010f668dfaea7b2cc145?viewer=wgo さっきのpassの中の対局 上は左下黒生きてるみたいになってて最後大差負けだったのがいきなり大差で黒勝ち 不思議なのが160手目に白が左下の死活にあまり関係ない近場をツイだ時に白34.5目勝ちだったのが、161手目に黒が全く関係ない右上を打った時点で黒の84.5目勝ちになってる よくわからない こういう感じで生き死に判定間違ってるの結構あるのかも 下は意味不明な感じ 囲碁始めたばかりの人とか知らない人がどうやったら終局か分からないって言うのを思い出した alphaは終局の設定どうしてたんだろう アルファゼロのグラフの真ん中あたりに一度学習終わったかの様な後で跳ねてるけど そこでシチョウ理解したような気がする Zero論文より Surprisingly, shicho (‘ladder’ capture sequences that may span the whole board) ?one of the first elements of Go knowledge learned by humans?were only understood by AlphaGo Zero much later in training. らしいので>>66 が正しい気がする シチョウは学習出来ないって 形も固定じゃないし、手数も物凄く長いでしょ 人間だってシチョウ読めないから石を近くに持ってくる方法で読んでるじゃん 片方がセキで片方がセキ崩れみたいのも読めないよ leelazが明後日韓国の女流と打つらしいけどどうなるかね >>70 https://m.facebook.com/story.php?story_fbid=1471089503013875& ;id=741403459315820&__tn__=%2As%2As-R hayleeさんという人がOGSで打つらしい 時差がかなりあるから今日の夜あたりかも? ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる