【俺たちの】Leela普及委員会【無料ソフト】Part.2
■ このスレッドは過去ログ倉庫に格納されています
LeelaZeroとは
AlphaGoZeroの論文に大いに触発されたLeelaの作者がこの論文に沿ってLeelaをお手本無しで
最低限のルールしか教えてない状態から自己対局のみで鍛え上げようというプロジェクト。
AlphaGoZeroがEloRatingで5185の棋力を実現するために2900万局の自己対戦をしたとのことで、
個人の設備でチンタラやっていたら100年かかるため、俺らのPCの計算資源をちょっとずつ
分けてくれ!という界王拳みたいなことを言い始める。
自己対戦で1局15分として1日で約100局、常時2000台のPCが参加してくれたら1日約20万局になり
半年もあればAlphaGoZeroの自己対局数に届く計算になる。
あくまで計算上の話だが。
だが実情としては
633 clients in past 24 hours, 227 in past hour.
825618 total submitted games. (59430 in past 24 hours, 2424 in past hour.)
ぶっちゃけ全然足りないのでお前らのPCの計算資源を少しずつ分けてほしい。
事が成ればElo6000クラスの囲碁の神が俺らのPCに無料で降臨するという夢のある話だ。 LeelaZeroへの協力のやり方
1.>1にあるLeelaZero公式からLeelaZeroの最新版とAutoGTPの詰め合わせをDLする。
2.解凍する。
3.解答先のフォルダにあるAutoGTPを起動する。
後は全て自動で自己対戦して結果を開発者あてに送信してくれる。 LeelaWatcherの使い方がイマイチわからん /゚ 。
/ . ゚
, ' 。 ・
` ー _ - ' ゜
。 . 。 ゚
: 。
゚ .
ヾ冖フ ヾス
[ ,] [ ] 、_ノ、_人_人_人_人_人_人_人_人_人_人_
|. i /l,ィ .! ノ
. ! }.r`'j7 ! _) 皆、オラにPCの余剰計算能力を分けてくれ!
! `、亠 { ヽ
} _l _,l_,j '^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^
ヽシ_,-i {
/`´~バ}
. / j !
∧ '"/`,イ
! ヽ'/l_ j
/ \,/ }\,!
.ァ、ヽィ <`-イ
. |. `iT. ヽ j
\ll' `'
LeelaZeroとは
AlphaGoZeroの論文に大いに触発されたLeelaの作者がこの論文に沿ってLeelaをお手本無しで
最低限のルールしか教えてない状態から自己対局のみで鍛え上げようというプロジェクト。
AlphaGoZeroがEloRatingで5185の棋力を実現するために2900万局の自己対戦をした。
しかし個人の設備でチンタラやっていたら100年はかかる。
そこで、俺らのPCの計算資源をちょっとずつ分けて
元気玉みたいなグリッドコンピューティングの方法で協力しようってわけ
LeelaZeroへの協力のやり方
1.http://zero.sjeng.org/にあるLeelaZero公式からLeelaZeroの最新版とAutoGTPの詰め合わせをDLする。
2.解凍する。
3.解答先のフォルダにあるAutoGTPを起動する。
後は全て自動で自己対戦して結果を開発者あてに送信してくれる。 前スレで変え忘れたって言ってたよ
>>7では変わってるみたいだが まぁ、新しいスレだしテンプレもそのうち整備されるだろ というか人の入れ替わりなんてそんな無いんだからそんな神経質になることないだろ 前レスの最初の頃からここの住人です。
ちょっと難しい話が多く、テンプレで少しの説明を願います。 LeelaZero+545cとAQ2.1.1との対局です
一手5秒で
GTX890ti LeelaZero 54勝46敗
GTX970 LeelaZero 53勝47敗
となりました
誤差もあるので、ソフト同士の勝敗ではほぼAQに並んだと思えます CGOSのEloで3700ぐらいはあるってことかな
ちょっと伸び過ぎのような気もするが >>16
毎回嘘くさいんだけど
200も無駄にやらずに10局で良いから時間を長くして一手15秒とかにして棋譜載せなよ
もしくはCGOSで100局試しなよ Guiからは動くけどAQってコマンドラインからじゃ動かなくないか?
GoGuiToolじゃ動かないと思うがどうやって動かしてるんだろう? ふと思ったんだが、三コウとかは分からないとして長生も分からず延々と打っちゃう? >>24
GTPプロトコルに対応してるプログラムは基本的に全部GoGUITool(gogui-twogtp)で走るよ パンダでLZがまた負けた
シチョウが弱点ってバレてるから
嵌め手みたいに簡単に序盤で負ける >>27
guiからは動くけどjavaにコマンドラインで渡して動かすのは無理じゃない?
windows版でもコマンドラインでやると動かないし
AQ以外は動いてるからAQだけなんかおかしいと思うが
2.1.1でちゃんと動いてる? >>29
うちの環境のWindowsのバイナリだとたまに挙動がおかしくなることはある
gogui-twogtpって引数でワーキングディレクトリ設定できたっけ?もしかしたらそこで引っかかるのかもしれないな >>30
エンジン登録上はちゃんとワーキングAQと同じフォルダに指定してるけどコマンドライン上は分からない
とりあえずsabakiでまったりやるわ
黒白交互に2回ずつやった限りだと18827fa7がAQより強いみたいだから20になれば4000超えるかもね leelazeroのクローンがKGSで7dなのにAQは越えてないだろ >>32
人間と打つのはまた違うってだけだろ
自分でやってみれば良いじゃん
シチョウであっさり負けることもあるけどシチョウが出てこない碁だと18827fa7はAQより強いよ AQ側に問題があって極端にleelazeroに相性が悪いかもしれんだろ
CGOSで3800オーバーしたのか? >>16の追試も兼ねてAQ2.1.1と18827fa7で10局だけ打たせてみた
CGOSルール(持ち時間900秒)で結果はAQの6勝4敗でした
現時点でどちらが強いかの議論をするなら10局では足らなさそう
データと棋譜
https://bimaculata.000webhostapp.com/index.html
お互いにponderingなし、スレッド数2、ハードはi5-6500とGTX1070です >>39
全部leelaの方が打つ時間短いな
家庭用としては優秀だ シチョウアタリで逃げれたと思ったら折り返してまたシチョウで取られてるのワロタ >>39
あんな言われ方で文句も言わず追試もして結果も出してくれるとは良いお人だ CGOSでp1600で試してくれるのが最も信憑性がある
同じ100局でやるなら 20 blocks x 256 filtersとか40とかて実際どれくらい対局数減るのかテストしてもらいたい
早く大きく出来るならその方がいい
飽きて人が減っていく前に self play における "resignation_percent": "XX", は設定されている場合とされていない場合があるね
"options_hash": "fd7105", > resign無し "resignation_percent": "0"
"options_hash": "a4325b", > resign有り "resignation_percent": "10" >>46
cgosはハードが千差万別だからね
ソフトの比較なら同一ハードで、対局条件を変えつつ比較する方が良いのでは
p1600で放流しても、1600同士の比較でしかないし 紆余曲折あったけど
後半くらいから長期的に見ればほぼ一定で上がってきてるし
4月中には上位5位くらいには届きそう Googleって3日ぐらいでレート5000ぐらいになったらしいけど
家庭用パソコン何台分ぐらいの計算量なの? 早速、0f6a8c5fと打ってみたが
やっぱりシチョウが読めてないな
一応p16000でやってみたけど
http://gokifu.net/t2.php?s=6621520870374553 人間の棋譜から学習した256×20のネットワーク使ったleelazeroもシチョウ読めないし(http://www.yss-aya.com/cgos/19x19/cross/LZH256x20-t4-nolim.html)
leelazeroの探索部本体のバグの可能性も排除できない
もちろん学習途上の可能性が一番高いけど うーん、AlphaGoZeroはどうだったんだろな?
CGOSでもそこそこのとこに行くけどシチョウは分からないのは興味深い
人間はすぐさまシチョウ教えられるのにな(笑) Alphazeroの学習がなぜ伸びが止まってからも40日かけたのか
それはシチョウを学ぶまで待ってたんじゃないか
つまりR5000越えるまでzero学習だとシチョウ分からない説 アルファ碁ゼロはMCTSでロールアウトしないからLeelaZeroと異なる方法でシチョウを学習したのかもしれない
ここで気づいたけどLeelaZeroってプレイアウトとかやってる時点でアルファ碁ゼロとぜんぜん違う実装なんじゃないのか
俺が深刻な誤解をしてるだけか? マスターに完勝出来るまでが49日だったんじゃないの?
グラフでもマスターに追いついたあとはほとんど近いところだったし
というかpassしてたのがfailになってる
一応ベストになってるけど pass扱いにはなってるわ
failの後とか対局数増えたりしてるのもあるからpssになった後遅れて入ってきたデータで少し下がった感じだろうかね なるほど
てか、-k kifuで棋譜が自動保存されるのさっき知った
これ面白いな http://zero.sjeng.org/viewmatch/89b40f40f0c7a558f0945df64b05bab560e4fa42e0f5ec72769f4d8804ca6a7f?viewer=wgo
http://zero.sjeng.org/viewmatch/cc8017b51012110a3c2e1e2e3bff8fa140d3c9d86735010f668dfaea7b2cc145?viewer=wgo
さっきのpassの中の対局
上は左下黒生きてるみたいになってて最後大差負けだったのがいきなり大差で黒勝ち
不思議なのが160手目に白が左下の死活にあまり関係ない近場をツイだ時に白34.5目勝ちだったのが、161手目に黒が全く関係ない右上を打った時点で黒の84.5目勝ちになってる
よくわからない
こういう感じで生き死に判定間違ってるの結構あるのかも
下は意味不明な感じ
囲碁始めたばかりの人とか知らない人がどうやったら終局か分からないって言うのを思い出した
alphaは終局の設定どうしてたんだろう アルファゼロのグラフの真ん中あたりに一度学習終わったかの様な後で跳ねてるけど
そこでシチョウ理解したような気がする Zero論文より
Surprisingly, shicho (‘ladder’ capture sequences that may span the whole board) ?one of
the first elements of Go knowledge learned by humans?were only
understood by AlphaGo Zero much later in training.
らしいので>>66が正しい気がする シチョウは学習出来ないって
形も固定じゃないし、手数も物凄く長いでしょ
人間だってシチョウ読めないから石を近くに持ってくる方法で読んでるじゃん
片方がセキで片方がセキ崩れみたいのも読めないよ leelazが明後日韓国の女流と打つらしいけどどうなるかね >>70
https://m.facebook.com/story.php?story_fbid=1471089503013875&id=741403459315820&__tn__=%2As%2As-R
hayleeさんという人がOGSで打つらしい
時差がかなりあるから今日の夜あたりかも? >>71
サンクス
日本時間だと16日の朝7時からだね パンダで日本のアマにシチョウで負けまくって9段止まり
プロとやるレベルではない シチョウはやらないと思うよ
というか操作側が回避してくれるんじゃないか? >>76
別に凄くない
難しい碁を打たなきゃ良いだけ シチョウにはまらなきゃプロレベルとも言えるからやる意味あるでしょ
それともアマに簡単に負けるソフトとはやりたくないと? 禁じ手としてシチョウは駄目
こんな裏ルール気にしながら人間は打たなきゃならないのか
オエー シチョウで勝てばいいじゃんでも負けたからってシチョウに誘導すれば勝てたって言うのはクソダサい 急にいっぱいテスト対局相手出てきたな
何のテストだろうか 人間と比較すると歪な強さなんだけどだからどうしたって話でもある
機械と人間比べる時代はもう終わったんだから単純にどう育つか見守ればいいんじゃないのかな
まだ争ってる認識でAlphaは間違いだったって主張なら仕方ないが バグか荒らしのような気がする
上の三つは50%でfailになったやつだね これって、PASSしたからって前より強くなってる保証あんの?
いわゆるすくみ関係になってたりしないか 偏った強さにはなるだろうけどその偏りが囲碁は影響少ないんだと思うぞ https://github.com/pnprog/goreviewpartner
leelazeroのいい解析ソフトを見つけたのでよかったらどうぞ
勝率グラフと次の候補手をツリーで見ることができる
GUIは以下の画像みたいな感じ
https://i.imgur.com/H1oqXvh.png 自分もnすくみの可能性を昔考えたけど、ニューラルネットワークが十分柔軟なら勝手に解決してくれるんじゃないの?
グーを出す相手にはパーを、チョキを出す相手にはグーを出せば勝率は上がるんだから グーを出す相手にはパーを、チョキを出す相手にはグーを出せば勝率は上がちゃうのが問題なんじゃないの? ここの連中って黙って見守る事が出来ないんだな
自分じゃプログラム作れるわけでも無いのに文句だけ言う
ワロス 相性問題があっても強いと確信できるラインが55%なんだと思う
もちろん400戦で統計的に有意な差があると言えるラインってこともあるけどね
実際にleelaのレートの伸びが9300なのに対してのcgosのレートの伸びが2200ぐらいで1/4以下になっているから
大半は相性によって過剰に伸びたレートだと言うこともできる 毎回 Elo通りに強くなってるかは不明だけど1〜2週間スパンで見ると強くなってると思う
月単位だと更に分かりやすい
シチョウもネットワーク拡大して行ったら分かる時が来るのかも知れない
強いソフトを作るのではなく、変化過程を観察する実験だからね
まあ、この辺りまで強くなると実用的なソフトとして欲しくなるのは仕方ないが 古いパスしてないやつ相手に対局してるのほんとなんなんだろう
100局超えて70%なんだけどこれパスしたらどうなるんだ This was @gcp testing a 20 block bootstrap.
だって hash 2573eb35で複数対戦させているもののうち、4dc12a8eのサイズが大きくなっているので
早めにhashの拡張をすることを考えているのか? ■ このスレッドは過去ログ倉庫に格納されています