【俺たちの】Leela普及委員会【無料ソフト】Part.2

■ このスレッドは過去ログ倉庫に格納されています
1名無し名人2018/03/11(日) 00:34:26.30ID:xMakKGvj
フリーソフトでありながらKGS8dクラスの棋力を誇る囲碁AI、Leelaについて語り合うスレ。
Leela公式 https://www.sjeng.org/leela.html
LeelaZero公式 http://zero.sjeng.org/
※前スレ
【俺たちの】Leela普及委員会【無料ソフト】
http://medaka.5ch.net/test/read.cgi/gamestones/1512646337/

2名無し名人2018/03/11(日) 00:35:18.27ID:xMakKGvj
LeelaZeroとは

AlphaGoZeroの論文に大いに触発されたLeelaの作者がこの論文に沿ってLeelaをお手本無しで
最低限のルールしか教えてない状態から自己対局のみで鍛え上げようというプロジェクト。

AlphaGoZeroがEloRatingで5185の棋力を実現するために2900万局の自己対戦をしたとのことで、
個人の設備でチンタラやっていたら100年かかるため、俺らのPCの計算資源をちょっとずつ
分けてくれ!という界王拳みたいなことを言い始める。

自己対戦で1局15分として1日で約100局、常時2000台のPCが参加してくれたら1日約20万局になり
半年もあればAlphaGoZeroの自己対局数に届く計算になる。
あくまで計算上の話だが。

だが実情としては

633 clients in past 24 hours, 227 in past hour.
825618 total submitted games. (59430 in past 24 hours, 2424 in past hour.)

ぶっちゃけ全然足りないのでお前らのPCの計算資源を少しずつ分けてほしい。
事が成ればElo6000クラスの囲碁の神が俺らのPCに無料で降臨するという夢のある話だ。

3名無し名人2018/03/11(日) 00:36:23.43ID:xMakKGvj
LeelaZeroへの協力のやり方

1.>1にあるLeelaZero公式からLeelaZeroの最新版とAutoGTPの詰め合わせをDLする。
2.解凍する。
3.解答先のフォルダにあるAutoGTPを起動する。

後は全て自動で自己対戦して結果を開発者あてに送信してくれる。

4名無し名人2018/03/11(日) 04:37:20.72ID:xMakKGvj
LeelaWatcherの使い方がイマイチわからん

5名無し名人2018/03/11(日) 09:42:49.09ID:AOniNxc0
(CGOS) 19x19 Computer Go Server
http://www.yss-aya.com/cgos/19x19/standings.html

6名無し名人2018/03/11(日) 09:44:18.62ID:AOniNxc0
                /゚    。
                / .  ゚
           , '    。  ・
` ー  _   -  '   ゜
。       .      。  ゚
    :     。
゚             .
  ヾ冖フ  ヾス
   [ ,]   [ ]     、_ノ、_人_人_人_人_人_人_人_人_人_人_
   |. i /l,ィ .!     ノ
.   !  }.r`'j7 !    _)  皆、オラにPCの余剰計算能力を分けてくれ!
   ! `、亠 {     ヽ
    } _l _,l_,j      '^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^
    ヽシ_,-i {
     /`´~バ}
.   /   j !
    ∧ '"/`,イ
   ! ヽ'/l_  j
  / \,/ }\,!
  .ァ、ヽィ  <`-イ
.  |. `iT.   ヽ j
  \ll'    `'
LeelaZeroとは

AlphaGoZeroの論文に大いに触発されたLeelaの作者がこの論文に沿ってLeelaをお手本無しで
最低限のルールしか教えてない状態から自己対局のみで鍛え上げようというプロジェクト。

AlphaGoZeroがEloRatingで5185の棋力を実現するために2900万局の自己対戦をした。
しかし個人の設備でチンタラやっていたら100年はかかる。
そこで、俺らのPCの計算資源をちょっとずつ分けて
元気玉みたいなグリッドコンピューティングの方法で協力しようってわけ

LeelaZeroへの協力のやり方

1.http://zero.sjeng.org/にあるLeelaZero公式からLeelaZeroの最新版とAutoGTPの詰め合わせをDLする。
2.解凍する。
3.解答先のフォルダにあるAutoGTPを起動する。

後は全て自動で自己対戦して結果を開発者あてに送信してくれる。

7名無し名人2018/03/11(日) 18:47:52.65ID:zvnTWMmr
>>2
どうでもいいけど元気玉な

8名無し名人2018/03/11(日) 19:19:28.58ID:3PDD2utV
前スレで変え忘れたって言ってたよ
>>7では変わってるみたいだが

9名無し名人2018/03/11(日) 19:19:56.32ID:3PDD2utV
すまん>>7じゃなくて>>6

10名無し名人2018/03/11(日) 19:23:28.35ID:DzdVUp7F
まぁ、新しいスレだしテンプレもそのうち整備されるだろ

11名無し名人2018/03/11(日) 19:32:01.40ID:1+zOd+go
というか人の入れ替わりなんてそんな無いんだからそんな神経質になることないだろ

12名無し名人2018/03/11(日) 19:55:01.72ID:epwKN5kD
前レスの最初の頃からここの住人です。
ちょっと難しい話が多く、テンプレで少しの説明を願います。

13名無し名人2018/03/11(日) 20:25:08.71ID:xBiFBDvm
leelaはバージョンアップしてんのかね

14名無し名人2018/03/11(日) 20:47:37.65ID:FtbJZFt0
特大のリーラ玉が出来上がると良いな

15名無し名人2018/03/11(日) 21:38:01.34ID:aIqAOApF
ごちゃごちゃうるさいやつはチンコ小さすぎやな

16名無し名人2018/03/11(日) 23:32:51.10ID:S9+Zp/gk
LeelaZero+545cとAQ2.1.1との対局です
一手5秒で
GTX890ti LeelaZero 54勝46敗
GTX970  LeelaZero 53勝47敗
となりました

誤差もあるので、ソフト同士の勝敗ではほぼAQに並んだと思えます

17名無し名人2018/03/11(日) 23:33:54.32ID:S9+Zp/gk
>>16
890は980の間違えです

18名無し名人2018/03/11(日) 23:42:14.92ID:DzdVUp7F
545ca強いな
パスも中々通らんし

19名無し名人2018/03/12(月) 00:24:05.93ID:xOFO2Llu
CGOSのEloで3700ぐらいはあるってことかな
ちょっと伸び過ぎのような気もするが

20名無し名人2018/03/12(月) 00:24:55.66ID:xOFO2Llu
>>16
乙です
良ければやり方を教えてください

21名無し名人2018/03/12(月) 02:45:21.99ID:IX2Xdnmf
>>20
GoGuiToolが簡単

22名無し名人2018/03/12(月) 05:29:24.17ID:nyaH6rQc
ひさしぶりにパスしそう

23名無し名人2018/03/12(月) 07:04:17.86ID:oO9llNre
>>16
毎回嘘くさいんだけど
200も無駄にやらずに10局で良いから時間を長くして一手15秒とかにして棋譜載せなよ
もしくはCGOSで100局試しなよ

24名無し名人2018/03/12(月) 07:42:03.46ID:nooPdJ1h
Guiからは動くけどAQってコマンドラインからじゃ動かなくないか?
GoGuiToolじゃ動かないと思うがどうやって動かしてるんだろう?

25名無し名人2018/03/12(月) 09:19:58.97ID:jnQxaMY/
ふと思ったんだが、三コウとかは分からないとして長生も分からず延々と打っちゃう?

26名無し名人2018/03/12(月) 10:45:11.56ID:SsJvBime
語るに落ちるとはこのことか

27名無し名人2018/03/12(月) 11:41:21.60ID:IX2Xdnmf
>>24
GTPプロトコルに対応してるプログラムは基本的に全部GoGUITool(gogui-twogtp)で走るよ

28名無し名人2018/03/12(月) 12:01:42.32ID:v69GtETU
パンダでLZがまた負けた
シチョウが弱点ってバレてるから
嵌め手みたいに簡単に序盤で負ける

29名無し名人2018/03/12(月) 12:05:10.90ID:nooPdJ1h
>>27
guiからは動くけどjavaにコマンドラインで渡して動かすのは無理じゃない?
windows版でもコマンドラインでやると動かないし
AQ以外は動いてるからAQだけなんかおかしいと思うが
2.1.1でちゃんと動いてる?

30名無し名人2018/03/12(月) 12:12:13.33ID:IX2Xdnmf
>>29
うちの環境のWindowsのバイナリだとたまに挙動がおかしくなることはある
gogui-twogtpって引数でワーキングディレクトリ設定できたっけ?もしかしたらそこで引っかかるのかもしれないな

31名無し名人2018/03/12(月) 12:21:05.67ID:nooPdJ1h
>>30
エンジン登録上はちゃんとワーキングAQと同じフォルダに指定してるけどコマンドライン上は分からない
とりあえずsabakiでまったりやるわ
黒白交互に2回ずつやった限りだと18827fa7がAQより強いみたいだから20になれば4000超えるかもね

32名無し名人2018/03/12(月) 12:30:35.08ID:d6EArY8A
leelazeroのクローンがKGSで7dなのにAQは越えてないだろ

33名無し名人2018/03/12(月) 13:24:21.97ID:roXSwZEP

34名無し名人2018/03/12(月) 13:25:30.02ID:nooPdJ1h
>>32
人間と打つのはまた違うってだけだろ
自分でやってみれば良いじゃん
シチョウであっさり負けることもあるけどシチョウが出てこない碁だと18827fa7はAQより強いよ

35名無し名人2018/03/12(月) 13:27:07.10ID:d6EArY8A
別に負けた碁はシチョウばっかりじゃないんだけど

36名無し名人2018/03/12(月) 13:30:27.48ID:nooPdJ1h
また日本語が分からないやつか
囲碁は多過ぎ

37名無し名人2018/03/12(月) 13:33:24.45ID:d6EArY8A
AQ側に問題があって極端にleelazeroに相性が悪いかもしれんだろ
CGOSで3800オーバーしたのか?

38名無し名人2018/03/12(月) 14:48:50.35ID:iifADpyJ
なんか急にAQ擁護のやつがわいてきたな

39名無し名人2018/03/12(月) 18:47:52.59ID:IX2Xdnmf
>>16の追試も兼ねてAQ2.1.1と18827fa7で10局だけ打たせてみた
CGOSルール(持ち時間900秒)で結果はAQの6勝4敗でした
現時点でどちらが強いかの議論をするなら10局では足らなさそう

データと棋譜
https://bimaculata.000webhostapp.com/index.html
お互いにponderingなし、スレッド数2、ハードはi5-6500とGTX1070です

40名無し名人2018/03/12(月) 18:56:34.85ID:mCD0eGJ8
>>33
なんで黒で打ち終わってるんだろう

41名無し名人2018/03/12(月) 18:59:24.30ID:mCD0eGJ8
>>39
全部leelaの方が打つ時間短いな
家庭用としては優秀だ

42名無し名人2018/03/12(月) 19:16:44.63ID:A8L0T7i5
シチョウアタリで逃げれたと思ったら折り返してまたシチョウで取られてるのワロタ

43名無し名人2018/03/12(月) 19:22:50.02ID:z8rfwFaB
>>39
あんな言われ方で文句も言わず追試もして結果も出してくれるとは良いお人だ

44名無し名人2018/03/12(月) 20:09:49.13ID:jnQxaMY/
確かに39さんに感謝だな

45名無し名人2018/03/12(月) 20:15:12.74ID:tRzWUPho
俺も釣られて感謝しとくw

46名無し名人2018/03/12(月) 20:17:10.99ID:bQTXesQq
CGOSでp1600で試してくれるのが最も信憑性がある
同じ100局でやるなら

47名無し名人2018/03/12(月) 20:37:37.16ID:mCD0eGJ8
20 blocks x 256 filtersとか40とかて実際どれくらい対局数減るのかテストしてもらいたい
早く大きく出来るならその方がいい
飽きて人が減っていく前に

48名無し名人2018/03/12(月) 21:04:58.26ID:roXSwZEP
self play における "resignation_percent": "XX", は設定されている場合とされていない場合があるね
"options_hash": "fd7105", > resign無し "resignation_percent": "0"
"options_hash": "a4325b", > resign有り "resignation_percent": "10"

49名無し名人2018/03/12(月) 21:30:14.23ID:mgy2+pnv
>>46
cgosはハードが千差万別だからね
ソフトの比較なら同一ハードで、対局条件を変えつつ比較する方が良いのでは
p1600で放流しても、1600同士の比較でしかないし

50名無し名人2018/03/13(火) 00:32:56.87ID:QQzSYyJk
pass早かった
よかった

51名無し名人2018/03/13(火) 00:56:36.22ID:7FB9BdVP
紆余曲折あったけど
後半くらいから長期的に見ればほぼ一定で上がってきてるし
4月中には上位5位くらいには届きそう

52名無し名人2018/03/13(火) 00:57:50.33ID:GZqDwleD
Googleって3日ぐらいでレート5000ぐらいになったらしいけど
家庭用パソコン何台分ぐらいの計算量なの?

53名無し名人2018/03/13(火) 01:02:48.43ID:72/pE++W
早速、0f6a8c5fと打ってみたが
やっぱりシチョウが読めてないな
一応p16000でやってみたけど
http://gokifu.net/t2.php?s=6621520870374553

54名無し名人2018/03/13(火) 01:13:30.12ID:nqVo0OaO
人間の棋譜から学習した256×20のネットワーク使ったleelazeroもシチョウ読めないし(http://www.yss-aya.com/cgos/19x19/cross/LZH256x20-t4-nolim.html
leelazeroの探索部本体のバグの可能性も排除できない
もちろん学習途上の可能性が一番高いけど

55名無し名人2018/03/13(火) 01:17:34.85ID:72/pE++W
うーん、AlphaGoZeroはどうだったんだろな?
CGOSでもそこそこのとこに行くけどシチョウは分からないのは興味深い
人間はすぐさまシチョウ教えられるのにな(笑)

56名無し名人2018/03/13(火) 01:35:43.81ID:7FudP5FQ
Alphazeroの学習がなぜ伸びが止まってからも40日かけたのか
それはシチョウを学ぶまで待ってたんじゃないか
つまりR5000越えるまでzero学習だとシチョウ分からない説

57名無し名人2018/03/13(火) 01:43:11.42ID:nqVo0OaO
アルファ碁ゼロはMCTSでロールアウトしないからLeelaZeroと異なる方法でシチョウを学習したのかもしれない

ここで気づいたけどLeelaZeroってプレイアウトとかやってる時点でアルファ碁ゼロとぜんぜん違う実装なんじゃないのか
俺が深刻な誤解をしてるだけか?

58名無し名人2018/03/13(火) 01:51:51.10ID:QQzSYyJk
マスターに完勝出来るまでが49日だったんじゃないの?
グラフでもマスターに追いついたあとはほとんど近いところだったし
というかpassしてたのがfailになってる
一応ベストになってるけど

59名無し名人2018/03/13(火) 01:52:44.53ID:QQzSYyJk
49→40

60名無し名人2018/03/13(火) 02:07:21.72ID:72/pE++W
ほんとだ、ギリパスしてない
0f6aは外れ?

61名無し名人2018/03/13(火) 02:08:34.33ID:4idKdlV8
勝率は高いから表示の間違えじゃない?

62名無し名人2018/03/13(火) 02:09:52.45ID:4idKdlV8
54.95か 見間違えてた

63名無し名人2018/03/13(火) 02:27:57.92ID:QQzSYyJk
pass扱いにはなってるわ
failの後とか対局数増えたりしてるのもあるからpssになった後遅れて入ってきたデータで少し下がった感じだろうかね

64名無し名人2018/03/13(火) 02:50:12.73ID:72/pE++W
なるほど
てか、-k kifuで棋譜が自動保存されるのさっき知った
これ面白いな

65名無し名人2018/03/13(火) 04:31:38.78ID:QQzSYyJk
http://zero.sjeng.org/viewmatch/89b40f40f0c7a558f0945df64b05bab560e4fa42e0f5ec72769f4d8804ca6a7f?viewer=wgo
http://zero.sjeng.org/viewmatch/cc8017b51012110a3c2e1e2e3bff8fa140d3c9d86735010f668dfaea7b2cc145?viewer=wgo
さっきのpassの中の対局
上は左下黒生きてるみたいになってて最後大差負けだったのがいきなり大差で黒勝ち
不思議なのが160手目に白が左下の死活にあまり関係ない近場をツイだ時に白34.5目勝ちだったのが、161手目に黒が全く関係ない右上を打った時点で黒の84.5目勝ちになってる
よくわからない
こういう感じで生き死に判定間違ってるの結構あるのかも
下は意味不明な感じ
囲碁始めたばかりの人とか知らない人がどうやったら終局か分からないって言うのを思い出した
alphaは終局の設定どうしてたんだろう

66名無し名人2018/03/13(火) 06:43:07.94ID:nK9qAY0R
アルファゼロのグラフの真ん中あたりに一度学習終わったかの様な後で跳ねてるけど
そこでシチョウ理解したような気がする

67名無し名人2018/03/13(火) 07:22:28.70ID:nqVo0OaO
Zero論文より

Surprisingly, shicho (‘ladder’ capture sequences that may span the whole board) ?one of
the first elements of Go knowledge learned by humans?were only
understood by AlphaGo Zero much later in training.

らしいので>>66が正しい気がする

68名無し名人2018/03/13(火) 07:39:11.64ID:alf6FcQC
シチョウは学習出来ないって
形も固定じゃないし、手数も物凄く長いでしょ
人間だってシチョウ読めないから石を近くに持ってくる方法で読んでるじゃん
片方がセキで片方がセキ崩れみたいのも読めないよ

69名無し名人2018/03/13(火) 07:47:49.54ID:MIFBlwhs
leelazが明後日韓国の女流と打つらしいけどどうなるかね

70名無し名人2018/03/13(火) 07:54:03.23ID:4idKdlV8
>>69
マジか!どこで打つのか教えてほしい

71名無し名人2018/03/13(火) 08:02:09.62ID:MIFBlwhs
>>70
https://m.facebook.com/story.php?story_fbid=1471089503013875&id=741403459315820&__tn__=%2As%2As-R

hayleeさんという人がOGSで打つらしい
時差がかなりあるから今日の夜あたりかも?

72名無し名人2018/03/13(火) 08:04:09.66ID:MIFBlwhs
間違えた、日本が早いから明後日の深夜くらいかな?

73名無し名人2018/03/13(火) 08:28:52.53ID:nqVo0OaO
>>71
サンクス
日本時間だと16日の朝7時からだね

74名無し名人2018/03/13(火) 10:42:40.04ID:chGzNrlL
パンダで日本のアマにシチョウで負けまくって9段止まり
プロとやるレベルではない

75名無し名人2018/03/13(火) 10:47:02.22ID:alf6FcQC
シチョウはやらないと思うよ
というか操作側が回避してくれるんじゃないか?

76名無し名人2018/03/13(火) 13:02:49.48ID:G+3o7TU8
シチョウで負けまくって9段って逆に凄くね?

77名無し名人2018/03/13(火) 13:14:39.23ID:fkXyubsd
>>76
別に凄くない
難しい碁を打たなきゃ良いだけ

78名無し名人2018/03/13(火) 13:35:29.46ID:HMPXoiHl
シチョウにはまらなきゃプロレベルとも言えるからやる意味あるでしょ
それともアマに簡単に負けるソフトとはやりたくないと?

79名無し名人2018/03/13(火) 14:52:08.00ID:3nlc6wE3
禁じ手としてシチョウは駄目
こんな裏ルール気にしながら人間は打たなきゃならないのか
オエー

80名無し名人2018/03/13(火) 14:59:50.30ID:0BofcjFR
シチョウで勝てばいいじゃんでも負けたからってシチョウに誘導すれば勝てたって言うのはクソダサい

81名無し名人2018/03/13(火) 16:38:47.63ID:nK9qAY0R
急にいっぱいテスト対局相手出てきたな
何のテストだろうか

82名無し名人2018/03/13(火) 16:41:05.58ID:ym524q5w
人間と比較すると歪な強さなんだけどだからどうしたって話でもある
機械と人間比べる時代はもう終わったんだから単純にどう育つか見守ればいいんじゃないのかな
まだ争ってる認識でAlphaは間違いだったって主張なら仕方ないが

83名無し名人2018/03/13(火) 16:57:21.09ID:QQzSYyJk
強そうなのきた
200局超えて59%
がんばれ

84名無し名人2018/03/13(火) 16:59:04.02ID:QQzSYyJk
とか書いた途端連敗してる

85名無し名人2018/03/13(火) 17:02:23.99ID:QQzSYyJk
266局でパス扱いになった

86名無し名人2018/03/13(火) 17:03:10.73ID:+gALFEt1
あれ?
なんかの実験やってる?

87名無し名人2018/03/13(火) 17:09:35.93ID:QQzSYyJk
バグか荒らしのような気がする
上の三つは50%でfailになったやつだね

88名無し名人2018/03/13(火) 17:14:32.93ID:D6vkQ3+T
これ正しいの?

89名無し名人2018/03/13(火) 17:49:26.69ID:8HAjuRy1
これって、PASSしたからって前より強くなってる保証あんの?
いわゆるすくみ関係になってたりしないか

90名無し名人2018/03/13(火) 18:24:00.14ID:alf6FcQC
偏った強さにはなるだろうけどその偏りが囲碁は影響少ないんだと思うぞ

91名無し名人2018/03/13(火) 19:58:38.79ID:bFGcx7fY
https://github.com/pnprog/goreviewpartner

leelazeroのいい解析ソフトを見つけたのでよかったらどうぞ
勝率グラフと次の候補手をツリーで見ることができる
GUIは以下の画像みたいな感じ

https://i.imgur.com/H1oqXvh.png

92名無し名人2018/03/13(火) 20:00:04.52ID:GoQKyv+l
自分もnすくみの可能性を昔考えたけど、ニューラルネットワークが十分柔軟なら勝手に解決してくれるんじゃないの?
グーを出す相手にはパーを、チョキを出す相手にはグーを出せば勝率は上がるんだから

93名無し名人2018/03/13(火) 20:29:56.51ID:sumsyQTZ
グーを出す相手にはパーを、チョキを出す相手にはグーを出せば勝率は上がちゃうのが問題なんじゃないの?

94名無し名人2018/03/13(火) 20:33:24.43ID:kzi8iVa6
自分で確認するのが1番確実

95名無し名人2018/03/13(火) 20:34:17.46ID:fkXyubsd
ここの連中って黙って見守る事が出来ないんだな
自分じゃプログラム作れるわけでも無いのに文句だけ言う
ワロス

96名無し名人2018/03/13(火) 20:42:04.45ID:nK9qAY0R
相性問題があっても強いと確信できるラインが55%なんだと思う
もちろん400戦で統計的に有意な差があると言えるラインってこともあるけどね

実際にleelaのレートの伸びが9300なのに対してのcgosのレートの伸びが2200ぐらいで1/4以下になっているから
大半は相性によって過剰に伸びたレートだと言うこともできる

97名無し名人2018/03/13(火) 20:46:43.01ID:VhmT5GhS
毎回 Elo通りに強くなってるかは不明だけど1〜2週間スパンで見ると強くなってると思う
月単位だと更に分かりやすい
シチョウもネットワーク拡大して行ったら分かる時が来るのかも知れない

強いソフトを作るのではなく、変化過程を観察する実験だからね
まあ、この辺りまで強くなると実用的なソフトとして欲しくなるのは仕方ないが

98名無し名人2018/03/13(火) 21:15:05.35ID:D6vkQ3+T
そんな相性とか言い出したら全ての事がそうだろう

99名無し名人2018/03/13(火) 21:36:08.05ID:QQzSYyJk
古いパスしてないやつ相手に対局してるのほんとなんなんだろう
100局超えて70%なんだけどこれパスしたらどうなるんだ

100名無し名人2018/03/13(火) 21:39:31.25ID:2Co7mQro
This was @gcp testing a 20 block bootstrap. 
だって

■ このスレッドは過去ログ倉庫に格納されています