【Kaggle】機械学習・AIのコンペ【SIGNATE】

1仕様書無しさん
垢版 |
2020/02/14(金) 05:47:59.49
機械学習やAIのコンペに参加して賞金ゲットしながらプログラマー力を上げようぜ!

Kaggle
https://www.kaggle.com/competitions

SIGNATE
https://signate.jp/competitions

Topcoder
https://www.kaggle.com/competitions

DrivenData
https://www.drivendata.org/competitions/

Zindi
https://zindi.africa/competitions

AIcrowd
https://www.aicrowd.com/challenges
機械学習・AIは時代の最先端!
2021/01/01(金) 14:12:09.86
>>79
そんなもんディープラーニングが勝手に判断するから不要になる
2021/01/17(日) 17:29:35.23
kaggle masterて日本人kagglerの上位何%なん?
85仕様書無しさん
垢版 |
2021/01/29(金) 13:14:37.20
質問すみません。ランダムフォレストでハイパーパラメータのチューニングなんですが、グリッドサーチいがいで早くて使いやすいやつないですか
86仕様書無しさん
垢版 |
2021/01/29(金) 13:25:55.51
ココ↓は?
https://twitter.com/rokkotsukasa/status/1338487930944323589
https://twitter.com/5chan_nel (5ch newer account)
87仕様書無しさん
垢版 |
2021/01/29(金) 16:57:22.99
>>86
同じことを↓に投稿してみて
https://mevius.5ch.net/test/read.cgi/tech/1609459855/
88仕様書無しさん
垢版 |
2021/02/02(火) 21:08:13.72
>>85
ランダムフォレストとか全然使ったことないけど、ランダムサーチはグリッドサーチよりも早いらしい。でも、そもそもランダムフォレストはハイパーパラメータが少ないから、早さを出す必要があるかは場合によると思われ。

あと、そもそもランダムフォレスト自体が決定木の組み合わせだから、ランダムフォレスト同士を更に組み合わせるのもいけるかも?(オライリーの知識丸写し)
89仕様書無しさん
垢版 |
2021/02/02(火) 21:45:14.43
ありがとうございます。ランダムフォレストをさらに組み合わせるなんてできるんですね
90仕様書無しさん
垢版 |
2021/02/09(火) 22:18:58.38
optuna使っとけ
91仕様書無しさん
垢版 |
2021/02/09(火) 22:38:56.08
今ってデータ分析で前処理とかって自動でできるようになってるでしょ
92仕様書無しさん
垢版 |
2021/03/06(土) 06:43:18.46
kaggleの初心者向けの本だとどれがおすすめですか?
・スタートブック
・pythonで動かして学ぶ
・チャレンジブック
2021/03/18(木) 16:15:23.44
Kaggleのスレ存在してると思ったら誰もおらんやん
ちょいちょい糞コンペ開催されるから匿名でもの言える場所欲しいよな
2021/04/04(日) 11:07:45.30
前処理って慣れれば作業だから専業で儲かりそうだな。
95仕様書無しさん
垢版 |
2021/04/04(日) 15:33:56.53
既存の説明変数つかって新しい説明変数を自動的に作る方法ない?例えば最高気温、最低気温て説明変数あったら正解率上げるために自動的に気温差っていうカラム作ってくれるようなの
2021/04/04(日) 15:35:48.98
>>93 一応わかってると思うけど
進行中のコンテストはDiscussion以外で不用意な発言はやめてね
2021/04/04(日) 15:41:09.72
>>95
普通に自分で書けばいいじゃん、たいしたコード量でもないんだし
98仕様書無しさん
垢版 |
2021/04/04(日) 23:41:27.22
>>95
説明変数与えるより、パラメの調整だけして任せてしまった方が過学習しにくい
2021/04/05(月) 05:42:16.52
>>98
手法に何使うかとか含め場合によるし、
自分の経験上だと説明変数をうまく新設したほうが結果も良い
100仕様書無しさん
垢版 |
2021/04/05(月) 17:49:03.54
ありがとうございます
101仕様書無しさん
垢版 |
2021/04/18(日) 00:21:43.61
KaggleでSubmitしたら
Could not check whether submission is allowed.
が出るようになったんだけど、原因なんだろう。
前はできてたのに。
2021/07/03(土) 13:22:38.81
スレの勢いないな
103仕様書無しさん
垢版 |
2021/07/17(土) 14:35:01.01
Kaggleやる場合ってデータとかをローカルに落としてで作業しますか?
それともKaggle上のnotebookでし作業する方がいいですか?
2021/07/21(水) 23:42:51.35
初心者はとりあえずnotebookでええやろ
2021/09/16(木) 00:38:55.26
面白いコンペないよなあ
kaggleはほとんど画像分類ばっかになってしまったし
106仕様書無しさん
垢版 |
2021/10/05(火) 18:51:22.72
kaggleもうやらなくなったけど、
止められないんだね。
メールが死ぬまで届くわけか。
さすが米国のIT企業だな。
107仕様書無しさん
垢版 |
2021/10/05(火) 21:49:07.37
kaggleのスコアって未だに有難がられてるけど
トライ&エラーで評価用データにフィットするようモデルを修正していけば、すぐにランクが上がるし意味無くないか

実務に役立つとは思えん
2021/10/05(火) 22:15:59.10
>>107
役には立たんよでも採用側がど素人だから
アホに吹き込まれたバズワードで「カグル カグル」とありがたがる
2021/10/13(水) 22:56:34.84
>>107
private
2021/10/19(火) 10:35:33.96
全然上位にいけないよぉ😭
2021/10/21(木) 07:01:18.40
>>110
新しい理論、アイデアを考える。

データにふさわしいチューニングをする。

テストで高得点を取れるようなデータで学習する。

他にも方法はある?
2021/10/21(木) 09:17:11.33
submissionの回数決まってるから思い付くまま実行もできないし
定番コードをメモしてコピペするしかないの?
ensembleとしてのstackingやらblendingは試行錯誤してる余裕ないよね
113仕様書無しさん
垢版 |
2021/10/23(土) 00:57:59.43
銅取りたいよぉ
2021/10/23(土) 10:41:19.80
銀か金取る勢いじゃないと銅行けないんじゃね
精神論だけど
115仕様書無しさん
垢版 |
2021/10/23(土) 15:46:17.80
銅って難易度を大学入試で例えるなら東工大レベル以上ですか?
2021/10/23(土) 17:26:32.80
違うんじゃない?(笑)
2021/10/24(日) 15:45:00.82
銅って上位何パーセントだっけ?1割?
118仕様書無しさん
垢版 |
2021/10/24(日) 15:47:11.64
>>116
ならどこ大学レベル?
2021/10/24(日) 17:46:26.68
MARCHとかその辺のちょい上側の学部じゃね?偏差値で言うなら63ぐらい
もっとも、個人戦の受験とチーム戦のkaggleじゃ色々と比べにくい話だが
2021/10/25(月) 00:59:24.63
チーム組んで、1subもせずにメダル持ってく奴もいるしね
121仕様書無しさん
垢版 |
2021/10/28(木) 02:41:03.05
メダル取れたら転職有利になりますか?
2021/10/28(木) 03:44:37.80
有利にはなるけど、それなりに知識や経験等がなければ面接で落とされるよ
特に転職だと前職での立ち位置とか業務内容との関わりとかの方が重視されるでしょ
(よほどの理由でもない限り転職でポテンシャル採用なんてしない
2021/10/28(木) 10:12:39.89
取れてなくても仕事はできるからね
コンペなんてスコア0.1の間に100人いるとかでしょ?ある程度できてればメダル無い人でも十分
124仕様書無しさん
垢版 |
2021/10/28(木) 13:30:51.68
>>122
> よほどの理由でもない限り転職でポテンシャル採用なんてしない

うちは若い人(25歳ぐらいまで)なら未経験者のポテンシャル採用してますよ。
ただしSPIテストで60以上(IQ120ぐらい)じゃないと面接に進めませんが。
2021/10/28(木) 17:43:56.55
働いた事もなく、まともな大学にすら進められなかったの曝け出して何してるんだ....
博士号持ちがストレートでも何歳だと思ってるんだ?
2021/10/28(木) 18:46:55.80
なんの話...?自分語り?
2021/10/28(木) 18:47:37.19
早慶でも理工だと7割院進学だからなあ
世間は高卒以下が5割超えてても一部の業界だと院卒が普通だったりするの
エッグいけどこういう格差が突如として露わになるの5chぽくて好こ
128仕様書無しさん
垢版 |
2021/10/28(木) 18:50:22.29
雉も鳴かずば撃たれまい
2021/10/28(木) 20:01:00.08
ケーン
130仕様書無しさん
垢版 |
2021/10/29(金) 11:37:31.69
>>125
俺は学部卒で就職して、
金を貯めて修士にいって、
途中勉強のため仕事を辞めて
修士取ったらまた就職して、
社会人として博士課程を過ごしました。

まじきつかったけど
本当に親切な先生に指導受ける
ことができて良かった。
社会人の俺にあわせて土曜日や
夜に研究指導していただいたので
感謝しかない。

働きながら博士号取るのを
おススメするが、指導教員が
よほど良い先生じゃないと
続かないと思います。
2021/10/29(金) 11:49:14.95
博士号なんて取んなくてもいい
米国なら違うだろうけど
132仕様書無しさん
垢版 |
2021/10/29(金) 13:36:18.60
>>131
将来海外で仕事するつもりなら取る価値ある
海外ではDr持ってると給料が高いから
2021/10/29(金) 18:24:19.11
博士号取ったら海外行きたいね
134仕様書無しさん
垢版 |
2021/10/30(土) 15:27:41.45
Kaggleやったことなくてコードもあんま書けないけどデータ関係の部署で5年間働いたことある人と、働いたことないけどKaggle金メダル持ってる人だとどっちが転職有利ですか?
2021/10/30(土) 15:47:49.44
>>134
前者
136仕様書無しさん
垢版 |
2021/10/30(土) 17:39:39.36
>>135
ソースは?
2021/10/30(土) 19:51:33.10
>>134
前者がどういう人だよ
kaggleやったことないまでは普通にいるとしても、
データ関連の部署で数年働いていてコードもあんま書けないって
スキル構成はどうなってるんだ?そもそもデータ関連の部署で何やってる想定?
138仕様書無しさん
垢版 |
2021/10/31(日) 13:09:36.27
データ関係の部署ってマーケティングかDBサーバの管理者かで大分違うし
Kaggle金メダル持ってるだけの人はSQLに疎かったりする
2021/10/31(日) 13:12:14.92
例えの話なんだから熱くなんなよ。。。
140仕様書無しさん
垢版 |
2021/11/01(月) 01:40:31.62
ベンダー管理と社内調整で自分は技術的なことするわけではないポジションだろ
141仕様書無しさん
垢版 |
2021/11/01(月) 13:18:21.92
>>140
それって理系の仕事なんですか?
142仕様書無しさん
垢版 |
2021/11/07(日) 21:59:34.47
このスレって働いたことある奴いないのか?
143仕様書無しさん
垢版 |
2021/11/10(水) 22:15:22.88
>>141
数少ない高学歴の理系が、コミュ力しか要求されない仕事で無駄に浪費されるのが悲しい現実
144仕様書無しさん
垢版 |
2021/11/10(水) 22:56:34.33
高学歴は一つのことに力注ぐより、たくさんプロジェクト持って回してく方が効率いいから会社はそうなってる
2021/11/10(水) 23:03:56.66
人の管理だけはできない
146仕様書無しさん
垢版 |
2021/11/11(木) 11:02:43.04
データサイエンティストって価値あるの?
普通のエンジニアがauto ML使う方が良くない?
2021/11/11(木) 11:21:28.20
統計的手法と機械学習、深層学習を使ってデータの海から役に立ちそうなデータを掘り起こしてビジネス的な課題を解決するのがデータサイエンティストとかなんとか本に書いてたぜ
どちらかというとデータアナリストとかコンサルタントに近いな
知らんけど!
2021/11/11(木) 11:23:21.45
まあつまりは、価値あるじゃんってことやな
深層学習が特徴表現学習としての側面を持ってる限りは
149仕様書無しさん
垢版 |
2021/11/11(木) 11:24:30.70
データサイエンティストというのは
分析と共に結果を説明することも仕事のうち。
結果をきちんと説明できるなら、
autoML使うのはいいかもしれないとは思ってる。
でも、なかなか説明できないでしょ?

おれは、そのあたりが得意で、
客には適当に考えたことを客に説明して納得してもらってる。
そういう説明力が重要なんだよ。
詐欺コンサルと同じだね!
150仕様書無しさん
垢版 |
2021/11/11(木) 11:30:57.35
データサイエンティストはコンサルとか営業面の方が強いよ
企業によるだろうけど、事業会社内のデータサイエンティストは実際にプログラミングゴリゴリ書くことほとんどない
社内のいろんな部署とヒアリングして、高度な分析必要な案件発掘したら開発はベンダー任せだからベンダーコントロール
上でも書かれてるのと似てる
ちなみに機械学習とか使うような案件あんまないからそのうち社内廃業しそう
151仕様書無しさん
垢版 |
2021/11/11(木) 11:34:21.12
追記だか結果の説明とかも苦労するところ
なんも分からないお偉いさんにどういう理由でこの結果になったのかとか説明する
AIなんだから100%当てろみたいなおっさんの相手するのがデータサイエンティストだよ
嫌なら研究者になった方がいい
152仕様書無しさん
垢版 |
2021/11/11(木) 14:22:37.85
> データサイエンティストはコンサルとか営業面の方が強いよ

いえてる!

> AIなんだから100%当てろみたいなおっさんの相手するのがデータサイエンティストだよ

ワロタ!
先日も大阪に本社のある大企業の部長が
「90%以上あたらないならAIなんて使わない!」と言って、
契約を切られたと営業から聞きました。
その会社の仕事は終わりました(笑)
2021/11/11(木) 23:29:12.83
うちの自動運転は10%ぐらいの確率で人が歩いてるのを認識できません
2021/11/11(木) 23:50:48.62
現実の適用場面を考えると
100%じゃないと使い物にならないことか
多いからなあ
99%でも残りの1%をどうしてくれるのか?
人間がずっと見ていて処理するのか?
それだったら人間がずっと見ていれば済むし
155仕様書無しさん
垢版 |
2021/11/12(金) 09:26:06.67
何をやるかによる
為替の予測なら60%くらい当たればいいだろ
156仕様書無しさん
垢版 |
2021/11/12(金) 20:55:53.89
データサイエンティストコンプばっかだな
157仕様書無しさん
垢版 |
2021/11/13(土) 14:20:49.72
Kaggleでメダル取れればGoogleとかで働けますか?
2021/11/13(土) 14:32:15.78
(ヾノ・∀・`)
2021/11/13(土) 16:49:15.28
Googleはメダル渡す側
2021/11/13(土) 21:04:43.68
>>157
AAAIとかIJCAIに通すぐらいの実力がないとだめ
161仕様書無しさん
垢版 |
2021/11/13(土) 23:43:48.26
>>160
何それ?
2021/11/14(日) 02:19:08.27
>>161
AIのトップレベルの国際会議
163仕様書無しさん
垢版 |
2021/11/14(日) 15:20:25.97
dockerは使った方がいいですか?
164仕様書無しさん
垢版 |
2021/11/14(日) 16:41:49.41
どう言った問題がでるの?
2021/11/14(日) 22:40:32.54
Kaggleでメダル取った応用で株の収益モデルを作れば働かなくてもいいじゃん
客の無理難題より簡単よ
166仕様書無しさん
垢版 |
2021/11/15(月) 11:53:44.91
機械学習と人工知能ってどっちが凄い?
2021/11/15(月) 16:40:32.59
人工知能の定義からしないといけないな
2021/11/15(月) 21:18:12.02
機械学習と凄いの定義も必要だな
169仕様書無しさん
垢版 |
2021/11/16(火) 00:52:57.77
>>166
なんだか馬鹿すぎて
一周回ってかわいく思えてきたw
170仕様書無しさん
垢版 |
2021/11/17(水) 12:45:03.00
データサイエンティストのファーストキャリアはどんな企業がいいと思いますか?
171仕様書無しさん
垢版 |
2021/11/17(水) 12:59:30.49
>>170
大手IT企業の研究部門
2021/11/17(水) 13:39:46.18
>>170
リクルート
2021/11/17(水) 14:27:27.65
>>170
GAFAM
入れなかったらあきらめた方がいい
174仕様書無しさん
垢版 |
2021/11/17(水) 15:52:05.66
>>173
私立文系でもジーAFAでデータサイエンティストやれますか?
2021/11/17(水) 16:29:29.53
>>174
応募してみれば?
実績は問われるかもしれないけど
176仕様書無しさん
垢版 |
2021/11/17(水) 16:40:55.49
>>175
学生なので入社してから頑張ります
2021/11/22(月) 00:11:29.80
signateのsubaruの奴やればいいじゃん
人材採用らしいよ
2021/11/22(月) 00:17:22.70
ブラック企業には行きたくない
179仕様書無しさん
垢版 |
2021/11/22(月) 12:21:39.60
Kaggleでメダル取れば大学入試の推薦にアピールできますか?
2021/11/22(月) 12:44:52.07
できません
2021/11/23(火) 22:37:50.24
考えてること全部間違ってるからメダルすら取れないんでしょ
なぜこの期に及んで適当な妄想語ってしまうのか
そのへんが一生能無しでいる秘訣だろうな
182仕様書無しさん
垢版 |
2021/12/08(水) 14:44:25.20
Kaggleをもうちょい楽しめるように統計とかのバックグラウンドを趣味で勉強しよう、、、
2021/12/08(水) 15:23:58.08
そして会社に入って使うのはロジスティック回帰であった
レスを投稿する

5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況