【Kaggle】機械学習・AIのコンペ【SIGNATE】
機械学習も扱えないプログラマーはゴミと化す時代がやってくる!もうすぐそこ!! 機械学習エンジニア
今後ますます需要が高まること必至 >>8
パナだったか日立にkaggleのグランドマスターが在籍してたはず 社会人の論文にもなるようなネタを
こんなはしたがねのために放りだしていいのか?
大学に論文でも持ち込めば一生くってけるかもしれんぞ > 大学に論文でも持ち込めば一生くってけるかもしれんぞ
大学教員としてメシ食うのはコネもないと無理なんじゃ? 勘違いしてるようだけど
機械学習の練習したくて既出のお題以外で練習したいとき
ただ練習するのではなく賞金も貰えちゃうかもしれないお題が提供されてる
ただそれだけなんだよ そんな少ない賞金もらってもしゃーない
仕事で分析したほうがもっともらえる 機械学習しかできないやつはゴミってことでいいのかなこれ >>22
この手のコンペなんざ、トライ&エラーで提出回数を増やした奴が勝つゲーム
玄人は週末の競馬の勝ち馬を予測するAIを作って勉強 >>27
> 機械学習しかできないやつはゴミってことでいいのかなこれ
そうだね
Pythonのライブラリにデータ食わせるだけの簡単な仕事だもんね
イラネーでしょ?
ゴミでしょ? AI人材錬成が簡単だと思ってる政府の人間と同じ考えか Pythonのライブラリにデータ食わせるだけなんだから
馬鹿でもチョンでもできるだろ朝鮮ゴキブリBot君? Pythonのネタは一過性の現象だぞ
営業さんが東京都ではあと2年後に需要が半分以下に下がると言われているから案件の紹介すらされない 一過性のブームとやらはそろそろ5年ぐらい続いてるのではないか 日本は海外より遅れてブーム来るから
機械学習はこれからだろ コロナ不況で
データサイエンティストバブルは終わりだね ソフトバンクグループはコロナ不況なんて関係ない!
孫神様が率いているからね!
世界最強のグループだから!
朝鮮民族は世界最高の民族!
その代表が孫神様!!! 上位ってクラウドで有料のリソース借りてやってんでしょ?
おいくら万円? 企業データを用いてディープラーニングに挑む
Sonyとレッジが企画するAI開発コンテスト
Neural Network Console Challenge
応募期間 2020年3月4日 - 3月27日
https://nnc-challenge.com >>44
意味不明なSONYの有料機械学習ツールに登録しないと参加できないコンペ >>40
> 日本は海外より遅れてブーム来るから
> 機械学習はこれからだろ
そうだといいんだけどね。 政府がAI人材増やすって言ってんだからこのウェーブに乗らないでどうする >>51
python から テンソルフローを呼ぶプログラムが書ける人 KaggleでもSIGNATEでもTopcoderでもコロナのコンペやってんのか? >>52
それプラスいつでも切り捨てられるように派遣で時給2000円で働いてくれる人 やってみても今いち使い道がわからん
チュートリアルレベルしかやってないけどふーんで終わる
あとクラウドに金払うのが嫌で色々試す前に飽きてしまう キラーコンテンツがなかなか転がっていないよな
あるんだけど既に既存のシステムがたくさんある sigのコロナチャレンジはデータがチープやけど数字触る系で、フェーズ2からは楽しめそう
kaggleは言語分析やろ
無理っスw 忙しいときに5chなんて
見る余裕ねーよ
朝鮮ゴキブリBot君は
ず~っとヒマだから
粘着してるわけで(笑) どのコンペも感染者数予測をやってるけど、現実のテーマにすると無理有りまくりなのが露呈するな >>1
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君に負けてないけど、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw ゴールデンウィーク中に楽しめるおすすめコンペを教えて 初心者だけど素朴な疑問。
アルゴはライブラリの使い回しで、前処理(特徴量エンジニアリング)だけで強くなれるもんですか? 前処理aとbとcを思いついて、全部突っ込んだらいい感じに重みつけて使ってくれると思ったんだけど、aとbだけにしたほうが精度良かったりする。何でかわからない。cがそんなに悪さをしている?? ローカルで学習させてる人、マシンスペックはどんな感じ? 前処理の方が難しいよな。機械学習自体は大学一年レベル以上の数学的な知識を求められないけど
結局は前処理のところで理系の専門的な知識が必要になる
統計学の込み入った部分に手を入れられないようなエンジニアは、実務で精度を出せないだろう 前処理に必要なのは学力よりセンス
この値なんか気持ち悪い、みたいな謎の感覚が重要 ほぼやるのは前処理だから
特徴をうまく作れれば精度もあがるけどそれが難しい
主要なモデルは大体ライブラリで実装されてるし
新しい手法は自分で実装しなきゃいけないけど コンペで精度あげるには結局前処理とハイパーパラメーターの調整が主じゃないか
新しいモデルを実装して精度が上がるなら良いけど 特徴量エンジニアリング極めた方がいい?
でも、そのデータに熟知してないと良い特徴量にたどり着けない? 特徴量エンジニアリング勉強しようと思うと難しいなあ
signateの初心者向けコンペで詰まってる 前処理を専業でやり始める企業が増えてきたな。いつの間にかデータぶっこむだけでそれらしい結果が出てくるようになって、やっぱり文系最強ってなってそう。 >>79
そんなもんディープラーニングが勝手に判断するから不要になる kaggle masterて日本人kagglerの上位何%なん? 質問すみません。ランダムフォレストでハイパーパラメータのチューニングなんですが、グリッドサーチいがいで早くて使いやすいやつないですか >>85
ランダムフォレストとか全然使ったことないけど、ランダムサーチはグリッドサーチよりも早いらしい。でも、そもそもランダムフォレストはハイパーパラメータが少ないから、早さを出す必要があるかは場合によると思われ。
あと、そもそもランダムフォレスト自体が決定木の組み合わせだから、ランダムフォレスト同士を更に組み合わせるのもいけるかも?(オライリーの知識丸写し) ありがとうございます。ランダムフォレストをさらに組み合わせるなんてできるんですね 今ってデータ分析で前処理とかって自動でできるようになってるでしょ kaggleの初心者向けの本だとどれがおすすめですか?
・スタートブック
・pythonで動かして学ぶ
・チャレンジブック Kaggleのスレ存在してると思ったら誰もおらんやん
ちょいちょい糞コンペ開催されるから匿名でもの言える場所欲しいよな 前処理って慣れれば作業だから専業で儲かりそうだな。 既存の説明変数つかって新しい説明変数を自動的に作る方法ない?例えば最高気温、最低気温て説明変数あったら正解率上げるために自動的に気温差っていうカラム作ってくれるようなの >>93 一応わかってると思うけど
進行中のコンテストはDiscussion以外で不用意な発言はやめてね >>95
普通に自分で書けばいいじゃん、たいしたコード量でもないんだし >>95
説明変数与えるより、パラメの調整だけして任せてしまった方が過学習しにくい >>98
手法に何使うかとか含め場合によるし、
自分の経験上だと説明変数をうまく新設したほうが結果も良い KaggleでSubmitしたら
Could not check whether submission is allowed.
が出るようになったんだけど、原因なんだろう。
前はできてたのに。 Kaggleやる場合ってデータとかをローカルに落としてで作業しますか?
それともKaggle上のnotebookでし作業する方がいいですか? 面白いコンペないよなあ
kaggleはほとんど画像分類ばっかになってしまったし kaggleもうやらなくなったけど、
止められないんだね。
メールが死ぬまで届くわけか。
さすが米国のIT企業だな。 kaggleのスコアって未だに有難がられてるけど
トライ&エラーで評価用データにフィットするようモデルを修正していけば、すぐにランクが上がるし意味無くないか
実務に役立つとは思えん >>107
役には立たんよでも採用側がど素人だから
アホに吹き込まれたバズワードで「カグル カグル」とありがたがる >>110
新しい理論、アイデアを考える。
データにふさわしいチューニングをする。
テストで高得点を取れるようなデータで学習する。
他にも方法はある? submissionの回数決まってるから思い付くまま実行もできないし
定番コードをメモしてコピペするしかないの?
ensembleとしてのstackingやらblendingは試行錯誤してる余裕ないよね 銀か金取る勢いじゃないと銅行けないんじゃね
精神論だけど 銅って難易度を大学入試で例えるなら東工大レベル以上ですか? MARCHとかその辺のちょい上側の学部じゃね?偏差値で言うなら63ぐらい
もっとも、個人戦の受験とチーム戦のkaggleじゃ色々と比べにくい話だが チーム組んで、1subもせずにメダル持ってく奴もいるしね 有利にはなるけど、それなりに知識や経験等がなければ面接で落とされるよ
特に転職だと前職での立ち位置とか業務内容との関わりとかの方が重視されるでしょ
(よほどの理由でもない限り転職でポテンシャル採用なんてしない 取れてなくても仕事はできるからね
コンペなんてスコア0.1の間に100人いるとかでしょ?ある程度できてればメダル無い人でも十分 >>122
> よほどの理由でもない限り転職でポテンシャル採用なんてしない
うちは若い人(25歳ぐらいまで)なら未経験者のポテンシャル採用してますよ。
ただしSPIテストで60以上(IQ120ぐらい)じゃないと面接に進めませんが。 働いた事もなく、まともな大学にすら進められなかったの曝け出して何してるんだ....
博士号持ちがストレートでも何歳だと思ってるんだ? 早慶でも理工だと7割院進学だからなあ
世間は高卒以下が5割超えてても一部の業界だと院卒が普通だったりするの
エッグいけどこういう格差が突如として露わになるの5chぽくて好こ >>125
俺は学部卒で就職して、
金を貯めて修士にいって、
途中勉強のため仕事を辞めて
修士取ったらまた就職して、
社会人として博士課程を過ごしました。
まじきつかったけど
本当に親切な先生に指導受ける
ことができて良かった。
社会人の俺にあわせて土曜日や
夜に研究指導していただいたので
感謝しかない。
働きながら博士号取るのを
おススメするが、指導教員が
よほど良い先生じゃないと
続かないと思います。 博士号なんて取んなくてもいい
米国なら違うだろうけど >>131
将来海外で仕事するつもりなら取る価値ある
海外ではDr持ってると給料が高いから Kaggleやったことなくてコードもあんま書けないけどデータ関係の部署で5年間働いたことある人と、働いたことないけどKaggle金メダル持ってる人だとどっちが転職有利ですか? >>134
前者がどういう人だよ
kaggleやったことないまでは普通にいるとしても、
データ関連の部署で数年働いていてコードもあんま書けないって
スキル構成はどうなってるんだ?そもそもデータ関連の部署で何やってる想定? データ関係の部署ってマーケティングかDBサーバの管理者かで大分違うし
Kaggle金メダル持ってるだけの人はSQLに疎かったりする ベンダー管理と社内調整で自分は技術的なことするわけではないポジションだろ >>141
数少ない高学歴の理系が、コミュ力しか要求されない仕事で無駄に浪費されるのが悲しい現実 高学歴は一つのことに力注ぐより、たくさんプロジェクト持って回してく方が効率いいから会社はそうなってる データサイエンティストって価値あるの?
普通のエンジニアがauto ML使う方が良くない? 統計的手法と機械学習、深層学習を使ってデータの海から役に立ちそうなデータを掘り起こしてビジネス的な課題を解決するのがデータサイエンティストとかなんとか本に書いてたぜ
どちらかというとデータアナリストとかコンサルタントに近いな
知らんけど! まあつまりは、価値あるじゃんってことやな
深層学習が特徴表現学習としての側面を持ってる限りは データサイエンティストというのは
分析と共に結果を説明することも仕事のうち。
結果をきちんと説明できるなら、
autoML使うのはいいかもしれないとは思ってる。
でも、なかなか説明できないでしょ?
おれは、そのあたりが得意で、
客には適当に考えたことを客に説明して納得してもらってる。
そういう説明力が重要なんだよ。
詐欺コンサルと同じだね! データサイエンティストはコンサルとか営業面の方が強いよ
企業によるだろうけど、事業会社内のデータサイエンティストは実際にプログラミングゴリゴリ書くことほとんどない
社内のいろんな部署とヒアリングして、高度な分析必要な案件発掘したら開発はベンダー任せだからベンダーコントロール
上でも書かれてるのと似てる
ちなみに機械学習とか使うような案件あんまないからそのうち社内廃業しそう 追記だか結果の説明とかも苦労するところ
なんも分からないお偉いさんにどういう理由でこの結果になったのかとか説明する
AIなんだから100%当てろみたいなおっさんの相手するのがデータサイエンティストだよ
嫌なら研究者になった方がいい > データサイエンティストはコンサルとか営業面の方が強いよ
いえてる!
> AIなんだから100%当てろみたいなおっさんの相手するのがデータサイエンティストだよ
ワロタ!
先日も大阪に本社のある大企業の部長が
「90%以上あたらないならAIなんて使わない!」と言って、
契約を切られたと営業から聞きました。
その会社の仕事は終わりました(笑) うちの自動運転は10%ぐらいの確率で人が歩いてるのを認識できません 現実の適用場面を考えると
100%じゃないと使い物にならないことか
多いからなあ
99%でも残りの1%をどうしてくれるのか?
人間がずっと見ていて処理するのか?
それだったら人間がずっと見ていれば済むし 何をやるかによる
為替の予測なら60%くらい当たればいいだろ Kaggleでメダル取れればGoogleとかで働けますか? >>157
AAAIとかIJCAIに通すぐらいの実力がないとだめ Kaggleでメダル取った応用で株の収益モデルを作れば働かなくてもいいじゃん
客の無理難題より簡単よ >>166
なんだか馬鹿すぎて
一周回ってかわいく思えてきたw データサイエンティストのファーストキャリアはどんな企業がいいと思いますか? >>170
GAFAM
入れなかったらあきらめた方がいい >>173
私立文系でもジーAFAでデータサイエンティストやれますか? >>174
応募してみれば?
実績は問われるかもしれないけど signateのsubaruの奴やればいいじゃん
人材採用らしいよ Kaggleでメダル取れば大学入試の推薦にアピールできますか? 考えてること全部間違ってるからメダルすら取れないんでしょ
なぜこの期に及んで適当な妄想語ってしまうのか
そのへんが一生能無しでいる秘訣だろうな Kaggleをもうちょい楽しめるように統計とかのバックグラウンドを趣味で勉強しよう、、、 そして会社に入って使うのはロジスティック回帰であった kaggleみたいに追い込んだモデル作って見せてもなんでこういう結果なの?と聞かれるとモデルの判断根拠を説明できない
なら決定木の方がいいわな多少精度が落ちても(笑) ほんこれ
結局はわかりやすい簡単なモデルの方が好まれる
Kaggleキッズたちに現実見せつけたいわ 別に勝てなくてもいいからkaggleとかで遊べるようになりたい 会社によるし立場によるだろ
世間一般的に優れてることなんかなにも求められない、誰でもわかるし出来ることやってりゃ良いならkaggleで上位なんかとっても無意味だろうし
理解も納得もできない飛び抜けたことやるやつなんか邪魔でしかない
まあ実際は上位勢は技術力に価値を見いだされて良い待遇で雇われたりしてるけどな
そういう状況と全く縁のない能無しは、自分が正しいという前提で物を語るのはやめたほうが良いと思う
何も正しいことが出来ないからコンペでもいい結果が出せないわけだし 現実の自分の立ち位置と社会的評価と実際に出してる結果を正しく認識できるかな? Kaggleのランクと年収の関係を示すデータとかあるの? 日本の古臭い大企業の情報システム部でデータサイエンティストやってるとかだと上で議論されたようなグラフ化して平均値求めて終わりみたいなのばかりかもな denaとリクルートだっけ?
カグルマスターをどう活用してるんだろ 逆にAIエンジニアを活用出来てる日本企業あるのかな?
ソフバンも顔認証技術すら自社で作らず米国のエンティティリストに載ってるような中国企業に委託してるし 企業の収益最大化が目的の場合、最適化問題として定式化できる人が重宝されるのよね。
統計/機械学習モデルはその一要素でしかない。
ドメインによるんだろうけど。 >>203
ああいうとこはカグラーがいるだけで有名大の情報系集まるしいいのでは 結局AIなんか手段だよ
研究者以外はAI以外の専門性身につけないと働き口ないよ
数値計算だけしてればいいとか思ってると厳しいよ そのうちドメイン知識を持ってる専門家がAIの使い方身に付けるしオワコン そのうちどころか高学歴理系の多いところだとIT職種でなくてもAIの知識既にあるぞ
そこらの自称データサイエンティストよりずっと知識深い dmm、zozo、クックパッドとかAI人材が多いイメージなんだけど何人規模なんだろう 大学の先生が便器内から学生の大便や肛門の画像をAIで読み取らせて健康管理させるとか言っていた
本音は便器内からのアングルで女子学生の肛門の穴と陰部とウンチの画像を集めたいのだろうけど・・・
ネットで学生番号とウンチ画像を一緒に見られるなんて昭和生まれの人間には衝撃的だよな 社長も社員も全員副業 ひとつの会社に頼らない働き方
「副業」社員で成り立つ会社登場 働き方改革の最先端
「社員全員が副業」を体現し普及するスタートアップ、売上前年比4倍が物語る今後
「全員副業必須」型破りな経営がもたらした、社員の脱会社依存と幸せ
仕事を「時間と場所」から解放せよ! 週休3日、スーパーフレックス──新しい働き方は日本企業に通用するか
週休3日なのに年収を3倍にした男性の「時短術」
“週休3日制”導入で売上4割増の例も…日本企業で普及期に、週30時間が常識に
「 リモートワークで手放すべき7つのこと」働き方改革の先の世界
週休3日制をさらに進めた週休4日制 コロナワクチン接種で記憶力低下したからJenkinsやパイプラインの設定でずっこけた まともなコンペ設計も出来ないコンペサイト
展示会で一番いいところに大規模に陣取っておきながら、人っ子一人近寄らない爆死具ネイトになった原因を少し考えよう >>215
来年かは分からないけどいつかは絶対そうなるよな
馬鹿でもできることしかやってない有象無象共は2006くらいのITバブル崩壊のあとのIT土方と同じ末路を辿ることになる 確実にデータ分析職に就くために大企業の情報系子会社に入社するのってありだと思いますか? データの分析ができれば就けるよ
それをおざなりに不正な手段で確実を求めるようなやつはなにやっても失敗するから安心しろ 不正な手段で確実を求めるってどういうことなんだい
教えてお兄さん 音楽の自動生成やりたくてmidiを既存のmidiを学習データにしたいんだけどどうやってデータ整えたらいいのかわからなすぎて涙が止まりません。
一曲を一行のデータにできない以上どっかで区切るのかなと思ってるんですがどういうデータ構造にしたらいいんですか涙が止まりません。 データ分析職は人事担当者が採用で不正働いていたことがyoutuberによる現場のレポートで挙がっていたぜ 混乱してるんだけど
↓の理解で良いの?
表現学習
└距離学習
└対照学習 初心者ですが他人のnotebookそのままコピーして修正なしで提出してもOKなの? 機械学習系のコンペってtopcoderのマラソンマッチとかatcoderのヒューリスティックコンテストみたいに楽しいんですか? コンペ上位者のソリューションを見てるんだけど知らないことばかりで草 kaggleってどのくらいで他人に威張れるの?
atcoderの水色くらいの指標が欲しいんだけど、
それって、どのくらい?
エキスパート?
マスターは機械学習を本職にしてないと無理っすよね。
ところで、このスレ、メダルの数でマウント取ったりしないっすよね マウント取りたい相手が機械学習を知っていないと取れないし
知っていたら自分より上だろうし
マウント取れるの?やってみてよ Multimodal Single-Cell Integrationに手を出してしまった
軽はずみに参加したけど、高校科学と有機化学、生物学の基礎を再勉強を強いられてる
このコンペ、参加するだけでmRNAに詳しくなれるぞ 上でkaggleは実務で役に立たないと言ってる人がいるけどアプローチの問題じゃない
コピペを使わずに自分でコードを書けばいくらでもスキルが身につくし
探索的データ分析を怠らなければ自力もポートフォリオも作れる
逆に他の人のコードをコピペして小手先の修正でスコアを上げてもなんにもならないだろう LBいい感じ。過学習していなければメダル。過学習していなければ。。。 >>260
スコアだけで評価されるのグラマス以上で、
たとえば就活時だと、採用側はふつうスコアで興味を持って公開ノートの内容を確認という流れを取る
コピペは面接の時にkaggleで何を工夫した聞かれた時に詰まるでしょ コピペでも内容理解してれば多少は力尽くし面接でも説明できる
ある程度力付いたら自然とコピペなんて卒業だし 仕事に就けてるから気にしなきゃいいんだけどkaggleでメダル取れないの腹立つ😡 銅メダル取れたよ!
転職でアピールするには弱いかな? 初めてメダル取れたわ
ありがとう
これからもっと取っていくぜ