ほぼすべての機械学習の問題を解決します (全文翻訳)
英文原文:Approaching (Almost) Any Machine Learning Problem
Kaggleチーム | 2016 年 7 月 21 日
Kaggle の第一人者である Abhishek Thakur がこの記事を最初にここに公開したのは、2016 年 7 月 18 日でした。
データ サイエンティストは毎日大量のデータを処理します。機械学習モデルをこのデータに適用できるようにするために、時間の 60 ~ 70% 以上がデータ クリーニング、データ転送、データ取得に費やされているという人もいます。この記事では、前処理ステップを含む機械学習モデルの適用という 2 番目の部分に焦点を当てます。この記事で説明するパイプラインは、私が参加した 100 を超える機械学習コンテストの結果です。ここでの説明は非常に一般的ですが、非常に有用であり、専門家によって実践されている非常に複雑な方法も存在する可能性があることに注意する必要があります。
Pythonを使ってみます!