2019-01-01から1年間の記事一覧

kaggle: Avito Demand Prediction Challenge まとめ

はじめに コンペ概要 データの種類とタスク 評価方法 提出方法 勉強になる Kernel と Discussion [Avito EDA, FE, Time Series, DT Visualization ✓✓ | Kaggle Ideas for Image Features and Image Quality | Kaggle High Correlation Feature Image Classif…

GBDTの理解に役立つサイトまとめ

GBDTは分析コンペや業務で頻出しますが、アルゴリズムの詳細はパッケージごとに異なるため複雑です。できることなら公式ドキュメント・論文・実装を読み込みたいところですが、私の実力的にそれは厳しいので参考サイトをまとめておきます。ゆるふわ理解に留…

Metric Learning 入門

はじめに metric learningとは マハラノビス距離学習 deep metric learningとは siamese network triplet network サンプルの選び方と直感的理解 L2 softmax network MNISTで実験 実験条件 実験1-1: 表現力の確認 実験1-2: 未知クラスの表現力を確認 実験1-3…

kaggle: Mercari Price Suggestion Challenge まとめ

はじめに コンペ概要 特別ルール kernel only 2stage 特別ルールの影響 データの種類とタスク 評価方法 提出方法 勉強になる Kernel と Discussion Mercari Interactive EDA + Topic Modelling | Kaggle Ridge Script | Kaggle ELI5 for Mercari | Kaggle A …

kaggle: Porto Seguro's Safe Driver Prediction まとめ

はじめに コンペ概要 データの種類とタスク 評価方法 提出方法 勉強になる Kernel と Discussion Data Preparation & Exploration | Kaggle Stratified KFold+XGBoost+EDA Tutorial(0.281) | Kaggle Resampling strategies for imbalanced datasets | Kaggle…

kaggle: Toxic Comment Classification Challenge まとめ

はじめに コンペ概要 データの種類とタスク 評価方法 提出方法 勉強になるkernelとdiscussion Stop the S@#$ - Toxic Comments EDA | Kaggle NB-SVM strong linear baseline | Kaggle Logistic regression with words and char n-grams | Kaggle LightGBM wi…