この記事は 機械学習工学 / MLSE Advent Calendar 2018 - Qiita の15日目です。
Stacking/Blendingは実装が面倒
- Kaggleなどでよく使われるアンサンブル手法にStacking/Blendingがありますが自分で実装すると結構面倒です
- またモデルの精度を測る際にK-Fold Validationを行うこともありますが、同じpredictを何度も発生してしまい、単純に行うと無駄な処理が多くなってしまいます。
- 今回紹介するライブラリheamyでは、それらの問題点が解決されており、 抽象化されたAPIで簡単にStacking/Blendingを実装でき 、かつ、 内部でpredictされた結果がキャッシュされており、高速に計算を行うことができます
- またheamyではWeighted Averageも簡単に実装できる仕組みがあります。
- また、Stacking/Blendingに比べると浸透度は低いかもしれませんが、StacknetというStackingを複数階層に渡って行い、モデルでニューラルネットワークを作るような手法もあり、このStacknetもpystacknetというライブラリで簡単に実装することができます。
- Stacking/Blendingに関しては下記のKaggleのドキュメントに詳しいです。
Kaggle Ensembling Guide | MLWave
続きを読む