2018-11-04

機械学習関係の主要人物20人を調査

機械学習

先日のイベントで調べよう！と思うきっかけがありました

下のTweetのように先週は「MachineLearning15Minitues」というイベントに参加してきました。
株式会社バクフーの柏野さんの発表が個人的にとても好きな内容で是非皆さんにも見てもらいたいのですが、本筋の内容以外で一点気になる内容がありました。
「機械学習/深層学習市井の賢者から学ぶ」先日のML15Mでの @yutakashino さんの発表、個人的に今年TOP5に入る好きな話だったので皆にも見て欲しい https://t.co/meSPnU4LjG ちなみにJeremy HowardはPodcastにも出てるのでこちらもオススメ。https://t.co/Q2argGIF6X pic.twitter.com/UnxqKcF6V4
— ikedaosushi (@ikedaosushi) 2018年10月31日
それは下のスライド群で、実は柏野さんは「この辺りの方々は皆さんご存知だと思います。今回はなしません」と仰っていたのですが、恥ずかしながら半分くらいしかわかりませんでした。。

f:id:mergyi:20181104012727p:plain

そこで自分の勉強の兼ねてそれぞれの方々を調べてみることにしました！
ちなみに調べていて自分が追加した方がいいかなと思った方を一部追加しています。

2018-10-25

%macro/%store を組み合わせてJupyterでのライブラリ読み込みを劇的に効率化する

Jupyter

Jupyterで読み込むライブラリを毎回書いてませんか？

機械学習やデータ解析をJupyterで行うときに読み込むライブラリって大体決まっていますよね。
毎回1、2つ目のセルにライブラリ読み込み処理をズラッと書いてないですか？
人によってはスニペットアプリなどで管理している方もいるかもしれませんが、Jupyterの %macro と %store を使うことでもっと短く、シンプルに、効率的にライブラリの読み込みを行うことができるので紹介したいと思います。

2018-10-21

アンサンブル手法のStackingを実装と図で理解する

機械学習

Stackingとは何か

機械学習モデルの精度を向上させる手法の1つで、モデルを積み重ねる(Stackする)ことで精度を高めます。
ポピュラーかつ、強力な手法なKaggleのKernelで見ることも多いですね。
アンサンブル学習の一種で、他のアンサンブル学習にはAveraging/Bagging/Boostingがあります。
Stackingは他のアンサンブル学習の手法と比べると文章だけ読んでも理解し辛いので、直感的に理解できるように図と簡単な実装で説明してみたいと思います。

注意: この記事で書かないこと

今回は概念の理解にフォーカスしたいので、バリデーションの手法については触れません。特にSecondLevelでのバリデーションについてはいくつか選択肢があり、データの性質によって使い分けが必要なので次回以降書きたいと思います。

2018-10-10

matsumotoryさん、kwappaさんの公開ポートフォリオレビューを受けました/自分なりにアウトプットすることのメリットを整理してみた

「エンジニアの日々のアウトプット」に関するForkwellさんのイベントに参加してきました。

ForkwellのポートフォリオはのぼりーさんのクラウドPodcastのmatsumotoryさんゲスト回を聞いて興味を持ち使い始めました。
ただ、埋めやすいところを埋めてGithubを連携させただけで、ちゃんと使いこなせていたかは疑問でした。
そんなときに、このイベントを前職の同期から聞き、開催場所も前職のオフィスだったので久々に遊びに行きたい気持ちもあって応募しました。

forkwell.connpass.com

ポートフォリオを(強制的に)ちゃんと埋めました

イベントページに

ゲストのお二人が参加者のポートフォリオを抽選で3名レビューいたします！

との記載があったので、せっかくなので…ということで応募したら、なんと選ばれました！ 85人の前でレビューされる、というプレッシャーもあり、週末の半日くらいを使って必死に埋めました。ときには追い込まれることも必要だと思いました。

来週のイベントで「matsumotoryさんkwappaさんからポートフォリオを公開レビューしてもらえる3人」に選ばれたので、ポートフォリオを埋めてた。ちゃんと書くのは大変だったけど、Forkwellだといい感じに表示してくれるので嬉しい。オススメしたい。https://t.co/Oxo80IJ4If https://t.co/j4mntzJNuW
— ikedaosushi (@ikedaosushi) 2018年10月7日

2018-10-03

10月8日(月)につくばPythonもくもく会 No.1を開催します！

tsukuba.py

Pythonを使っている方&Pythonを勉強したい方一緒にもくもくしませんか？

宣伝です。
これから、つくばでPython もくもく会を定期的に開いていきます！
第1回は10月8日(月)11:00~@筑波大学内体バチで行います。
将来的にはPythonの情報共有ができたり、交流の輪を広げられるコミュニティにしていけたらいいなと妄想しています。
参加費や条件などは無料なのでぜひぜひお気軽にお申し込みください。

詳細はconnpassページをご参照ください。

申し込みもこちらからできます。途中参加退場なども自由です！

tskubapy.connpass.com

2018-10-03

ISOに従っていないデータをpandas.to_datetime()すると500倍以上遅くなる可能性がある話とその対策

TL;DR

pandasの to_datetime メソッドはとても便利で、かなり乱暴にデータを突っ込んでもParseしてくれます
でもデータによってはparseに通常の30倍以上時間がかかる可能性があるので注意しましょう
ISO_8601の規格に従っていない場合はとりあえず format オプションをつけておくのが得策です。
コードはすべてGithubにあがってます

github.com

2018-09-27

pathlibで見るPythonの演算子オーバーロード活用

Python

pathlibって便利ですよね

最近pathlibの便利さが様々なところで語られています。

pathlibの様々な機能は上記の記事やドキュメントを読んでいただければわかるので、今日はその1つに、Pythonのオーバーロードを説明するのに良い機能があるので紹介したいと思います。

フリーランチ食べたい

No Free Lunch in ML and Life. Pythonや機械学習のことを書きます。

機械学習関係の主要人物20人を調査

先日のイベントで調べよう！と思うきっかけがありました

%macro/%store を組み合わせてJupyterでのライブラリ読み込みを劇的に効率化する

Jupyterで読み込むライブラリを毎回書いてませんか？

アンサンブル手法のStackingを実装と図で理解する

Stackingとは何か

注意: この記事で書かないこと

matsumotoryさん、kwappaさんの公開ポートフォリオレビューを受けました/自分なりにアウトプットすることのメリットを整理してみた

「エンジニアの日々のアウトプット」に関するForkwellさんのイベントに参加してきました。

ポートフォリオを(強制的に)ちゃんと埋めました

10月8日(月)につくばPythonもくもく会 No.1を開催します！

Pythonを使っている方&Pythonを勉強したい方一緒にもくもくしませんか？

詳細はconnpassページをご参照ください。

ISOに従っていないデータをpandas.to_datetime()すると500倍以上遅くなる可能性がある話とその対策

TL;DR

pathlibで見るPythonの演算子オーバーロード活用

pathlibって便利ですよね