フリーランチ食べたい

機械学習/データ解析/フロントエンド/バックエンド/インフラ

scikit-learnのRandomForest.feature_importances_のコードを追う

feature_importances_をちゃんと理解する feature_importances_ とは sklearn.ensemble.RandomForestClassifier、 sklearn.ensemble.RandomForestRegressor (など)で特徴量の重要度を出力するメソッドです。 とても便利で、EDAやモデルの精度向上のためのア…

機械学習関係の主要人物20人を調査

先日のイベントで調べよう!と思うきっかけがありました 下のTweetのように先週は「MachineLearning15Minitues」というイベントに参加してきました。 株式会社バクフーの柏野さんの発表が個人的にとても好きな内容で是非皆さんにも見てもらいたいのですが、…

%macro/%store を組み合わせてJupyterでのライブラリ読み込みを劇的に効率化する

Jupyterで読み込むライブラリを毎回書いてませんか? 機械学習やデータ解析をJupyterで行うときに読み込むライブラリって大体決まっていますよね。 毎回1、2つ目のセルにライブラリ読み込み処理をズラッと書いてないですか? 人によってはスニペットアプリな…

アンサンブル手法のStackingを実装と図で理解する

Stackingとは何か 機械学習モデルの精度を向上させる手法の1つで、モデルを積み重ねる(Stackする)ことで精度を高めます。 ポピュラーかつ、強力な手法なKaggleのKernelで見ることも多いですね。 アンサンブル学習の一種で、他のアンサンブル学習にはAveragin…

matsumotoryさん、kwappaさんの公開ポートフォリオレビューを受けました/自分なりにアウトプットすることのメリットを整理してみた

「エンジニアの日々のアウトプット」に関するForkwellさんのイベントに参加してきました。 ForkwellのポートフォリオはのぼりーさんのクラウドPodcastのmatsumotoryさんゲスト回を聞いて興味を持ち使い始めました。 ただ、埋めやすいところを埋めてGithubを…

10月8日(月)につくばPythonもくもく会 No.1を開催します!

Pythonを使っている方&Pythonを勉強したい方一緒にもくもくしませんか? 宣伝です。 これから、つくばでPythonもくもく会を定期的に開いていきます! 第1回は10月8日(月)11:00~@筑波大学内体バチで行います。 将来的にはPythonの情報共有ができたり、交流の…

ISOに従っていないデータをpandas.to_datetime()すると500倍以上遅くなる可能性がある話とその対策

TL;DR pandasの to_datetime メソッドはとても便利で、かなり乱暴にデータを突っ込んでもParseしてくれます でもデータによってはparseに通常の30倍以上時間がかかる可能性があるので注意しましょう ISO_8601の規格に従っていない場合はとりあえず format オ…

pathlibで見るPythonの演算子オーバーロード活用

pathlibって便利ですよね 最近pathlibの便利さが様々なところで語られています。 Python3.4以降ならos.pathはさっさと捨ててpathlibを使うべき - Qiita pathlibとかいう優秀すぎる標準ライブラリ(python) - 備忘録とか日常とか pathlibの様々な機能は上記の…

研究がESSSB 17th@ベルギー・ヘントでポスター発表されました!

ESSSBとは 正式名称はEuropean Symposium on Suicide & Suicidal Behaviourで、自殺行動/自殺予防について学際的な観点から研究された発表やポスターが多い学会です。今年はベルギーのヘントで開催されました。 www.esssb17.org ポスター タイトルは「Region…

BigQuery GIS/GeoPandasを使ってお手軽にIPアドレスで地理空間分析を行う「Wikipediaはどこから編集されている?」

TL;DR BigQueryの fh-bigquery:geocode.geolite_city_bq_b2b Tableを使い IPアドレスから緯度経度を取得できます 国土地理院の「地球地図日本」から地図データを取得することができます GeoPandasを使うことでお手軽に地理情報を可視化できます BigQuery GIS…

PyCon JP 2018のトークのスケジューリングを行い、Blog投稿しました

ついに来週PyCon JP 2018です 今週buildersconに参加してきたのもあって、体が温まっている感じがします。笑 今回、PyCon JPには運営側で参加しますが、そもそも PyCon JPに参加するのがはじめてなので(!)そういう意味でもとてもワクワクしています。 トー…

JSPN2018: 第114回日本精神神経学会で「DPATの個別対応と決定要因に関する分析」というタイトルでポスター発表を行いました

JSPN2018でポスター発表を行いました 実際に話したのはボスなので、何というのが正確かはわかりませんが、ポスター発表の実際の研究部分を担当しました。 www.congre.co.jp ざっくりとした背景と内容 DPATという自然災害などの後に、被災地域に入り、精神科…

PyCon JP2018のHPを作成しました。

PyCon JP2018 今年の5~7月に主に開発をしていたPyCon JP2018のHPが7月に無事完成し、ブログを投稿しました。自分はPyCon JP2018システムチームなので実装、調整で携わっていました。 pyconjp.blogspot.com pycon.jp 自分の担当とコード PyCon JP2018は Vue.j…

カリフォルニア大学サンディエゴのAlgorithmic Toolbox @ Courseraを修了しました!

ここ1ヶ月半くらいで、Courseraで「Algorithmic Toolbox」という名前のCSのコースを受けており、今週、6週分の授業・課題を全てクリアし今週修了証をゲットしました https://www.coursera.org/account/accomplishments/verify/JKBYCPYP7U69 Data Structures…

なぜ動的計画法はDynamic「Programming」という名前なのか

Coursera「Data Structures and Algorithms」 ここ1ヶ月半CourseraでCSのコースを受講しているのですが、そこで動的計画法についての面白い話があったのでシェア。 www.coursera.org 「Data Structures and Algorithms」という課程の中の「algorithmic-toolb…

読んだ本(Pythonによるベイズ統計モデリング、基礎からわかる時系列分析)

最近読んだ本のメモ。 本当は他にも感想を書きたい本が5冊以上あるのだが、全部書こうとすると、結局出来なくてまた放置してしまうので書けるうちに書いておく。 Pythonによるベイズ統計モデリング: PyMCでのデータ分析実践ガイド Pythonによるベイズ統計モ…

【Selenium】JavascriptのObjectの状態変化を待機する

TL;DR Custom Wait Conditionsとdriver.execute_scriptを組み合わせる Seleniumで「ある特定の動作を待つ」 最近はSPA的なサイトが増えてきたので「求めているDOMがブラウザにレンダリングされた」後に「ある特定の動作をさせたい」という気持ちになるときは…

(古典)統計学と機械学習の翻訳テーブル

(古典)統計学と機械学習では使う名称が全然違う 土日は医学系研究室で客員研究員として粛々と研究しているのですが、医学系の研究というのはまだまだ古典統計学が主流です。古典統計学を扱う時の問題は色々あるのですが、その中でも大きいのは機械学習と同じ…

リモートワークの戦略とメリデメを整理する+弊社のリモートワーク事例の紹介

「リモートワークどうですか?」に対する回答を考える 今、自分が働いている会社はリモートワークを推進していて、自分自身も週3~4でリモートワークをしています。そういう状況なので、最近よく「リモートワークってどうですか?上手くいきますか?」と聞か…

Linuxでadduserに-gecosを指定したら何ができるか。なぜ gecosという名前なのか。

あるソフトウェアのセットアップで adduser -gecos を設定するExampleがあって、何をしているか理解していなかったので調べてみました。 TLDR -gecos option は gecos field を設定するときに使うもの なぜ gecos というかは歴史的経緯があった システムとし…

pipが v10->v18になってビビってメーリングリスト見たみたらリリースサイクルも変わってた

TLDR pipがv10->v18になった Calendar Versioning(https://calver.org/)になったらしい リリースサイクルが3ヶ月になるらしい Python 3.3もサポート外になった PEP518(https://www.python.org/dev/peps/pep-0518/)とコンパチでないpackegeはinstallできなく…

docker-compose run は portをmappingしない

dokcer-composeでちょっとハマったのでメモ TLDR docker-compose run a すると設定したportがmappingされない docker-compose run --service-ports a すれば良い 詳細 ↓のようなdocker-compose.ymlがあったときに version: '3.5' services: a: image: hoge p…

会社で上半期MVPもらいました!!

横浜で最高の夏を味わいながら全社イベしてきた。弊社最高 横浜で最高の夏してる (全社イベ) pic.twitter.com/wRXjML5rNw— lacolaco (@laco2net) July 20, 2018 さらに最高に嬉しいことに上半期の個人部門MVPをもらえました。 全社MVPをもらって喜ぶ28歳。…

PyCampのTAをしてきて、印象に残った質問のメモと、何かを教えるときの難易度と頻度の関係性について考えてみた

大学院生以来のTAを筑波大学でやってきた! 運営スタッフをやっているPyCon JP( https://pycon.jp/2018/ )がPythonを教えるBootCamp「PyCamp」を筑波大学で開催するということでTAとして参加してきた。 TAをやるのはM2夏以来なので、4年前ぶり…(時の流れが早…

読んだ本 (CAREER SKILLS/Deep Work/Keras/ユダヤ人大富豪の教え/バンディット問題)

積読をまとめて読んだので読書メモ書きました。 CAREER SKILLS ソフトウェア開発者の完全キャリアガイド | ジョン・ソンメズ けっこう流行ってたSOFT SKILLSの続編 第1部~第3部まではプログラマーの仕事の紹介や基本的なお作法などよくあるHOW TOっぽい内容…