フリーランチ食べたい

機械学習、Python、ソフトウェアエンジニアリング、プロダクティビティなど

Pythonに関するオススメの書籍/サイト/サービス/Podcast/イベントの情報をシェア

Pythonをこれから勉強したい or 最新情報のキャッチアップがわからない、という方に tskubapy.connpass.com つくばPythonもくもく会 No.2を開催しました! 参加者の方の中にはこれからPythonを始めたい、という方もいらっしゃったので、今まで自分が勉強して…

scikit-learnのRandomForest.feature_importances_のコードを追う

feature_importances_をちゃんと理解する feature_importances_ とは sklearn.ensemble.RandomForestClassifier、 sklearn.ensemble.RandomForestRegressor (など)で特徴量の重要度を出力するメソッドです。 とても便利で、EDAやモデルの精度向上のためのア…

機械学習関係の主要人物20人を調べてみました

先日のイベントで調べよう!と思うきっかけがありました 下のTweetのように先週は「MachineLearning15Minitues」というイベントに参加してきました。 株式会社バクフーの柏野さんの発表が個人的にとても好きな内容で是非皆さんにも見てもらいたいのですが、…

%macro/%store を組み合わせてJupyterでのライブラリ読み込みを劇的に効率化する

Jupyterで読み込むライブラリを毎回書いてませんか? 機械学習やデータ解析をJupyterで行うときに読み込むライブラリって大体決まっていますよね。 毎回1、2つ目のセルにライブラリ読み込み処理をズラッと書いてないですか? 人によってはスニペットアプリな…

Stackingでモデルの精度UP 実装と直感的な解説

Stackingとは何か 機械学習モデルの精度を向上させる手法の1つで、モデルを積み重ねる(Stackする)ことで精度を高めます。 ポピュラーかつ、強力な手法なKaggleのKernelで見ることも多いですね。 アンサンブル学習の一種で、他のアンサンブル学習にはAveragin…

matsumotoryさん、kwappaさんの公開ポートフォリオレビューを受けました/自分なりにアウトプットすることのメリットを整理してみた

「エンジニアの日々のアウトプット」に関するForkwellさんのイベントに参加してきました。 ForkwellのポートフォリオはのぼりーさんのクラウドPodcastのmatsumotoryさんゲスト回を聞いて興味を持ち使い始めました。 ただ、埋めやすいところを埋めてGithubを…

10月8日(月)につくばPythonもくもく会 No.1を開催します!

Pythonを使っている方&Pythonを勉強したい方一緒にもくもくしませんか? 宣伝です。 これから、つくばでPythonもくもく会を定期的に開いていきます! 第1回は10月8日(月)11:00~@筑波大学内体バチで行います。 将来的にはPythonの情報共有ができたり、交流の…

ISOに従っていないデータをpandas.to_datetime()すると500倍以上遅くなる可能性がある話とその対策

TL;DR pandasの to_datetime メソッドはとても便利で、かなり乱暴にデータを突っ込んでもParseしてくれます でもデータによってはparseに通常の30倍以上時間がかかる可能性があるので注意しましょう ISO_8601の規格に従っていない場合はとりあえず format オ…

pathlibで見るPythonの演算子オーバーロード活用

pathlibって便利ですよね 最近pathlibの便利さが様々なところで語られています。 Python3.4以降ならos.pathはさっさと捨ててpathlibを使うべき - Qiita pathlibとかいう優秀すぎる標準ライブラリ(python) - 備忘録とか日常とか pathlibの様々な機能は上記の…

研究がESSSB 17th@ベルギー・ヘントでポスター発表されました!

ESSSBとは 正式名称はEuropean Symposium on Suicide & Suicidal Behaviourで、自殺行動/自殺予防について学際的な観点から研究された発表やポスターが多い学会です。今年はベルギーのヘントで開催されました。 www.esssb17.org ポスター タイトルは「Region…

BigQuery GIS/GeoPandasを使ってお手軽にIPアドレスで地理空間分析を行う「Wikipediaはどこから編集されている?」

TL;DR BigQueryの fh-bigquery:geocode.geolite_city_bq_b2b Tableを使い IPアドレスから緯度経度を取得できます 国土地理院の「地球地図日本」から地図データを取得することができます GeoPandasを使うことでお手軽に地理情報を可視化できます BigQuery GIS…

PyCon JP 2018のトークのスケジューリングを行い、Blog投稿しました

ついに来週PyCon JP 2018です 今週buildersconに参加してきたのもあって、体が温まっている感じがします。笑 今回、PyCon JPには運営側で参加しますが、そもそも PyCon JPに参加するのがはじめてなので(!)そういう意味でもとてもワクワクしています。 トー…

JSPN2018: 第114回日本精神神経学会で「DPATの個別対応と決定要因に関する分析」というタイトルでポスター発表を行いました

JSPN2018でポスター発表を行いました 実際に話したのはボスなので、何というのが正確かはわかりませんが、ポスター発表の実際の研究部分を担当しました。 www.congre.co.jp ざっくりとした背景と内容 DPATという自然災害などの後に、被災地域に入り、精神科…

PyCon JP2018のHPを作成しました。

PyCon JP2018 今年の5~7月に主に開発をしていたPyCon JP2018のHPが7月に無事完成し、ブログを投稿しました。自分はPyCon JP2018システムチームなので実装、調整で携わっていました。 pyconjp.blogspot.com pycon.jp 自分の担当とコード PyCon JP2018は Vue.j…

Kaizen Platformの開発者ブログに「BigQueryのコスト可視化ダッシュボード」について投稿しました。

下記記事です 実は恥ずかしながらはてなブックマークのホッテントリに入ったことがなかったので今回はじめて入ってとても嬉しかったです。 developer.kaizenplatform.com なぜ転載したか 転載には一応理由があって、実は最近Forkwellというサイトで自分のポ…

カリフォルニア大学サンディエゴのAlgorithmic Toolbox @ Courseraを修了しました!

ここ1ヶ月半くらいで、Courseraで「Algorithmic Toolbox」という名前のCSのコースを受けており、今週、6週分の授業・課題を全てクリアし今週修了証をゲットしました https://www.coursera.org/account/accomplishments/verify/JKBYCPYP7U69 Data Structures…

なぜ動的計画法はDynamic「Programming」という名前なのか

Coursera「Data Structures and Algorithms」 ここ1ヶ月半CourseraでCSのコースを受講しているのですが、そこで動的計画法についての面白い話があったのでシェア。 www.coursera.org 「Data Structures and Algorithms」という課程の中の「algorithmic-toolb…

読んだ本(Pythonによるベイズ統計モデリング、基礎からわかる時系列分析)

最近読んだ本のメモ。 本当は他にも感想を書きたい本が5冊以上あるのだが、全部書こうとすると、結局出来なくてまた放置してしまうので書けるうちに書いておく。 Pythonによるベイズ統計モデリング: PyMCでのデータ分析実践ガイド Pythonによるベイズ統計モ…

SeleniumでJavascriptObjectの状態の変化を待機してから動作させる

TLDR Custom Wait Conditionsとdriver.execute_scriptを組み合わせるとできる Seleniumで「ある特定の動作を待つ」 最近はSPA的なサイトが増えてきたので「求めているDOMがブラウザにレンダリングされた」後に「ある特定の動作をさせたい」という気持ちにな…

(古典)統計学と機械学習の翻訳テーブル

(古典)統計学と機械学習では使う名称が全然違う 土日は医学系研究室で客員研究員として粛々と研究しているのですが、医学系の研究というのはまだまだ古典統計学が主流です。古典統計学を扱う時の問題は色々あるのですが、その中でも大きいのは機械学習と同じ…

リモートワークの戦略とメリデメを整理する+弊社のリモートワーク事例の紹介

「リモートワークどうですか?」に対する回答を考える 今、自分が働いている会社はリモートワークを推進していて、自分自身も週3~4でリモートワークをしています。そういう状況なので、最近よく「リモートワークってどうですか?上手くいきますか?」と聞か…

2018-08-03 ニュースと感想

docs.google.com スライド101枚, 2時間で統計的基礎からDeepLearningまで学べるスライド。丁寧で良い教材、ただし英語。 qiita.com 10個は多いけど、勉強になる。解析する人とエキスパートはやっぱり分けるほうが多いらしい https://arxiv.org/pdf/1703.0252…

簡単で美味しい鶏肉チャーシューの作り方

後輩に教えてもらったのでメモ。タンパク質を摂るのに便利。 ジップロックに鶏肉と醤油大さじ2+砂糖大さじ2+レモン汁大さじ2+酒大さじ1入れる 炊飯器にお湯とジップロックを入れる 「保温」で2h待つ。2h経ったら外に出して粗熱を取って、冷蔵庫で2hくらい寝…

Linuxで `adduser` に `-gecos` を指定したら何ができるか。なぜ `gecos` という名前なのか。

あるソフトウェアのセットアップで adduser -gecos を設定するExampleがあって、何をしているか理解していなかったので調べてみました。 TLDR -gecos option は gecos field を設定するときに使うもの なぜ gecos というかは歴史的経緯があった システムとし…

2018-07-26 ニュースと感想

www.m3tech.blog folLeftとfoldRightでlistの捉え方が違うの面白い。そして図示するとめっちゃわかりやすい www.advertimes.com マーケティングの比重がPromotionからPlaceに移行してきたというのは割と納得感ある。マーケティング会社もPlaceを広げる事業が…

2018-07-25 ニュースと感想

qiita.com たしかに「主要型」がないと型推論て難しそう。型推論の話になる度にMatzがディスられる。。。 qiita.com 暑くなりすぎでしょ。。。Prophetは便利なので使っていきたい quipper.hatenablog.com 「データ分析組織」としてしっかり考えられている印…

pipが v10->v18になってビビってメーリングリスト見たみたらリリースサイクルも変わってた

TLDR pipがv10->v18になった Calendar Versioning(https://calver.org/)になったらしい リリースサイクルが3ヶ月になるらしい Python 3.3もサポート外になった PEP518(https://www.python.org/dev/peps/pep-0518/)とコンパチでないpackegeはinstallできなく…

`docker-compose run` は portをmappingしない

dokcer-composeでちょっとハマったのでメモ TLDR docker-compose run a すると設定したportがmappingされない docker-compose run --service-ports a すれば良い 詳細 ↓のようなdocker-compose.ymlがあったときに version: '3.5' services: a: image: hoge p…

2018-07-23 Newsと感想

www.inderapotheke.de GoogleMap超高くなったから何使う?という、MapBoxとかTomTomとの比較(Apple, Azureもあるけど) github.com Rockの歌詞っぽく書ける言語。 Hello Worldは↓ Billy says hello world!\n FizzBuzzは↓ Modulus takes Number and Divisor Wh…

会社で上半期MVPもらいました!!

横浜で最高の夏を味わいながら全社イベしてきた。弊社最高 横浜で最高の夏してる (全社イベ) pic.twitter.com/wRXjML5rNw— lacolaco (@laco2net) July 20, 2018 さらに最高に嬉しいことに上半期の個人部門MVPをもらえました。 全社MVPをもらって喜ぶ28歳。…