フリーランチ食べたい

No Free Lunch in ML and Life. Pythonや機械学習のことを書きます。

(古典)統計学と機械学習の翻訳テーブル

(古典)統計学機械学習では使う名称が全然違う

土日は医学系研究室で客員研究員として粛々と研究しているのですが、医学系の研究というのはまだまだ古典統計学が主流です。古典統計学を扱う時の問題は色々あるのですが、その中でも大きいのは機械学習と同じ概念なのに名称が違うことです。 これはけっこう大変で、自分は普段「機械学習の用語」で考えているので、「(古典)統計学の用語」で考えている教授や学生さんと話すときに脳をフル回転させて同時翻訳する必要があります。もはやバイリンガルみたいな気持ちです。

まぁ大変なだけだったら良くないけど良いのですが、ときどき認識の齟齬が発生したりして、それは実質的な問題なので、とりあえず今後間違いを減らせるように「翻訳テーブル」を作ってみました。

モデルに対する翻訳テーブル

(古典)統計学 機械学習 備考
重回帰分析 一般線形回帰モデル 一般化線形回帰モデルを(古典)統計学でなんと呼ぶのだろうか
従属変数(dependent variable) 目的変数(response variable) 数式ではY
独立変数(independence variable) 説明変数(explanatory variable) 数式ではX
要因, 質的変数 離散の説明変数 (古典)統計学では名義尺度、順序尺度などさらに分かれている
共変量, 量的変数 連続の説明変数
偏回帰係数, 回帰係数 パラメータ、係数
尤度関数 目的関数, 損失関数(符号は逆)

適宜更新していきたい

とりあえず今思いついたものを書き出してみただけなのですが、普段から言語の壁を感じまくっているので気付いたら書き足していきたいと思ってます。「これもあるよ!」という方がいたら教えてください。