Follow @data_no_memo

メモ

個人的なメモです。他者にわかりやすく書くよりも未来の自分にわかりやすく書いています。なお、記事内容の正確さは保証できません。勉強中の身ですので、間違い等ご指摘頂けたら幸いです。

2018-09-01から1ヶ月間の記事一覧

標準化しても正規分布にはならない

特に、教育分野で標準化の例として偏差値が取り上げられ、偏差値70だと上位○○%だと、正規分布とともに紹介されることがある。 先日、友人と話をしていて、このことがあたかも標準化を行えば、そのデータが正規分布に従うようになるという誤解を生んでいるの…

クロンバックのα係数

何らかの質問項目によって、測定された変数がどれだけ、本当に測りたいそれを測れているのかを示す指標として、しばしばクロンバックのα係数が使用される。なお、クロンバックのα係数は信頼性係数の指標の1つである。 クロンバックのα係数を考えるために、こ…

偏相関係数の意味

先日、ある先生が偏相関係数について説明していたけど、適切とはお思えない方法で(少なくとも非常にわかりにくい方法で)、その数式の意味を教えていたので、偏相関係数について改めて考える。 偏相関係数とは、変数xと変数y間の関係において、変数z影響を…

正規分布からカイ二乗分布導く

よく知られる確率分布は互いに関連しており、ある分布からある分布を導出することができる。 今回は標準正規分布からカイ二乗分布を導いてみる。 カイ二乗分布は標準正規分布からランダムに得られた数値の2乗値の合計の分布である。 カイ二乗分布は自由度に…

多重共線性

多重共線性とは、ある回帰モデルにおいて、独立変数間の相関が強い時、その係数の推定値の分散が大きくなってしまい、推定値が安定しない問題である。 最小2乗法による回帰分析で実際に試してみた。 手順は以下の通り。 ①従属変数yを正規分布から発生 ②yと相…

相関のある2つの変数の乱数の発生方法

Rで相関関係のある2つの変数の乱数を発生させる時、いつも以下の方法に頼っていました。 n<-10000 b<-0.9 set.seed(1234) x<-rnorm(n) e<-rnorm(n) y<-x*b+e cor(x,y) この時のbをいじる事で相関の強さを調整していました。なんと効率の悪い方法でしょう。 …