さまよえる蒼い変人

我が成長曲線を綴り、「怒り・疑問・不満」を昇華していく

『158』著 マンガでわかる統計学 要点

f:id:forza-milito178:20200805164432j:image

「📕著 マンガでわかる統計学

・度数分布表をグラフ化したものをヒストグラムという

 


◎データの性質をつかむのに十分なほど細かく

◎見た人が分かりやすい階級わけ

 


このポイントを抑えられたグラフでなければ、相手に理解してもらいやすい内容にならない。正確さも分かりやすさも追求しよう

 


・均一あるいは単峰性でないヒストグラムには、なんらかの原因があると考えなければならない

・その原因を追求する姿勢が大事

・ただし基本的にはわからないことが往々としてある

 


階層分類という抽象スキルが統計学の本質

 


・感覚的な意味での「平均」がホントの「平均」になるのは一峰性の時だけ。要はまずは全体を求めた上でのいわゆる中央値算出が肝要

→意味ある値はここになることが多い

 


・一峰性のヒストグラム以外には「平均値」は参考にならない

 


○分散

平均値からのズレの二乗の総和をデータ一つあたりにしたものをいう

→ばらつきを評価する方法は「分散と絶対偏差」

 


・データの一乗を次々に足し、一つあたりにしたものを「平均」という

・データの二乗を次々に足し、一つあたりにしたものを「分散」という

 


*分散がわかれば、標準偏差は簡単に求められる。

標準偏差とは「データの偏りの程度を測る為の尺度」となる数値。

 


標準偏差

分散(偏差を2乗した値の平均値)の平方根のこと。標準偏差の値が大きいと、収集したデータの散らばりの度合いが大きいことを示す。標準偏差の値が小さいと、収集したデータの平均値前後にデータが集中していることを示す。厳密に言えば、標準偏差には2種類ある。

 


○ 関数

与えられた文字や数値に対し、定められた処理を行って結果を返す機能のこと。表計算ソフトやデータベースソフト、プログラミング言語などで利用される。関数ごとにさまざまな処理が割り当てられており、たとえば、表計算ソフトのExcelで「SUM」という関数を用いると、指定した範囲の合計が求められる。

   ex.Y=X

 


積分

与えられた関数について、微分してこの関数になるすべての関数。また、それを求めること。不定積分

 


微分

関数の変化の様子を表す概念。

 


・データごとの関連性を「相関」という

→相関がないという仮定が疑わしければ、そのこと自体を統計的に検証する必要がある

 


「確率分布」とは全ての場合を尽くした確率の表

 


二項分布

*平均と分散を求めるのは簡単

*二項分布は数が大きくなると正規分布に近くなる

 


「毎年一人くらいは変な奴が入社してくるよねー」とか「毎年五人くらい、なんだかんだいって途中で辞めちゃうよねー」などという会話が聞こえてくる。

母体となる人数が変動したり、あるいは発生する確率が変動したりしてもなんだかんだいって毎年一定値になることは多い

 


・「一部分だけ」調べて全体を予測するのを「推測統計」という

ex.一本のボールペンで何m線を引けるか?等

→①ランダムサンプリングを前提としている②元の分布が正規分布であることを前提としている

この前提が崩れると結果が無意味なものに

 


アンケートの信頼性を担保する為に必ず「無作為」にサンプルを取れているか?を意識しよう

領域によっては偏りのある答えが集まるかもしれないので

 


統計学は「確率に基づいた判断」を行う学問。確率を基に判断することまでいって、はじめて統計学であるといえる

→ネジ工場のネジの不良品は偶然なのかどうか、電球の寿命は確率変動の範囲内なのか、など

 

 

 

 


○平均

標本平均 母平均 標本平均から推定した母平均

 

 

所感

マンガ形式だとイラストでより統計学の難しさを視覚的に捉えられるので次回以降も有りだと思った!

統計学の本質「確率に基づいた判断」が繰り返し主張されており自分の仕事でのアウトプットに活かせたら意味があると感じた。

仮定、サンプル、確率、平均、標準偏差等といった統計を扱う上で切り離せない概念はしっかり理解できた