磯輪日記

世界の段ボールビトを幸せに! 自分と自分の愛する家族の幸せのために働ける 世界一社風のいい会社を目指しています。

冬休みの宿題

f:id:Isowa:20251230171733j:image

 

私の母校でもあり、将棋の藤井聡太くんの母校でもある名古屋大学教育学部附属中・高等学校。ご縁があって、同校が文部科学省から指定されたスーパーサイエンスハイスクールプログラムの運営指導委員の末席に名をつられています。その関係から、昨年末、

委員会でお目に掛かる同校の都丸、佐藤両先生から献本を受けました。『THE FIRST STEP データサイエンス』。私が最も苦手な分野であると同時に、勉強しなければいけない分野でもあります。頂いたお手紙に「『統計が苦手でも、自分で分析し、意味を読み取り、言葉で説明できる力を育てる』ことを目指し」た中学、高校の教育現場での入門書とありました。「これって、私のためにあるような本じゃないか!」なんせ、筋金入りの数学嫌いですから。年末に届いたので、「これは先生から私への冬休みの課題図書じゃないか!」と思い、年末年始の休みの間に読んでみました。

 

さてその感想は、「これが『ファースト・ステップ』?!」です。出だしはとても面白かったです。例えば50m走のデータ。学校らしい分かりやすい事例ですね。これについて「記録はあくまで写しです」これには「風向きや路面の状態、走った人の体調や緊張といった背景は表れません。どこを切り取るかで見え方が変わることもあります」「書かれていないことに想像を働かせ、データのとり方にも気を付ける姿勢が重要です」。これは実に重要です。いまそこにある数字だけで考えてしまいがちですが、いまここに無いことにも思いをはせる姿勢が推論の角度を高めるためには非常に重要です。

 

次に、「記録の残し方は将来の自分や仲間への贈り物の質を左右」する。だから「だれが、いつ、どこで、どのように記録したデータなのかを書き添えておくと、あとから確かめられる」。残念ながらISOWAでもいろんなデータが出てきますが、誰が、いつ作ったのか記載の無いものがあります・・・ というか、大部分がそうです。これは日本人の美徳なのだと思います。しかし見方によっては、責任を回避しているように見えてしまいます。 必ず、日付と作成者名は入れましょう!

 

変数同士の計算に意味がない質的データと、計算が意味を持つ量的データ。例えば5段階表示の成績は質的データ化量的データか、どっちでしょう? 何となく量的データだと思っていましたが、違いました。その心は、5段階評価で例えば同じ『5』の人が5人いても、5人がまったく同じ成績ではないし、『5』の人は『1』の人の5倍賢いわけでもない。同じ『3』の人でも、限りなく『4』に近い人もいれば、その逆に『2』に近い人もいる。でも数字で示されると、何となく量的データだと思い込んでいました。つまり同じ評点の人はみな同じ能力で、かつ1と2,2と3,3と4,4と5の能力差は一定だと便宜上定めて、データを見ているので、量的データのように見えてしまう。逆にそう見なして、利用しているだけなんですね。言われてみれば至極当たり前なんですが、ある意味落とし穴でした。さらに標準偏差、相関係数など、高校時代の数学の復習もできました。

 

ポーター賞受賞後に頂いた業界内における自社の収益性分析の結果の際、お世話になった箱ひげ図も復習できました。外れ値の扱い方、見方もそのデータの背景にまで思いをはせることも学ぶことができました。

 

中でもいちばん参考になったことを披露します。統計では、しばしば「言いたいことと逆の仮説を立てて、それを否定することによって、いいたいことをいう」というスタイルを取ることでした。 例えば「メンテナンス頻度と生産平米当たりの突発停止回数は負の相関関係がある」という仮説を証明したいけど、これってなかなか証明するのは難しいです。そこでこれとは逆の「両者には負の相関関係は無い」という逆の仮説を立ててた上で、いくつかの負の相関関係がある事例を示す。それがが多ければ多いほど、「負の相関関係が無いわけではない」ことが証明できる。

 

この本のおかげで、手遅れも甚だしいですが、私もデータサイエンティストとしての小さな最初の一歩をやっと踏み出すことができました。とてもいい、でも結構難しい冬休みの宿題。 都丸先生、佐藤先生、ありがとうございました。