3−2.研究のレベル上げ2:データ全般

(1) 背景


1) 全般
  結果 使えないデータが出てくる。
  原因 漫然と「研究をした」だけだと使えないデータが出てくる。
「研究をしたい」と「良い研究をしたい」には雲泥の差がある場合が多い。
2) いい加減
 @どのようにしたか?
  結果 実験を再現するために十分な実験の手順が分からない。実験の再現ができない。再現性が確保できない。
  原因 実験測定データ処理をいい加減にしたらいい加減なデータが出てくる。
 Aどんなデータか?
  結果 残っているデータがどんなデータなのかが分からない
  原因 (一次)データのメタ情報記録されていない。データ管理がいい加減になる。
 Bどんな試料か?
  結果 残っている実験試料がどんな実験試料なのかが分からない
  原因
3) 間違い 人は間違えることがある(よく間違えている)。
 ・測定手順の間違え ・試料の取り違え ・数値の取り違え
 ・単位の付け間違い ・計算の間違い
 ・異常値の不適切な取り扱い
4) 誤差 誤差が大きくて他のデータとの比較に耐えないデータは今後の議論に使えない。
早めに誤差を小さくする必要がある。
誤差を小さくするのが遅れると作業がムダに終わり、やる気・時間・消耗品の消耗が大きい。
5) 学術論文の投稿のときは査読のときに掲載拒否になる。
誤差の評価のない学位論文・レポートは認められない。

(2) 目的・目標・方針


1) 目的
 @重要性 データの重要性を認知する。
 A能力の向上 データの取得・処理能力、データの信頼性・結果の妥当性の評価能力の向上。
2) 目標
 @記録 実験手順の記録。(一次)データのメタ情報の記録。
 A証拠 有力な証拠(Strong Evidence)、弱い証拠(Weak Evidence)の違いが分かるようにする。
 B可視化 的確な図表を作成できるようにする。
3) 方針 データの取り扱いに関するオンザジョブトレーニング
任せる。
忍耐強く。
自分でやらない。自分でやった方が早く、仕事の質も高い。でも相手は成長しない。
 @必要性を伝える ×いい加減なデータ
「いい加減なデータで学術論文を投稿したら、掲載拒否されるよ。」
データの客観的妥当性は?
 Aデータの可視化
  (見える化)
Description
Conditions of measurement
As collaborator(s) can follow and check process of data analyses.
As you will be able to follow and check the processes of the data analyses.
 B宿題
コミュニケーションの手助け(話のネタ)になる。
相手の理解度が分かる。それに応じて対策が出来る。
相手にとって締切が出来るので、作業に取り掛かるようになる。
(締切がないと作業に取り掛からない人が多い。)
早く理解が進む。
データ処理・解析、質の評価、質の改善
助言をする。I have advices for you as follows: ~.
 Cアウトプット能力の強化 Color, Bold letter

(3) データの取得


1) 準備
 @原理の理解 教科書学術論文総説などを読んで原理を理解する。
 Aまとめファイル・ノート まとめファイルを作る。実験ノート用のノートを買う。
 B結果の例
  方針 教科書学術論文(の総説)などを読んで結果のを集める。
をまとめファイルにコピー・ペーストする。文献名を記入する。
→重要箇所にマークする。
→結果に影響を与えうる要因を書き込む。
  ・出発物質の組成、水導入剤、酸素分圧バッファー材、酸化物アクティビティー制御材、カプセル材質
  ・温度、圧力、保持時間
→分類(カテゴリー)分けする。タイトルを付ける。
  利点 データ取得時にデータが正しく取れているかを直ちに確認できる。
  典型例 スペクトルなど。結果の確定しているものから(分かりやすいので)。成分の少ないものから。
学術論文のIntroduction に引用されている図書をあたる。
  応用例・例外
  失敗例 (予期しない) ・コンタミネーション ・高圧相の低圧相への転移 ・高圧相のアモルファス化 ・酸化
 C結果のまとめ 表を作る。
 D着眼点・注意点
  図書 教科書・関連学術論文を読んで着眼点・注意点を見つける。
  アドバイス 同様の測定をしている人に着眼点・注意点を聞く。
2) 取得時
 @考える 考えながらデータを取る。
基本的な物理量の定義式(Defining Equation)、物理法則(Physical Law)とデータを比較しながらデータを取る。
F = k x、フックの法則(Hooke's Law)
P = F / S、圧力の定義
V = R I、オームの法則(Ohm's Law)
 Aファイル名 データを体系化しやすい名前を付ける。
 ・実験試料名 ・測定条件
 B不確定性 データを複数回・複数個所取る。
測定精度の評価。
測定試料の不均質性の評価。
3) 取得後 Organize -> Categorize

(4) データの整理(Organization)


1) Keeping track of everything
Detailed log book
Precise notes
【参考図書】
 ・科学者として生き残る方法(F. ロージ・T. ジョンストン)
 ・Survival Skills for Scientist (F. Rosei and T. Johnston)
2) フォルダ
 @名前 誰でも内容が分かるようにフォルダに名前をつける。
(Name folders as everyone can understand contents of the folders.)
 A階層構造
  (Layered Structure)
第一階層(First Layer)
 物性(Property)
第二階層(Second Layer)
 B数

(5) データのまとめ方


1) 必要性 データの可視化、誤差の計算、生データからの計算をするので。
データの可視化・誤差評価の重要性を理解していない学生さんは後回しにすることが多い。
  【第一段階】重要性を言う。
  【第二段階】やり方を見せる。
  【第三段階】誤差のない学位論文・レポートは受け付けないことを言う。
2) 方針
 @宿題 早めにデータをまとめる宿題を出す。
 A指導 ・X-Yデータかどうか考える。
 縦軸は測定したデータ。
 横軸に何かを取れるか。
・X-Yデータをシートに貼り付ける。
・見出しを付ける。
・列の見出しに上下の線を引く。
・色を付ける。
・重要なデータには色を付ける。
・測定条件の表を作成する。
参考論文に載っている図で描けるものを描く。
図の意味を考える。
3) Excelの使い方
 @目標 短時間で、Productive
見やすい表と図
 A操作 複数選択:クリックで選択→SHIFT→クリックで選択
列幅の自動調整:列の間の線をダブルクリック(複数選択実行も出来る)
Column-width adjustment: Double-click on separators.
データのある最終セルへの移動:選択セルの枠をダブルクリック
Jump to the last row
データのある最終セルまでの選択:SHIFT を押しつつ選択セルの枠をダブルクリック
自動データ入力:セルの右下でダブルクリック
Auto-fill
画面分割:最終列の右側でダブルクリック
Split
【参考ウェブサイト】
https://www.microsoft.com/ja-jp/atlife/tips/archive/office/navi/exceltips.aspx
 B見やすさ 意図のあるデータ処理シート。
配置。関連性。
左からデータ処理過程にそって並べる。
省スペース。

(6) データの信頼性


0) 参考図書 科学英語論文のすべて第2版(日本物理学会)
新しい誤差論(吉澤康和)
1) 測定の基本情報 Basic information of measurement
 @必要性 ほとんどの研究は共同研究者との共同研究である。
データの信頼性を共同研究者と共有する必要がある。
測定の基本情報を共同研究者と共有する必要がある。
測定の基本情報を分かりやすくまとめる
 @試料 出発物質の情報(鉱物名、粉末、単結晶、多結晶焼結体)
 A測定方法
 B分析装置 分析機器の型番・製造会社名を書く。
 C測定条件 加速電圧値、電流値
試料の厚さ
 D単位 単位を忘れない。
単位を間違えない。kV とkeV は間違えやすいようだ。
2) 可視化
 @Export 表計算ソフトのシートに貼り付け。
3) 誤差
実験結果・測定値を評価(evaluation)・比較・検討し、根拠・裏付け証拠とするためには誤差が重要である。
実験では測定値にどの程度の誤差があるのかを理解しておく必要がある。
(何桁目まで有効、誤差は何%など)
誤差への理解を怠る人は、評価・比較・検討する能力に乏しい。
【参考図書】
 ・新しい誤差論(吉澤康和)
  解像度 画像の解像度(ピクセルの大きさ)。
 装置の性能。
始点・終点の選択による誤差。
  測定点数 Please list numbers of analyses.
  平均値 表計算ソフトで計算する。
  精度 バラツキの程度。precision
  不確かさ uncertainty
  誤差 誤差を考慮した表現
T of x °C should be “~x” because of uncertainty in power estimate.
  標準偏差 表計算ソフトで計算する。
Please calculate standard deviations of ~.
to evaluate uncertainty (quality) of single measurement
to evaluate heterogeneity (homogeneity) of the chemical composition in each crystals
  系統誤差 同じ装置を用いて標準物質・比較対象物質の物性を測る。
 (直接比較)
誤差伝搬。
  有効数字 計算した標準偏差から評価する。
Significant figures (significant digits)
非現実的な桁数を書くのは非常識。実験結果を比較・検討しようとする意思がない。
  公差
4) 計算過程の明示 計算間違いがないかどうかを検証する必要がある。
計算の過程をたどれるようにしておく。
計算の過程を分かりやすく記す。
 計算式を書く。
 行・列に分かりやすいタイトルを付ける。
 関連個所に色を付ける。
生データ(Raw Data)をスプレッドシート(Spread Sheet)に分かりやすくまとめておく。
 @必要性 ほとんどの研究は共同研究者との共同研究である。
計算過程・測定誤差を共同研究者と共有する必要がある。
測定誤差を分かりやすくまとめる。
5) データ比較
同じ条件での測定値。
異なる条件での測定値。
測定値と理論値。
今回の測定値と過去の研究の測定値
測定誤差を超えた違いなのか、測定誤差を考慮すると違うとは言えない「違い」なのか
  赤外光吸収スペクトル Absorbance ではなく、Absorption coefficient (cm-1) にする。

(7) 図


1) 可視化(見える化)
【参考図書】
 ・ファシリテーション・グラフィック(堀公俊・加藤彰)
 @研究の可視化
  (見える化)
研究の全体像焦点論点が分かりやすくなる。
データを評価するには書いてみる。
 A分かりやすさ 議論が分かりやすくなる。
All the comments are very important to evaluate the results you obtained by comparison of the results with existing knowledge. You should always consider the best way to compare your data with the existing knowledge if you want to become a good scientist.
 B備え どのようになるかをシミュレーションする。
論点はどこかを予め考える。
  参考論文のデータのプロット どのようになるかをシミュレーションする。
生データに近いものを見せる。
 @役割
証拠(論より証拠)。
 計算の元のデータを見たいときがある。
 科学論文の著者が重要な特徴を見落としているときもある。
正確・簡潔。
興味を引く。論文を読み慣れている人は図から目を通す人が多い。
 A軸の取り方
比較しやすいようにする。
例。規格化する。
2) チェックポイント
 @明瞭さ 明瞭さ(Simplicity, Simpler is better.)
(0) A straight scale bar is better.
(1) Remove equations because these are not important here.
(2) Remove “(stepped heating)”. This is because you use only stepped heater in this study.
(3) Reduce symbol size of runs M368, M371 and M384.
(4) Use symbols for runs M368, M371 and M384.
(5) Change the maximum value of the horizontal axis as 700 to enlarge the plot.
明るさの調整。
 A統一性
  (Consistency)
First letter (capitalize?)
Bold or not?
Units in parentheses?
3) 例
 圧力較正曲線のプロット 以前に行われた実験のデータをプロットしてみる。
室温圧力較正曲線から高温圧力較正曲線。
 温度-電力関係図のプロット 加熱再現性(ヒーター系加工精度、Reproducibility)の確認。
熱電対の読みが正しいかの判断材料になる。
 S/N Signal/Noise を理解する。

(8) 表


分かりやすい表
 実験条件と結果のまとめ
 @比較しやすい形
  化学組成 Please calculate cations per 4 oxygens.
  Fe/(Mg + Fe) Please calculate Fe/(Mg + Fe).
 Aまとめ
  圧力較正実験 ランテーブルの作成方法を学ぶ。

(9) ブラックボックス対策


1) ブラックボックス?
2) 学生・ポスドクの傾向 最小限の労力で「目標」を達成しようとする。
ブラックボックスに手を出す。
なぜダメなのかが理解できない。
3) ダメな理由
実験・分析手法、測定原理、データ解析についての理解が浅くなる。
浅い理解では目の付け所が分からなくなる。
良いデータが取れなくなる。
新たな現象は見えてこない。
レベルが上がらない。
 レベルが上がっている人と比べて相対的にレベルが下がっている。
 (競馬でいうところの、「馬群に沈む」)
科学の最先端の面白さは味わえない。
検証が難しい。
そうなるのを良しとするかどうか自問した方が良い。

(10) 補完用の問いかけ


1) 議論
 指導教員との議論 内容を議論する。
査読者を説得できるかを尋ねる。
Do you think a reviewer will agree?
 周りの人との議論 周りの人と議論するように勧める。