時代が進むにつれて、一つの論文に必要とされる実験データの量が増加している。
以前はデータをそのまま単純な表、グラフにしておけばよかった。
しかしいまではそんなことをしたら表、グラフだけで何ページも必要になってしまう。
それでは審査員、読者が理解することが困難になり、通る論文も通らなくなるだろう。
すでに、たくさんの研究者がデータをわかりやすく、少ないスペースで表現するための様々な工夫を行なっている。これからそれらの実例を集めて、自分の論文作成に役立ててみたい。
(作成中)
A cascade of transcription factor DREB2A and heat stress transcription factor HsfA3 regulates the heat stress response of Arabidopsis The Plant Journal (2008) 53: 264-274 Schramm F et al.
http://www3.interscience.wiley.com/journal/119410704/suppinfo sm004.pdf
発現量が色 青〜赤 一回の結果が縦長の長方形 繰り返し実験 の結果を並べる 異なる条件での値をさらに並べる
この図では遺伝子数が 33,条件が 24 各条件につき値が5つ以上ある。 さすがに自分で出したデータではなく、expression profile in the AtGenExpress stress series の値を用いている。
http://www.nistep.go.jp/achiev/ftx/jpn/rep139j/pdf/rep139j.pdf サイエンスマップ2008
マップの描画法に工夫がされている(38ページ)。研究領域の広がり(大きさ)をガウス関数で表現している。マップ上の円の大小で大きさを表現しようとすると、最大の円と最小の円の大きさの比率が100くらいになる。それでは都合が悪い。
研究領域の、マップ上での中心位置が決められる。その点を中心として、その研究領域に属するコアペーパーがガウス関数状に分布するように配置する(平均が0、分散は1?)。属するコアペーパーが少ない(小さい)領域の場合は、中心の周りにコアペーパーが分布する。大きい領域では、広い範囲に分布するようになる。
マップを細かいグリッドに分け、それぞれのグリッドに含まれるようになったコアペーパーの数をカウントする。 それを用いてマップに、ヒートマップのように色をつける。広がりを表現しつつ、量も表現できる。
「サイエンスマップ」それ自体がとてもすばらしい物だが、データの表現法にも工夫があって非常に参考になる。
「植物の葉の形造りに関わる遺伝子ネットワーク」町田千代子,高橋広夫,町田泰則 各博士 化学と生物(日本農芸化学会会誌)2010年7月号 456ページ
「知識ベース FuzzyART 法」という方法を用い、遺伝子発現パターンのクラスタリングを行っている。18クラスタに分けられている。それらのクラスタから、代表となるデータ(平均?)を取り出し、一つのグラフに折れ線でプロットしている。
そうすることによって、たくさんの遺伝子のデータに由来する情報を一つの折れ線グラフでわかりやすく示せる。それぞれの遺伝子のデータは、クラスタごとに分けて、一つずつグラフにすればよいだろう。