データ解析ソフトを利用して感じた分析化学における多角度からの解析の重要性 | ICP-OESラボのあれこれ | 無機分析ラボの日々のあれこれ - PerkinElmer Japan

データ解析ソフトを利用して感じた分析化学における多角度からの解析の重要性
~ブログのアクセス解析を例に~

(※本ページ内画像をクリックすると拡大表示されます)

 今回はICPに限らず分析化学全般において大事だと思われるデータ解析について書いてみたいと思います。
ICPなどを利用していると出てくるのは定量値(数値)です。その他には日時とかロット違いとかいろいろそれに附属してくる情報はあると思います。それぞれの情報はその定量値に紐づいているものの、私達はそれを値としてしか見られず、全体像をイメージするのはなかなか難しいのが実情です。それを図や絵に表現できると、途端に理解が深まります。

 そこでこのブログのアクセス数を使ってデータ解析ソフトSpotfireで解析してみました。
JASIS新技術説明会でもデータ解析に関するテーマを3つ準備しています。事前受付始まりました。

使ったのは「記事名」「公開月」「各月の各記事のアクセス数」の3つだけです。このたった3つだけでいろいろなことが理解できたら、実際の分析業務において得られる情報ってかなりあるだろうなと想像されます。元データは単なるエクセルの表です。Spotfire初心者の私ですが、データからどんな新たな発見ができるか、といった企画(Spotfireチームにも手伝ってもらいました)。データでどうこう言おうというものではなく、単なる興味で試していますのでご了承いただければと思います。

こんな感じのエクセルデータを使います。

 

まずは、

1. 棒グラフ

 各記事ごとに1年間のアクセス数を棒グラフで表しました。色分けは月ごとのアクセス数を示しています。

もっとも読まれているトップ3の記事がすぐ分かります。トップ1の記事「降温と昇温の違いは?その2」を見てみると、12ヵ月とも毎月よく読まれていることが色分けで分かります。

 

 

2. 円グラフと折れ線グラフ

 しかし1月だけのアクセス数の割合を円グラフで見てみると、全体のたった4%分程度のアクセス数でしかありませんでした。1月のアクセス数の15.7%は「ガスクロマトグラフと液体クロマトグラフの違いは?」という記事でした。
それらを年間の月ごとの推移を折れ線グラフで表現してみると、ガスクロマトグラフの記事は1月に公開し、かなりのアクセス数になりましたが、その後は低調路線、一方、降温と昇温の記事は、徐々にアクセス数を上げていく人気記事に成長していっていることが判明しました。

 同様に公開初日にアクセス数を伸ばすタイプと、横ばいまたは順調に伸びていくタイプの記事があることに気づけます。これは興味深い発見でした。

 

3. ヒートマップ

 どの記事とどの記事が良く読まれているかをヒートマップという手法で色を使ったグループ分けをしてみると、赤い色をアクセス数の多い記事、青いほど少ない、という風に色のグラデーションでアクセス数を表現し、平面の図上に2 次元情報を載せています。
先に載せた棒グラフだけを見ていると、トップ3が良く読まれていると思っていましたが、5月に公開した記事も順調にアクセス数を増やしており、総合アクセス数だけではすぐに判別できなかった記事の存在「ナトリウムとカリウムをICP発光で定量できていますか?」という人気記事が見つかりました。

 

さらに年間ランキングと月間ランキングを並べてみると、、、

4. グラフと折れ線グラフ

年間ランキング中盤に位置するアクセス数であった記事「あなたの調製した1%硝酸は何%硝酸?」という記事が、月間ランキングでは1位であったことが判明します。
さらに、月間アクセス数を全体と各記事ごとで比較してみると1月6月11月付近にピークが見られ、それぞれに人気記事の初回公開があったことが分かります。

 

ここまでで月間アクセス数が人気記事に支えられているものかと予想しましたが、

 

記事が公開された月を表にオレンジに色分けし、その時の記事数を縦棒グラフで表現してみると、記事の公開数とアクセス数には相関性が見られ、10月11月のアクセス数の多さは、人気記事が公開されただけではなく、公開記事の数自体が多かったということが判明しました。つまり全体のアクセス数を伸ばすには記事をたくさん書く必要がありそう(たいへん!)ということでしょうか。人気ユーチューバ―が毎日のようにアップするのはこのためでしょうか。

 

 WEBのアクセス解析などやったことのない私でしたが、このように、たった3つの情報「記事名」「公開月」「各月の各記事のアクセス数」だけであったものが、数字の羅列表では意味が分からなかったことも、ビジュアル的にすることで分かること、分かりやすくなることがあるということを体感することができました。しかも単純な棒グラフや色分けを効果的に使うだけで理解がラクになります。限られたデータでも、データを可視化し多角度から評価することでデータマネージメントの重要性を感じます。ただ、実際には適切なデータ量がないと正しい分析が得られなかったりもしますので、注意が必要です。データの整合性を取っていくことも大事です。
分析化学で得られる情報も、数字の羅列ではちょっとした表層しか私達の脳は感じていないかもしれません。ぜひビジュアライゼーションをすることで理解を深めてみませんか。

今回利用したSpotfireはパーキンエルマーから提供しています。今回は単なる図解するだけの利用でしたが、統計解析、多変量解析など幅広く利用でき、簡単に使えるデータ解析で迅速に新たな知見やトレンドを探索することができます。しかも膨大なデータの活用することが簡単にできます。WEBアクセス数もデータを更新すると、この作った図が自動的に連動反映させながら表示し、日々管理していくなんて使い方も可能です。
ぜひお問い合わせください。今後、データ解析に関するノウハウを開示していきたいと考えています。

 

1つのモニターに、各図が連動した状態でビジュアライゼーションすることもできます。

 

JASIS新技術説明会でもデータ解析に関するテーマを3つ準備しています。事前受付始まりました。

 

 

Prev
検量線の範囲や測定点数に決まりはあるのか?

Next
定性分析をどうやるか