北京オリンピック研究
-アスリートの好感度分析- 2:日本代表選手の評価分類(後)

活動レポート
北京オリンピック研究 -アスリートの好感度分析- 2:日本代表選手の評価分類(後)
2.4 レイヤー内クラスタリング
レイヤー分割により、関与度の”総量”が同水準の選手同士に3区分された。次に、レイヤー内の選手間で4変数の大小を比較することにより”質”的な差異の分析を行う。分析対象数の縮減も目的として、4変数の傾向が類似した選手同士をレイヤーごとに自動分類(クラスタリング)する。クラスタリング技法も諸種存在するが、本件では「自己組織化マップ」のアプリケーションソフトウェアViscovery SOMineを用いた。 当該ソフトにおけるWard法の最適化指標に基づいてクラスタ数を確定した結果、レイヤー1では22選手が12クラスタに、レイヤー2では59選手が23クラスタに、レイヤー3では128選手が38クラスタにそれぞれ分類された。レイヤー内クラスタリングにより、分析対象のオブジェクト数は、 209選手から73クラスタに縮約されたことになる。 【図2-2】は、レイヤー1における、選手分類と4変数の対応関係の可視化であり、暖色系ほど関与度が高く、寒色系ほど関与度が低いことを意味する。これと同様のクラスタリングを、レイヤー2とレイヤー3に対しても実行した。
図2-2.代表選手のクラスタリングと各変数の対応(レイヤー1の例)
2.5 レイヤー統合
データのロングテール的性質から、レイヤー分割を余儀なくされたが、最終的な目的は全体構造の把握にある。したがってレイヤーを再統合することが求められる。個別選手単位で可視化を行うと、ネットワークが密になり解釈困難に陥るが、前プロセスによって数が縮約されているため、レイヤー間の統合は比較的容易となる。

具体的手順としては、まず、各選手の持つ正規化されたA・B・C・Dの各値をクラスタ内で平均化し、その合計を100%として、各変数それぞれが占める構成比を求める。次に、一つ上位に位置するレイヤーのクラスタとの「非類似度」を【式2-1】によって求め、その値が最も小さい(構成比が類似する)クラスタと結合させる。f1iはある上位レイヤークラスタの成分iにおける比率、f2iは下位レイヤークラスタの同じ成分iにおける比率、kは成分数(この場合は4)である。

上記手順により、レイヤー1をヘッドとしたツリー図が完成する。ツリーの数はレイヤー1のクラスタ数に等しく12となるが、レイヤー1内での「非類似度」をも参照し、それらを統合して6つの評価類型として確定させた。
2.6 評価分類結果
【図2-3】が、「テレビ観戦者の4Aモデル」に基づく北京オリンピック日本代表選手の最終的な評価類型結果である。上下3段が、レイヤー1・レイヤー2・レイヤー3の別を意味し、各ブロックがクラスタを意味する。

左上の数値は一意に識別可能なクラスタ番号であるが、千の位がレイヤーを意味する以外は特別な含意はない。レイヤー間の線分に付随した値は上記「非類似度」に基づくが、類似性が高まるほどその値が高くなった方が理解が容易なため、「非類似度」と1.0との差分に100を乗算した値を表示した。

各クラスタの4つの関与度の下に表示した値は、合計すると100%になる「関与度構成比」である。なお、傾向が一目で理解できるようにその構成比が27.5%を超える場合に原色で、24.5%を超える場合に淡色で色付けを行った。それぞれ「A.認知」が青系、「B.期待」が緑系、「C.視聴」が黄系、「D.満足」が赤系である。

図2-3.日本代表選手の評価分類結果