北京オリンピック研究
-アスリートの好感度分析- 2:日本代表選手の評価分類(前)

活動レポート
北京オリンピック研究 -アスリートの好感度分析- 2:日本代表選手の評価分類(前)
前回は、本研究の背景となった調査・分析モデルと、それらを基に新たに考案したオリジナルモデルの概要、および調査の実施方法について説明した。第二弾となる本稿では、北京五輪の開幕直前(8/5-6)と閉幕直後(8/26-27)に実施したインターネット社会調査結果を基に、どのようにして日本代表選手を分類したのかという分析手順について説明する。回収データの解析については「柔らかい構造化モデル」(小野田2007)を利用した。
2.1 柔らかい構造化モデル
柔らかい構造化モデルは、厖大なアイテムにより構成されるロングテール(Anderson 2004)データの「見える化」(遠藤2005など)を実現するために開発された、データマイニングの方法論である。 「ロングテール」とは、あるカテゴリー内の商品を、横軸に順位、縦軸に量(認知率であったり、売上金額であったりと量の尺度は様々である)をとって降順に棒グラフ化した場合に、その形状が「長いしっぽ」のようになることからAnderson が命名したコンセプトである。従来のマーケティングでは売れ筋(ヘッド)を念頭に販売戦略が練られたが、インターネット時代のマーケティングでは、マイナー商品(テール)の価値の総和は「塵も積もれば山となる」の例えの如く、ヘッドにも匹敵するとの含意がある。 この商品マネジメントに関するリベラルな発想をアスリートに対しても向けるのであれば、五輪前にすでに有名であった選手(ヘッド)のみならず、ほとんど無名に等しかった選手(テール)をも、余すところなく分析対象とすることが肝要となる。その視点に立ち、本研究では日本代表選手339人全員を調査票に盛り込んでいる。 柔らかい構造化モデルの一般的なプロセスと、本研究独自のプロセスとの対応関係を示したものが【表2-1】である。このモデルは5つのプロセスによって構成されるが、1の「インターネット調査」の必要性と具体内容については、前稿において既述した。
表2-1.「柔らかい構造化モデル」の一般的プロセスと本研究での具体的プロセス
一般的プロセス プロセスの目的 本研究の具体的プロセス
1 インターネット調査 ・厖大な項目数の実装
・即時的なデータ回収
・代表選手339人の項目化
・五輪直前/直後の調査実施
2 データ補正 ・バイアスの補正
・ノイズの軽減
・正規化による「A.認知」「B.期待」「C.視聴」「D.満足」の尺度統一
3 レイヤー分割 ・不安定アイテムの除去
・ヘッド-テールの段階的分離
・テール選手を分析対象外に
・分析対象選手の量的3分割
4 レイヤー内
クラスタリング
・アイテム数の縮約
・レイヤー間格差の平準化
・分析対象となる209選手を質的類似性によって73クラスタに縮約
5 レイヤー統合 ・ヘッドとテールの再統合
・全体構造内の領域規定
・12のツリーの生成
・ツリーの統合による6領域の規定
2.2 データ補正
日本代表選手に対する社会的関与度の時系列変化を示す変数は「A.認知」「B.期待」「C.視聴」「D.満足」の4つであるが、これらの4変数のデータ的性質は二つに大別される。一つは、「認知されている率」「視聴された率」という、サンプル中何人が該当するかの”内部比率”を示すA.認知とC. 視聴。そしてもう一つは、カテゴリカルな選択肢で尋ね、重みをつけて和算した”合計値”を示すB.期待とD.満足である。
これら尺度の異なる2 つの集計データを同一俎上に載せるためには、”正規化”を行う必要がある。正規化には様々な手法が存在するが、柔らかい構造化モデルの次のプロセス(レイヤー分割)に円滑に進むためには、負の値が含まれないことが望ましい。したがってA・B・C・Dそれぞれの変数内で、全選手の平均値と標準偏差を基に推定した正規分布の累積確率(0%-100%の間に分布)を正規化結果として採用した。
2.3 レイヤー分割
日本代表選手全員について、A・B・C・D の各段階における正規化関与度を求め、それを合計した値(正規化合計)の降順グラフが【図2-1】である。この図は厳密なべき乗分布ではないが、裾野が広い点では”ロングテール”に類するデータと見なすことが可能である。そしてこの時点における問題点は、データの安定しない極端なテール選手が含まれている点、およびヘッドとテールとの間には無視できない絶対的な格差が存在する点の2点である。
そこで、これらの問題を解決すべくレイヤー分割を行う。正規化合計に関してもその平均値と標準偏差から推定正規分布を導き、当該分布における累積確率の理論値を基に、【表2-2】の基準でレイヤー分割の閾値を設定した。これによりレイヤー4に該当する130選手は定量的に分析対象外となり、それ以上の209選手が分析対象として規定できる。
またこの209選手も、明らかなヘッドであるレイヤー1(22選手)、ヘッド寄りのレイヤー2(59選手)、テール寄りのレイヤー3(128選手)という具合に、定量的に帰属区分が成される。

図2-1.代表選手の正規化「A.認知」「B.期待」「C.視聴」「D.満足」の合計値(降順)
※ ラベル表示は9人間隔

表2-2.レイヤー分割の閾値と帰属選手人数

References

[4] Anderson, Cris (2004), “The Long Tail”, Wired Magazine, October 2004,http://www.wired.com/wired/archive/12.10/tail.html.
[5] 遠藤功 (2005), 『見える化 -強い企業をつくる「見える」仕組み』,東洋経済新報社.
[6] 小野田哲弥 (2007), 「柔らかい構造化モデル -ロングテール事象のカテゴリーマネジメント支援-」, 政策・メディア研究科博士学位論文, 慶應義塾大学.