主成分分析(Principal Component Analysis)
主成分分析の概要
主成分分析は、多次元のデータを、特徴を残したまま、より次元数の少ないデータに集約する場合に使用します。
リモートセンシング画像解析においては、4つ以上異なる波長帯の観測データを3つの画像データ(第1主成分、第2主成分、第3主成分)に集約する場合に使用します。
以下に、主成分分析についてグラフを用いて解説します。
データの特徴量を表すということは、分散が最大になるように、グラフの軸を新たに設定し、その軸に対してデータを投影することになります。
以下の散布図において、分散が最大になる軸は、赤色の軸に相当します。
この赤色の軸に投影した値が、すなわち特徴量を表すデータになります。ここで、赤色の軸に投影した値を第1主成分といいます。
次に、赤色の軸に直交する軸で、その軸に投影する値の分散が第1主成分の次に最大となる軸が、2番目の特徴量を表す軸(青色の軸)になります。ここで、青色の軸に投影した値を第2主成分といいます。
第3主成分は、第2主成分の軸に直交する軸に投影した値で、分散が第2主成分の次に大きくなるものになります。
衛星データの主成分分析では、第1主成分、第2主成分、第3主成分に、それぞれ、赤、緑、青を配色(配色の組み合わせは自由)することで、色の違いで画像の特徴を把握します。
(色はRGBの3色で表すため、多次元(4バンド以上)データを3次元データ(3つのデータ)に圧縮し、カラーで表現します。)
主成分分析画像の作成方法
Copyright (C) 2009- Aoyama All Rights Reserved.
|