Principal Component Analysis(主成分分析) 、略してPCAは、高次元データを最も重要な成分まで削減する手法です。 これは、データ内の最も大きな変動を反映する特徴部を見つけることで行なわれます。
ポイントクラウドの場合、これは最も重要な方向が該当するので、向きのあるボックスフィッティングによく使用されています。
主成分が決定された後、さらにサンプルをその成分に投影することができます。 これによって、最も重要な次元が最初に用意された異なる観点のデータが得られます。 その後、計算されたウェイトを使用してそれらの成分を線形結合することで、サンプルを再構築することができます。
この再構築時にいくつかの主成分のみを使用することで、これは最も重要でないノイズを除去するフィルターとして機能します。 時間軸のある入力データを与えると、これは、相関のないノイズを対象とする一種のジッター除去フィルターが形成されます。
ランダムなポーズから学習することでリニアブレンドスキニングをどのように改善することができるのかを示したサンプルについては、コンテンツライブラリからML Deformerファイルをダウンロードしてください。
パラメータ ¶
Data Type
分析に使用するソースデータ。
Point Attributes
P
ポジションアトリビュートが使用されます。
これは、連続したグループにバッチ処理されるので、すべての入力サンプルは同じ数のポイントを持ち、連結されている必要があります。
Volumes
各ボリュームがサンプルになります。 すべてのボリュームは同じ解像度で同じタプルサイズである必要があります。
Attributes
分析するPointアトリビュートをスペースで区切ったリスト。 メモリを節約するために、モードのリストには、これらのPointアトリビュートのみが出力されます。
ReconstructモードやProjectモードでは、このリストのアトリビュートが再構築や投影に使用されます。
Points per Sample
分析用の各サンプルを形成するポイント数。 これは、ポイントの合計数に均等に分割する必要があります。
Mode
PCAの計算に加えて、このノードは、投影と再構築も実行することができます。
Analyse
入力データの主成分を見つけます。
出力は、平均と指定した正規直交成分の数で構成されます。
各成分に関連した固有値もeval
アトリビュートに格納されます。
この固有値は、その成分の重要度を示しています。
component
アトリビュートにはその固有値が属する成分が格納され、0
の値は平均を意味しています。
Note
次元またはサンプルサイズが増加すると、これは非常に遅くなる可能性があります。 この計算負荷は、その次元とサンプルサイズの最小値に比例しますが、非常に急速に増加するので、 次元またはサンプルサイズを25,000未満にしたほうが良いです。
Scree Chart
Scree Chart は、追加成分がDiminishing Returns(収穫逓減)を形成する箇所を直感的に確認することができます。 これは2つのグラフを出力します。 1つ目のグラフは、各成分の相対的な寄与度を示します。 2つ目のグラフは、その時点でのすべての成分の累計を示します。 通常では、グラフ内の曲がりは、追加成分がノイズである箇所を示した信号として使用されます。 しかし、その累計を使用して、ある程度の変動がキャプチャされるようにすることもできます。
Project
これは、2番目の入力で指定された成分セット上に入力サンプルを投影します。 この2番目の入力には、通常ではAnalyseモードの他のPrincipal Component Analysis SOPの結果を接続します。
サンプルは各成分上に投影され、その成分の寄与度を示したweight
アトリビュートを持つ出力ポイントを生成します。
これらのウェイトを使ってすべての成分を線形結合すると、入力サンプルからできるだけ最良の再構築が得られます。
Reconstruct
weight
アトリビュートを持つポイントセットを与えると、2番目の入力の成分が線形結合されて出力が形成されます。
これを使用することで、既知のサンプルを再構築することができます。
完全な次元よりも少ない成分で投影されると、これは、元のサンプルセット内の最も重要でない変動が削除されるので、相関のないノイズが除去されます。
これらのウェイトは、他のソースから取得したり、スケールをかけることで面白い効果を得ることができます。
Include Mean Weights
文献には、PCAは通常では平均が既に抽出されている正規化されたデータに対して実行されるものと説明されています。 しかし、便宜上、入力の平均がAnalyseモードの出力に含まれています。 同様に、ProjectモードとReconstructモードは、平均のウェイトを最初のウェイトポイントとして含みます。 Projectモードでは、これは常に1で、Reconstructモードでも同様に1であることが多いです。
これを無効にすると、Projectモードは、その平均ウェイトを出力せず、Reconstructモードは平均ウェイトを1と想定します。 これにより、これらのウェイトを他のプロセスにエクスポートするのが簡単になります。
Skip First
Scree Chartの開始が急に低下することがよくあります。 最初のエントリーをスキップすることで、興味のある領域に狙いを定めてズームインしやすくなります。
Number of Components
抽出する成分の数。
はすべての成分を抽出するので、入力サンプルを完全に再構築することができます。
X Scale
Scree Chartの水平スケール。
Y Scale
Scree Chartの垂直スケール。
Prop Var Color
Scree Chart内の各成分の比例分散カラー。
Cum Var Color
Scree Chart内の累積分散カラー。
See also |