信号解析 第4回講義録

 

日時:2006年5月1日

講義内容:確率分布と統計モデル

担当者:情報知能工学科 小島史男

 

1. はじめに

 

 先週は時系列信号の周波数における取り扱いについて学習しました。時系列信号の自己共分散関数の離散時間フーリエ変換(DTFT)をスペクトル、そして有限個のデータから求める標本自己共分散関数の離散フーリエ変換(DFT)をペリオドグラムと呼ぶことを覚えていますか。FFTの使い方などペリオドグラムの計算法についてもふれましたが、この計算はこれからたびたび使いますのでそのときにもまた復習しましょう。ところで、先週の宿題ですが、正規性(ガウス型)白色雑音について計算してもらいました。受講生のみなさんはそのプログラムを確認しましたでしょうか。簡単なアルゴリズムですが、生成された乱数がなぜこれで正規性(ガウス型)になるのでしょうか。今回の学習では、統計処理の基本となる乱数の生成法から確率分布とその統計モデルについて学習していきます。本日の学習は参考図書4章および16章の内容が含まれます。

 

2. 確率分布と確率密度関数

 

 それでは、最初に第2回に学習した分布関数と確率密度関数について復習していきましょう。で値をとる確率変数である確率は、確率密度関数をもちいて

で与えられることをすでに学びました。ただしは以下の性質をもつ単調増加関数です。

すなわち確率変数を特徴づけるのは確率密度関数ということになります。こののことを真のモデル(true model)と呼びます。われわれの環境で取得されるデータはこの密度関数によって与えられる確率にもとづいて生成されると考えるのです。われわれが実際に手にすることができるのはその確率によって生成された確率変数です。したがってこのを実現値(realization)と呼びます。受講者のみなさんは統計学でガウス型は必ず学習しますが、平均値分散ガウス型(normal distribution)確率変数とは、その確率密度関数

で与えられる確率分布にしたがう確率変数のことです。特にに従う規格化されたガウス型のことを標準正規型と呼びます。このほかにも統計学上いくつもの統計学上有用な確率分布がありますが、これらを紹介する前にまずガウス型確率変数による乱数生成のメカニズムについて説明しましょう。

 

3. 確率密度関数に従う実現値の計算

 

 乱数生成のメカニズムにはいくつかの方法がありますが、ここでは逆関数により解く計算法について説明しましょう。まず一様分布について説明します。いま確率変数がで一様に分布しているとは、その確率密度関数

 

で生成される確率変数のことです。この分布に従う乱数のことを一様乱数(uniform random number)といい、その生成についてはいろいろな教科書で調べることができます。またほとんどすべてのプログラム言語には一様乱数生成に関する組み込み関数が整備されているので、ここでは議論しません。ところで上式において、と設定すれば一様乱数で確率を求めることができます。つまり一様分布に従う実現値を確率密度関数の確率と考えれば

からその逆関数を計算することにより、確率密度関数に従う確率変数の実現値が生成できるはずです。以下では前回宿題にした正規性白色雑音の生成のアルゴリズムを例にあげて説明していきましょう。

 

4. 正規性白色雑音の生成メカニズム

 

 正規分布に従う乱数列すなわち正規乱数を前節の方法で求めることを考えます。いまで値をとる2つの独立な一様乱数が与えられたとして、これから標準正規性分布に従う乱数をつくることを考えましょう。この2次元の確率分布

となります。ここでを定義域にもつ2変数を極座標に変換します。このとき分布関数は以下のように計算することができます。

とすると、距離の実現値については

となるガウス分布に、また位相の実現値については

に従う一様分布をもつ確率分布になります。に関する逆関数は明らかに

となりますので、この逆関数を利用すれば一様乱数から独立な正規性白色雑音を以下の手順で生成することができます。

Step 1: 区間上での独立な一様乱数を生成する。

Step 2: と変換する。ここで上の一様乱数ならもまた上の一様乱数であることに注意しましょう。

Step 3: 得られた実現値を下記のように、もとの直交座標に変換すれば独立な2個の正規性乱数を得る。

このアルゴリズムはBox-Muller法と呼ばれ、正規性白色雑音を擬似的に生成する方法として広く用いられています。なお先週みなさんにお渡ししたプログラムでは、高速化のために改良されたMarsagliaの提案した方法を用いています。詳細は参考図書226頁をみてください。

5. 各種統計モデル

 

前節の方法で正規性白色雑音の生成法について学習しましたが、もちろんガウス型以外の統計モデルも多数存在します。ここではよく使われるいくつかの統計モデルを紹介することにします。

(1) コーシー分布(Cauchy distribution)

(2) ピアソン分布(Peason family of distributions)

のとき(1)のコーシー分布と一致します。また(ただしは正の整数)のときは自由度分布(t-distribution)と呼ばれます。ここではガンマ関数と呼ばれる特殊関数です。

(3) 指数分布(exponential distribution)

(4) 分布(chi-square distribution)

自由度のとき指数分布となります。

(5) 2重指数分布(double exponential distribution)

 

6. 時系列の統計分布

 

 時系列信号が与えられたときの分布はそれぞれの時間での履歴が同時に起こる確率を求めることになりますので、統計モデルはN次元の統計モデルを扱うことになりますので問題を複雑にしてしまいます。これを避ける方法としては本日学習した正規性白色雑音を基本要素に各種時系列モデルを考えた方が問題を簡単化できます。次回以降ではモデリングに関する評価法等について説明していきます。

本日の宿題:本日学習した6種類の統計モデルの確率密度関数のグラフをEXCELで求め、その特徴について簡単にまとめてください。添付した例題を参考にしてください。今回はVBAのプログラムは使用していません。