機械学習を用いた台風識別器の開発と制度検証


2019年 3月

気象学研究室 金崎拓郎







1) 研究背景・目的

  現在、日本の気象庁では台風の中心位置の検出を予報官が行っている。
日本列島など陸地に台風が接近している時は、多くの地上観測結果も用いて台風中心位置を検出することができるが、
洋上では、唯一の観測手段である静止気象衛星から得られたデータのみに頼るしかない現状である。
台風の眼が発生している時は、それを台風中心位置を決定できるが、弱い台風では眼が存在しないことも少なくはない。
多くの時間は、静止気象衛星から得られた気象衛星雲画像の雲の分布や曲率などで台風中心位置を決定するが、
その場合は予報官の主観などが入り不確実性が高くなる現状にある。

  本研究では、機械学習を用いて過去の大量の衛星雲画像データと その時の気象庁ベストトラック(BT)による台風位置を学習することで、
気象衛星雲画像からより客観的に台風位置の検出をを行う台風識別器を 作成することを目的とした。



2)手法

学習データセット
気象庁ベストトラックから線形内挿して得た、 2015年7月から
2016年までの赤外画像(バンド13)、水蒸気画像(バンド8)から
切り出した台風画像56372枚をpositive画像とした。
台風非発生期間の北西太平洋の範囲からランダムに抽出した
非台風画像50000枚をnegative画像とし、
検証データとして2017年の1年間の画像を用いた。
positivenegative
図1 学習データセット

  openCVによる学習
traincascadeによりカスケード型AdaBoost識別器を作成した。

  BTと検出位置の比較
検出した台風位置とBTの位置の比較を行う。
正検出‥BT位置から600km圏内の場合。
見逃し‥BTでは台風とされているものを検出しない場合。
空振り‥台風でないものを検出した場合、
または、台風を検出していても、600km圏外の場合。
3) 結果と考察
model
図2 検出の様子
3.1) モデル評価
 図3は、本研究で作成したモデルの評価を表したものである。
水蒸気画像を学習データとしたモデルは全体的にグラフの左よりで、全てのモデルで検出率が低い事がわかった。
一方で、赤外画像を学習データとしたモデルは、パラメータによって検出率が約20 %の低い事例から、約90%の高い事例まで見られた。
最も評価が高いモデルとして、H20-S170(検出率が72.30%、適合率が25.79%)が挙げられ、
検出率が最も高いモデルは、H05-S150(検出率が91.25%、適合率が13.21%)となっていた。

model
図3 モデル評価

3.2) 中心気圧におけるの検証
図4は、正検出時の中心気圧(hPa)と見逃し時の中心気圧(hPa)の分布を示した箱ひげ図である。
左図は分布が似ている事例(T1708)、右図は似ていない事例(T1714)である。
両事例とも、正検出時の中心気圧が、見逃し時の中心気圧よりも低くなっていた。
全台風事例で、同様の結果を得られた。
以上から、勢力の強い台風ほど検出しやすく、勢力の弱い台風を検出しにくいことがわかった。
T1708T1714
図4 H20-S170における台風事例別の正検出時の中心気圧(hPa)(黒)と見逃し時の中心気圧(hPa)(白)。
左図は分布が似ている事例(T1708)、右図は似ていない事例(T1714)。

4) まとめ
勢力の強い台風の検出が容易で、勢力の弱い台風や発生期、衰弱期など
中心気圧が高い時期の検出が困難であることがわかった。

今後は画像認識の観点から気象衛星雲画像の解析と台風の特徴パターンを解析をするなどで、検出できた台風は、なぜ検出ができたのか。検出できなかった台風は、なぜ検出ができなかったのかを明らかにしていきたい。

5) 謝辞

本研究を行うにあたり、JAMSTECの松岡大祐様、NOAA Earth System Research Laboratoryの吉田龍二様から多くのご指導をいただきました。
また、本研究で用いたひまわり8号のデータは千葉大から提供していただきました。
この場を借りて厚く御礼申し上げます。




2019/03/20 金崎