←Back

直線上に配置

幾何情報処理

アイコン 1. 研究背景
 
  • 膨 大なデータの中に潜む有効なパターンやルールを発掘し新しい知識を発見・学習する技術として,機械学習やパターン認識を用いるデータマイニングが盛んに研 究されている.しかし,従来のデータマイニングでは,空間ベクトルで表現され幾何的な特徴を含むデータであっても全て実数値の変数として扱うため,変数間 の関係に内在する幾何的な情報を無視してしまう傾向があった.それに対して,私が行ったこれまでの研究では,幾何的な対象のデータに含まれる空間的な特徴 を考慮してより優れた情報を抽出することを目指した.

アイコン 2. データマイニング問題
 
  • 2. 1. 気象データからの台風探知
       気象観測データは時間および空間の双方について近年ますます高解像度化が進んでおり,また,気候シミュレーション技術の発展に伴って膨大なデータが蓄積 されている.一方,日本近海では台風と呼ばれ,世界各国に被害をもたらすTropical Cyclone(以下TC)の発生や動きが,いわゆる地球温暖化に伴って顕著に変化すると指摘されている.そこで,気候変動がTCのメカニズム変化へ及ぼ す影響について理解する必要があるが,そのためには,観測およびシミュレーションによる気象データから台風の中心位置を自動的に探知する技術が必要であ る.
  • 2. 1. 空間ベクトルデータでの多クラス分類
       ある3次元図形に関してm本の3次元空間ベクトルが計測された場合,多くの従来手法では,各ベクトルの2座標を順番にm組ならべ,3m個の実数,あるい は3m次元実ベクトルとして扱っていた.ところが,これらの座標値は座標系の定義に依存するため,たとえば,学習データの計測環境と異なる環境で計測され たデータに関して著しく推論が悪くなるといった問題が生じる.これに対して従来手法でも座標系に依存しない特徴抽出が考えられるだろうが,そのような特徴 抽出が発案され採用されるか否かは偶然やモデル構築者の経験に依存する.

アイコン 3. 提案手法と結果
 
  • 3. 1. 台風自動探知
       注目点xiにおける風ベクトルwiだけではなく,注目点の風ベクトルが指している点x’i=xi+dtwiにおける風ベクトルw’iも使用する.これは x’iにおけるストリームライン曲率がxiにおける曲率を十分近似できると仮定し,その曲率を強調して次の位置への方向を決めるという意義を持つ.そのと き,この曲率を強調したストリームラインの次の位置xi+1の決め方は次の式で表される.
    GA2-1

    GA2-2
    図 1.曲率強調したストリームライン



    GA2-3
    図 2.台風抽出例

       本研究では,幾何的な対象の効果的なデータマイニング手法の開発を目指し,TC中心位置自動抽出の新しい手法を提案した.提案手法では,幾何変換によ り,緯度が異なる観測地点でのひずみを解決した.また,ストリームラインの曲率を強調することにより渦の中心を発見する手法を提案した.提案手法は,従来 手法と比べ,経験的に定められた条件に頼らない.また,すべての観測点を探索するわけではないため,高速化を実現した.さらに,近い将来に取得可能となる であろう,より高い解像度の観測データに対しても,計算量を増やさずにTCを検出可能である.2006 年に発生した台風で比較したところ,提案手法により,従来手法では自動抽出できなかった台風も抽出できた.

  • 3. 2. 幾何学習における幾何データから特徴抽出
     ◆空間ベクトル,または系列(順序付き集合)ε={p_l in R^n; l=1,...,m} からの系統的な特徴抽出を以下のように提案する.
    GA2-4

     ただし,f1は従来でよく用いられる座標特徴である.

     ◆手書き数字認識結果
    GA2-5
    図 3.手書き数字認識結果

      特徴抽出f1を用いた場合と混合エキスパートを用いた場合の,Pendigits データセットの分類成功率の平均と標準偏差を図3に示す.特徴抽出f1のみを用いた場合の分類精度はテストデータに対する回転幅εが大きくなるにつれ著し く低下したが,GAによる特徴抽出の混合エキスパートを利用した分類精度はそれほど低下しなかった.

     ◆アンケートデータから購入希望度推定結果
    GA2-6
    図 4.購入希望度推定結果

     特徴空間f1 を主成分分析(Principal Component Analysis(PCA))により可視化する結果は図4に示す.図4の(上) 購入希望度についての質問に対する回答と(下)潜在的な購入希望度を示す. 図4(下)から,f1 のみによる分析で潜在的購入希望度が高いと判定されたグループ(○印)と, 3 種類の特徴抽出による分析によってより高い確信度で潜在的購入希望度が高いと判定されたグループ(◇印)を見つけ出すことができる. 可視化結果から図の下の◇印の分布は図の上の赤い○印(一番安い価格で購入希望があるひと)の分布とほぼ同一する.したがって,提案した3つの特徴抽出により,強い潜在的高級希望度をもつグループ(f1のみで発見できない)を見つけた.


アイコン 4. 研究位置づけと今後の展望
 
  • 本 研究の目標としては,幾何的な膨大なデータを解析・モデル化・予測などの際に高精度かつ高速度で有効な数理的論理の構築としている.従来では,基礎理論お よび計算機での算術における研究が進んでいるが,データはどういう性質を持っているかを関わらず,ほとんどは実数値として扱っている.しかし,現実な問題 としてロボットビジョンや気候シミュレーションなどの問題については実数値だけではなく複素数やベクトルやスカラーなどを持つ.さらに,空間および時間の 変化を持つ幾何データが多く存在する.このようなデータを扱っている場合,実数値だけを使用する論理がどれだけ優れても推論の限界がある.ここで,本研究 では空間ベクトルや空間ベクトル間の関係を簡潔に記述できるGeometric Algebra を用いて,幾何データに対して幾何性質を持つ推論を構築する.具体的なアプリケーションとしてロボットビジョンや気候シミュレーションなどを研究対象とす ることが出来る.Geometric Algebraを通じて幾何的な性質を考慮しながら基礎論理と計算機での計算方法を今後の研究とする.
    GA2-7
    図 5.GAと応用分野

アイコン 5. 業績
 
  • 学術論文
    1. Norihiko Sugimoto, Pham Minh Tuan, Kanta Tachibana, Tomohiro Yoshikawa, and Takeshi Furuhashi, “High speed non-empirical tropical cyclone identification method in huge climatology data”, Proceedings of 1st International Summit on Hurricanes and Climate Change, Springer-Verlag, p251-263, 2008, in press.

    2. Norihiko Sugimoto, Pham Minh Tuan, Kanta Tachibana, Tomohiro Yoshikawa, and Takeshi Furuhashi, “High speed method of detecting vortex without empirical conditions - Application to risk-assessment of tropical cyclone -”, Theoretical and Applied Mechanics Japan, accepted.

    3. Minh Tuan Pham, 橘完太, Eckhard Hitzer, Sven Buchholz, 吉川大弘, 古橋武, “幾何データからのGeometric Algebra を用いた特徴抽出”, Proceedings of The Institute of Statistical Mathematics「統計数理」,Vol.56, No.2, in press.

    4. Minh Tuan Pham, Kanta Tachibana, Eckhard Hitzer, Tomohiro Yoshikawa, and Takeshi Furuhashi, “Classification and Clustering of Spatial Patterns with Geometric Algebra”, AGACSE'2008 Springer Verlag Book, accepted.
  • 国際学会    
    1. Minh Tuan Pham, Kanta Tachibana, Eckhard Hitzer, Sven  Buchholz, Tomohiro Yoshikawa, and Takeshi Furuhashi, “Feature Extractions with Geometric Algebra for Classification of Objects”,IEEE World Congress on Computational Intelligence / International Joint Conference on Neural Networks, Paper#NN1080, Hong Kong, China, June 1-6, 2008.

    2. Minh Tuan Pham, Kanta Tachibana, Eckhard Hitzer, Sven  Buchholz, Tomohiro Yoshikawa, and Takeshi Furuhashi, “Geometric Algebra Feature Extraction and Classification”,The 8th International Conference on Clifford Algebras (ICCA8), Campinus, Brazil, May, 2008.

    3. Minh Tuan Pham, Kanta Tachibana, Eckhard Hitzer, Tomohiro Yoshikawa, and Takeshi Furuhashi, “Classification and Clustering of Spatial Patterns with Geometric Algebra”, AGACSE 2008 Leipzig, Gemany, 18 August, 2008.

    4. Minh Tuan Pham, Kanta Tachibana, Tomohiro Yoshikawa, and Takeshi Furuhashi,“Feature Extraction with Geometric Algebra for Semi-Supervised Learning of Time-Series Spatial Vector”, International Workshop on Data-Mining and Statistical Science (DMSS2008).

    5. Minh Tuan Pham, Kanta Tachibana, Eckhard Hitzer, Tomohiro Yoshikawa, and Takeshi Furuhashi, “Clustering of Questionnaire Based on Features Extracted by Geometric Algebra”, SCIS&ISIS 2008, Nagoya, Japan, 17-21 September, 2008.

    6. Norihiko Sugimoto, Minh Tuan Pham, Kanta Tachibana, Ryo Mizuta, Tomohiro Yoshikawa and Takeshi Furuhashi, “High speed non-empirical cyclone detection method (abstract PDF file)”, 8th EMS Annual Meeting, 8th European Conference on Applications of Meteorology (EMS2008), Amsterdam, Netherlands, Sep 29 to Oct 3, 2008.

トップ アイコントップページへもどる

直線上に配置