教員紹介:駒水 孝裕(こまみず たかひろ)

研究内容

オープンデータ化の潮流から,様々な機関がデータを公開する流れが出てきている.オープンデータの活用には,それぞれを個別に活用するだけでなく,相互に情報を補うことでより高度・精細な活用が可能となる.一方で,データを公開する機関はそれぞれ独立にデータを公開しており,その相互利用にはデータ統合時点で課題がある.また,電子化が進んだことにより,各オープンデータもまた巨大なものとなりつつあり,その中から必要な知識を取り出すことも容易でなくなってきている.そのため,必要な情報を検索する技術が求められている.さらに,大量のデータを活用するには機械的な処理が不可欠であり,データマイニングや機械学習を行うためのツールが多く作られている.その中でも「分類」は基礎的な技術であり,データを選り分ける.世の中の多くのデータは事例数がクラスごとに偏っている.この偏りが大きくなると,分類器の性能が低下することが知られている.これを不均衡データ分類問題という.対策として,データの分布を調整したり,学習モデルを改良する.このような技術は未だに求められており,不均衡データ分類問題は未だ取り組むべき課題である.これらを解決することで,オープンデータをより活用できるようになるため,これらの課題に取り組んでいる.

キーワード:データ統合,情報検索,不均衡データ分類

所属

  • 情報基盤センター

その他