講座・教員データ科学講座DATA SCIENCE COURSE

データ科学講座:データサイエンス、機械学習、情報数理科学などを学ぶ

データ科学分野では、社会にあふれる膨大なデータから価値を引き出すことを目指して、データの分析や、データからの知識の抽出、必要となる数理に関する分野などへ展開します。特に、並列分散処理や制約処理の最適化等によりビッグデータ等を効率的に処理し人間にとって有用な規則や知識を抽出するデータマイニングを扱う分野、構造を有するデータの分類手法を扱う分野、数理モデル化やデータ解析技術などを扱う分野を中心に教育・研究を進めます。この分野における学習を通して、並列分散処理、データマイニング、およびそれらの数理基盤などを修得し、データの活用や、知識基盤社会で必要となる数理的手法の活用ができる人材の育成を目指します。

データ工学グループ

データを使ってコンピュータを賢くしていこう!

データは人工知能を鍛える燃料だと言われ、ビッグデータ分析は機械学習をはじめとして人工知能を支えるさまざまな技術にとって重要なものとなっています。データ工学グループでは、学術分野(社会科学、工学、気象学や地理学など)やビジネス分野で見られるさまざまなビッグデータからの知識発見、知識発見手法を支えるデータベース技術や発見した知識を社会システムに還元するための知的情報システムの構築をめざしています。

主な研究テーマ
  • 社会科学、工学、自然科学を対象としたビッグデータ分析とその応用に関する研究
  • 知識発見を支えるデータベース技術とその応用に関する研究
  • 人間の創造的な活動を支援する知的情報システムとその応用に関する研究
  • 人工知能を支えるデータ分析技術とその応用に関する研究

教員

研究テーマ

  • 動きのビッグデータ分析

    運動技能に関連するパターンを見つけよう!ということで、運動を行っているときの動きのデータからルールやパターンを見つける技術や、発見したパターンを使ったスポーツ技能習得支援に関する研究を行っています。また、人間のクセやちょっとしたしぐさを使った認証技術に関する研究を行っています。上図の右は人が空中で字を書くときの個人のちょっとした差を自動的に識別して個人認証できないか取り組んでいる研究です。

  • ソーシャルビッグデータ分析

    ソーシャルメディア上に投稿されるデータは現実世界のあらゆる情報を含み、人をセンサ、投稿される内容が観測値と考えるとこの世の中に大きな特殊な観測網が構築されているといえます。ソーシャルメディア上のデータを分析することで世の中のトレンドをいち早くつかみその内容をマーケティングに応用したり、また、観光地に関する口コミをリアルタイムに分析することや災害情報分析に活用することができます。具体的には、例えば、ソーシャルメディア上に投稿されるデータの投稿主の属性(性別や年代)を推定する研究を行っています。属性を推定することでより詳細にソーシャルメディア上のデータを分析することができます。

  • 人工知能に対するセキュリティ対策

    人工知能を支える機械学習が悪意のある様々な攻撃にさらされています。機械学習のモデルをだます技術として敵対的サンプル(Adversarial Example)があり、機械学習のモデルを簡単にだますことができるデータを作ることができます。例えば上図では、画像にちょっとした細工をほどこすことで人間は正しく認識できるデータを機械学習のモデルは正しく認識することができなくことを示しています。人工知能が実社会に浸透するなかで機械学習に対する悪意のある攻撃は安心安全な社会を築き上げる上で脅威であり、データ分析の立場からその解決法に関する研究を行っています。

  • 多分野に横断するデータ工学の世界
    データを中心とした新しい社会システムの構築に向けて下記のような他分野に渡る研究を行っています。

    (1)センサデバイスから取得される観測データ(時系列データ)を高精度に分類する。
    (2)位置情報SNSを使って人間の行動を分析し、買い物の販売促進に利用する。
    (3)ソーシャルネットワークから社会的な話題の伝搬と新しいトレンドを探る。
    (4)観光地に関するツイートから観光地の課題と新たな魅力の再発見をする。
    (5)体や手の動きを使った新しいコミュケーションのしくみを作る。
    (6)局所的な気象データを用いた熱中症対策や防災支援やマーケティングを考える。
    (7)ユーザの趣向やつながりのデータを利用してお勧めの映画、場所、商品を推薦する。
    (8)データベースから目的とするデータを高速の取り出すための最適な索引構造を構築する。
    (9)検索、クラスタリング、データ分類などのデータベース基盤技術の高速化を行う。

場所および連絡先

データに基づく課題解決などデータはこれからの社会を支える重要な資源のひとつとなってきます。データ工学研究室では、(1)データ分析とデータに基づく人工知能技術、(2)データに基づく社会問題の解決、(3)大学院修士課程進学や博士号取得を射程内にいれている人、を歓迎します。また、このページ取り上げている研究テーマ以外で取り組みたい研究テーマがあれば、各教員にメールにて問い合せるか、あるいは、研究室まで直接来室して、その研究テーマの提案をしてみてください。

研究室
情報科学部棟6階(620室、623室、624室)

知能数理グループ

数学の世界を探求しよう

因子分析法の数理的基礎に関する数理統計学、数理システムと空間配置の幾何学、暗号理論や符号理論への応用も視野に入れた代数多様体論などの情報科学の関連する数学の諸分野を研究しています。

また、当グループでは高校教員を目指す学生も支援しています。高校の数学教科書、学習指導要領、教育六法などの関連図書、「教職課程」や「教員養成セミナー」などの雑誌は臨時増刊を含めて所蔵しています。教員試験に合格した先輩の話を聞く機会も設けます。教員採用試験のための自主的な勉強会も開かれています。

教員

研究テーマ

  • 組合せゲーム理論の数理
    組合せゲーム理論は2人のプレイヤーが交互に「手」をプレイして勝敗を決めるタイプのゲームを数学的に解析する理論として、近年急速に発展している分野です。
    様々なゲームに対して理論を適用し、ルールの違いが勝敗にどのような影響を及ぼすかを研究します。
  • 有限群論の応用
    有限群論は代数学の基礎をなす一分野です。これを応用し、ルービックキューブなどのパズルの構造を数学的に考察します。
  • 代数幾何学とその符号理論・暗号理論への応用
    純粋数学の一分野であった代数幾何学は、近年になって符号理論や暗号理論に応用できることが分かり、新たな発展の機運を見せています。符号理論は、離れた場所にいかに効率よく正確に情報を伝達するかが重要なテーマですが、代数幾何学の研究対象である代数曲線や代数曲面の構造を利用することで、良質の符号を構成できることがあります。また、インターネットが社会に浸透した現代において暗号理論の重要性は増す一方ですが、代数曲線の代数的な構造から作られた楕円曲線暗号は、実用性の高い優れた暗号として商取引などで使われています。代数幾何学の基礎的事項を踏まえ、こうした符号・暗号への応用を探究します。
  • 数理生物学
    生物の個体群サイズの推移や空間分布の状況を表す決定論的数理モデル (微分方程式系あるいは差分方程式系)を数学の理論とコンピュータによるシミュレーションを用いて解析します。
  • 結び目理論
    三次元空間内にある結び目(閉じた空間曲線)を区別するさまざまな量について学びます、ひもを切ったりせずに連続的に変形したときに不変なままである量が無数に多くあることを理解し、そのうちのいくつかの計算手順をコンピュータに実装して強度を比較します。
  • 因子分析による環境や医療に関するデータ解析
    例えば、人間の性格を分類したいとき、「文科系」や「理科系」そのものは観測できませんが、国語、数学、理科、社会、英語などの学力試験の結果から、“文科系の因子”や“理科系の因子”を見つけられれば面白いでしょう。また、大気汚染の原因となる発生源は、自動車の排気ガス、工場のばい煙、撒いた肥料が風でまいあがったことによるものなどいろいろ考えられるでしょうが、ある地点における大気汚染の観測データからそれぞれの発生源がどれ位の割合で影響しているかがわかれば規制を効果的にすることができます。

場所および連絡先

数学に関心がある人、数学と情報科学の境界分野に関心がある人、高校の数学教員を目指す人を歓迎します。

研究室
情報科学部棟5階、8階(520室、521室、833室、524室)

機械学習グループ

コンピュータで隠れた情報を見つけよう

機械学習とは、人間が自然に行っている学習能力と同様の機能をコンピュータで実現させるための技術・手法のことです。機械学習グループでは、Webデータ、文書、マルチメディアコンテンツ、地図などのグラフ構造化データを対象にした機械学習手法について研究を行っています。さらにその手法をグラフ構造化データに共通する構造的特徴を発見するデータマイニングへ応用する研究を行っています。

教員

研究テーマ

  • グラフ構造化データに対する機械学習手法とデータマイニングへの応用
    近年、ICT 技術の発展に伴い、Web文書の構文、ソーシャル・ネットワーク、タンパク質相互作用ネットワークといったグラフ構造を有する大規模グラフ構造データに対する省メモリ・高速データマイニング手法に関する研究が盛んに行われています。1回のデータ走査でグラフ構造データの解析を行うことは難しく、何度もデータ走査を繰り返す必要があり、一般に解析にかかる計算コストが大きくなります。そのため、走査時間を削減し、かつデータマイニングに要する計算時間を短縮する手法の開発が急務となっています。グラフ構造データを可逆圧縮してデータのサイズを小さくし、かつ解凍することなく圧縮されたグラフ構造化データ(グラフ構造圧縮データ)から知識を獲得する高速データマイニング手法の開発を行っています。
  • 構造的データに潜む知識を効果的に発見するためのデータマイニングと機械学習

    蓄積された膨大なデータから、ユーザや専門家が必要な情報を取り出して、取り出した情報を知識として統合するシステムの研究開発が求められています。非均質で構造化された大規模なデータに潜む多様な知識の発見に焦点を当てて、必要とされる構造的知識を発見するためのデータマイニングと機械学習における新しい基盤技術を開発することを研究目的としています。 Webページ、糖鎖データ(分子生物学データ)、エージェントの行動履歴などの構造的データからの知識発見を目指します。

  • 推論を用いた信頼できる知識グラフ作成

    知識グラフはエンティティ(人・物・事柄・概念)を頂点、エンティティ間の関係性を辺としてグラフで表現した知識の表現形式で、情報検索や自然言語処理の分野で利用されています。また、人工知能と人間の双方が理解できる知識の表現形式として注目されています。本研究では、文書などのグラフ構造データからエンティティとその関係性を抽出し知識グラフを作成する手法の開発を行っています。さらに推論システムを用いて、文書から得られる事実だけでなく、事実から推論される知識を含む有益な知識グラフの作成や、信頼できる知識グラフの作成を行います。

  • 失語症者のための言語聴覚訓練用アプリの開発

    脳卒中や頭部の外傷などで脳が損傷を受けることで起こる高次脳機能障害の一つに失語症があります。医療分野のデジタル化を通して施術を行う言語聴覚士の負担を軽減し、失語症者の社会復帰を支援する、リハビリテーションプラン作成機能と問題解答トレーニング機能を有した言語聴覚訓練支援システム(右図参照)を開発しています。

  • プログラミング的思考育成支援システムの開発

    現代社会において最も重要な能力の一つであるプログラミング的思考のうち、読解力、構成力、表現力の育成を支援するシステムを開発しています。このシステムでは、プログラミング的思考の構成要素ごとに分解された、数学の証明問題や平面図形問題を解く過程やグラフ理論を用いて問題の本質を見出す過程、さらに効率的な解法を試行錯誤しながら見出すことでプログラミング的思考を育成支援します。中学・高校・大学で教材として使用できるようにタブレット上で稼働するアプリケーションとして実装しています。

場所および連絡先

授業では難しい話をしていましたが、研究では楽しいことをしています。

研究室
情報科学部棟別館5階