授業科目名 : パターン認識と機械学習

科目コード 91220
配当学年 (計)3年 (数)4年
開講年度・開講期 平成28年度・後期
曜時限 水曜・2時限
講義室 総合研究7号館情報1
単位数 2
履修者制限
授業形態 講義
使用言語 日本語
担当教員    所属・職名・氏名 情報学研究科・教授・河原達也, 情報学研究科・准教授・Marco Cuturi

授業の概要・目的

実世界の大規模なデータから有用な情報を自動抽出し、カテゴリ分類や意思決定を行うシステムを構成する、パターン認識及び機械学習の基礎理論を講義する.人工知能,知能メディア処理,大規模データ処理との関連についても言及する.

成績評価の方法・観点及び達成度

講義中に出題するレポート及び定期試験を総合して評価する.

到達目標

パターン認識と機械学習についての基礎概念を修得し,データを中心とした計算について理解するともに,実世界に存在するような演習課題を解くことにより,使える技術として知識を定着させる.

授業計画と内容

項目 回数 内容説明
パターン認識(河原) 7 パターン認識とは:特徴ベクトルと特徴空間,プロトタイプと最近傍決定則,ベイズ則
識別関数:線形識別関数,区分的線形識別関数,二次識別関数,過学習
統計的学習:ベイズ決定,損失関数,最尤推定,正規分布,パラメトリック学習
識別学習:ノンパラメトリック学習,パーセプトロン,ニューラルネットワーク,サポートベクトルマシン
特徴抽出と分析:特徴量の正規化, KL展開,主成分分析,判別分析
機械学習(Cuturi) 7 離散データからの機械学習:決定木,Bag of Wordsモデル,N-gramモデル
距離とクラスタリング:階層的クラスタリング, 離散データ間の距離, k平均化法,EMアルゴリズム
学習アルゴリズムの検証と評価:交叉検定, 損失関数, 精度と再現率
相関ルールの学習:アプリオリ・アルゴリズム, 極大頻出集合, FP-growth(分割統治)アルゴリズム,飽和集合
様々なデータからの学習:頻出文字列の学習,木構造の扱い
学習到達度の確認(Cuturi) 1 本講義の内容に関する到達度を確認(講評)する

教科書

はじめてのパターン認識 (平井有三著,森北出版)
データマイニングの基礎(元田浩 他著,オーム社)

参考書等

わかりやすいパターン認識 (石井健一郎 他著,オーム社)
Pattern Classification (Richard O. Duda, Peter E. Hart, and David G. Stork, Wiley) ,
Learning Machines (N.J.Nilsson, Morgan Kaufmann) ,
(学習機械 (渡辺茂訳,コロナ社)) ,
The Top Ten Algorithms in Data Mining (Xindong Wu and Vipin Kumar, Chapman and Hall/CRC)

履修要件

微分積分,線形代数,確率と統計,情報符号理論,人工知能

授業外学習(予習・復習)等

授業URL

その他(オフィスアワー等)

当該年度の授業回数など諸事情に応じて,一部省略,追加,講義順序の変更などがありうる.