画像認識 スプリングセミナー

概要

本講座「画像認識」は、深層学習を用いた画像認識に特化した全5回の講義です。東京大学でDeep Learning基礎講座を公開してきた松尾研究室が、深層学習の基礎を習得済みの学生を対象として開講するものです。
本講座では、深層学習を用いた画像認識の諸分野の研究・社会実装のスタートラインに立てるレベルの知識・実装力の習得を目指します。画像認識の基本的な歴史から始まり、物体検出、セマンティックセグメンテーション、姿勢推定、顔認証、異常検知、説明可能性など、画像認識に関するさまざまな応用トピックをカバーします。
また講義のみでなく、実践的な演習を通して、画像認識の種々の応用について手を動かしながら技術を深く理解します。

 

本講義は完全オンラインで実施いたします。

【重要】

受講可否メール等が迷惑メールフォルダに入ってしまう事例が多数発生しています。
下記2点をご対応いただいていない場合、「メールが届かない」とのお問い合わせは対応いたしかねます。

  1. @weblab.t.u-tokyo.ac.jpからのメールが「迷惑メールフォルダ」に入らないように、必ず設定をお願いします。
  2. 結果通知の日時を過ぎてもメールが届かない場合は、まず「迷惑メールフォルダ」の確認を必ずお願いします。

上記を確認されても見当たらない場合は、お問い合わせフォームからご連絡ください。

ブラウザのみ必要

必要なものはZoomのインストールとWebブラウザのみです。

演習中心で効率良く短期習得

本プログラムの最大の特徴の一つは、多くのトピックについて,演習が用意されている点です。実際に手を動かすことで理解を深めることができます。

モデルの学習

Deep Learning技術では、モデルが学習する様子を観測しながらパラメータを調整することで、アプリケーションに応じたパフォーマンスの最大化を図ることが非常に重要です。この一連の流れを全ての演習で経験することで、重要な要素を身につけられます。

松尾研究室がコンテンツ作成

実践型のデータサイエンティスト育成講座およびDeep Learning講座を6年以上公開運営し、のべ6,000人以上の人材を育成してきた東京大学松尾研究室がコンテンツを監修・開発しました。

コンテンツ

第1回画像認識概要
(担当:大熊)

画像認識の歴史、
CNN、
NAS、
ファインチューニング

第2-1回物体検出
(担当:土居)

Object detectionの概要、
sliding window、
two-stage detection、
one-stage detection、
anchor free detection

第2-2回セグメンテーション
(担当:土居)

Segmentationの概要、Semantic Segmentation、Instance Segmentation

第3-1回姿勢推定
(担当:大熊)

姿勢推定の概要、
2D HPE、
3D HPE

第3-2回顔認識
(担当:吉田)

顔認識の概要、
深層距離学習に基づく顔認識、
深層距離学習の応用

第4-1回 異常検知
(担当:北田)

異常検知の概要、
Probabilistic Model、
Reconstruction Model、
異常検知の評価指標

第4-2回 説明可能性
(担当:福地)

説明可能性の必要性と理由、
CAM、
LIME、
SHAP、
説明可能性の評価手法

第5-1回 動画認識
(担当:吉田)

第5-2回機械学習プロジェクトのポイント
(担当:岡田)

データ、モデリング、デプロイ、エンジニアリング

※ 授業コンテンツに関しては、変更する可能性がございます。ご了承下さい。

企画

監修

岩澤 有祐

東京大学大学院 工学系研究科 松尾研究室

大熊 拓海

東京大学大学院 情報理工系研究科
株式会社Bluezone

講師・教材作成

大熊 拓海

東京大学大学院 情報理工系研究科
株式会社Bluezone

土居 健人

東京大学 工学系研究科

吉田 凌太朗

東北大学大学院 情報科学研究科

岡田 領

東京大学 学術支援専門職員

北田 敦也

東京大学 工学部

福地 清康

東京大学 医学部

嶋田 朱里

東京大学 学際情報学府

中筋 渉太

東京大学 工学部

運営

内田 暁

東京大学 松尾研究室職員

河合 真里

東京大学 松尾研究室職員

津島 緑

東京大学 松尾研究室職員

日程

募集開始 2022/2/8(火)
募集締切 2022/2/21(月)AM10:00
選考結果 2022/2/28(月)
※18時までに応募者全員に結果をお送りします。

第1回(担当講師:大熊) 2022/3/3(木)14:00 ~ 16:00
第2回(担当講師:土居) 2022/3/10(木)14:00 ~ 16:00
第3回(担当講師:大熊・吉田) 2022/3/17(木)14:00 ~ 16:00
第4回(担当講師:北田・福地) 2022/3/24(木)14:00 ~ 16:00
第5回(担当講師:吉田・岡田) 2022/3/31(木)14:00 ~ 16:00

募集要項

本セミナーは、配信される講義映像を、各人が自宅等で視聴・演習していただく形式です

  • 各講義日の14:00〜16:00にライブ配信します。ライブ配信では、リアルタイムに質問を受け付けます
  • アーカイブ動画を視聴しての受講も可能です
    (修了するには、期限内に出席登録をする必要があります)
  • ライブ配信への参加方法などの詳細については、受講が決定した方にご連絡いたします
  • 対象:学生(大学院、大学、高専、専門学校、高校、中学など)
  • 本講座は公開講座であり、大学から単位は出ません
  • 受講料はかかりません
  • Google Colab(無料版)では、本講座で扱う多くの演習課題の実行ができない可能性があります。
    そのため有料版のColab Pro 等、各自でGPUの演習環境をご用意いただく必要があります。
    既にGPUを利用できる環境にある場合、下記のリンク先のファイルをダウンロードし、動作確認してください。
    Colab Proを推奨しますが、それ以外のサービスでも構いません。ただし、研究室から動作確認等のサポートはいたしておりません。
  • [参考]
    この演習ファイルを十分に実行できる環境をご準備ください。
    https://drive.google.com/drive/folders/1yd4zbqEqVdRbop1SJL3zgwXsODu5JmiQ?usp=sharing

 

前提条件

  • 深層学習/Deep Learningの基礎知識を備え、基礎的な実装が自身でできること
  • 大学の理系学部レベルの線形代数、微分積分、確率論・統計学に関する知識を有すること
  • Pythonでの数値解析の経験を有すること
  • 毎回の講義を確実に視聴できること
  • 最低でも毎週3時間程度の自習時間が確保できること
  • 演習環境をご自身で用意できること

 

よくある質問、お問い合わせはこちら

【重要】

受講可否メール等が迷惑メールフォルダに入ってしまう事例が多数発生しています。
下記2点をご対応いただいていない場合、「メールが届かない」とのお問い合わせは対応いたしかねます。

  1. @weblab.t.u-tokyo.ac.jpからのメールが「迷惑メールフォルダ」に入らないように必ず設定をお願いします。
  2. 結果通知の日時を過ぎてもメールが届かない場合は、まず「迷惑メールフォルダ」の確認をお願いします。

上記を確認されても見当たらない場合は、お問い合わせフォームからご連絡ください。

図版出典
1: Huang, Gao, et al. “Densely connected convolutional networks.” Proceedings of the IEEE conference on computer vision and pattern recognition. 2017.
2-1:CC0の画像を使用(リンク:https://pixabay.com/images/id-962215/)
2-2:https://www.kaggle.com/c/cvpr-2018-autonomous-driving
3-1: Cao, Zhe, et al. “OpenPose: realtime multi-person 2D pose estimation using Part Affinity Fields.” IEEE transactions on pattern analysis and machine intelligence 43.1 (2019): 172-186.
3-2:J. Deng et al., ” Arcface: Additive angular margin loss for deep face recognition,” Proc. IEEE Conf. Computer Vision and Pattern Recognition, pp. 4690–4699, June
4-1: Ruff, Lukas, et al. “A unifying review of deep and shallow anomaly detection.” Proceedings of the IEEE (2021).
4-2: Chowdhury, Nihad K., Md Muhtadir Rahman, and Muhammad Ashad Kabir. “PDCOVIDNet: a parallel-dilated convolutional neural network architecture for
detecting COVID-19 from chest X-ray images.” Health information science and systems 8.1 (2020): 1-14.
5-1: K. Simonyan and A. Zisserman, “Two-stream convolutional networks for action recognition in videos,” Advances in neural information processing systems, 2014.

Other Course