概要
本講座は、Deep Learningを用いた強化学習に特化した全6回の講義です。東京大学でDeep Learning基礎講座を公開してきた松尾研究室が、深層学習の基礎を習得済みの学生を対象として開講するものです。
深層学習を用いた強化学習の研究・社会実装のスタートラインに立てるレベルの知識・実装力の習得を目指します。離散制御や連続値制御、モデルベース学習などの強化学習の基礎的なアルゴリズムから、sim2real、模倣学習、Control as Inference、世界モデルまで、深層強化学習の種々のトピックをカバーします。講義のみでなく、実践的な演習を通して、効率的に強化学習について手を動かしながら技術を深く理解します。
深層学習を用いた強化学習の研究・社会実装のスタートラインに立てるレベルの知識・実装力の習得を目指します。離散制御や連続値制御、モデルベース学習などの強化学習の基礎的なアルゴリズムから、sim2real、模倣学習、Control as Inference、世界モデルまで、深層強化学習の種々のトピックをカバーします。講義のみでなく、実践的な演習を通して、効率的に強化学習について手を動かしながら技術を深く理解します。
●学んだ技術の適用想定分野
ロボット制御,システム制御の自動化,ゲームAI,マルチエージェントシステム,バイオインフォマティクス,分子設計,広告最適化,物理シミュレーション,交通工学, 金融
なお、本セミナーは完全オンラインで実施いたします。

ブラウザのみ必要
必要なものはWebブラウザのみです。講義ではGoogle colabを利用し、演習を行います。

演習中心で効率良く短期習得
本プログラムの最大の特徴の一つは、全てのトピックについて,演習を中心に構成されている点です。実際に手を動かしながら理解を進めることで、効率よく学習することができます。

モデルの学習
Deep Learning技術では、モデルが学習する様子を観測しながらパラメータを調整することで、アプリケーションに応じたパフォーマンスの最大化を図ることが非常に重要です。この一連の流れを全ての演習で経験することで、重要な要素を身につけられます。

松尾研究室がコンテンツ作成
実践型のデータサイエンティスト育成講座およびDeep Learning講座を6年以上公開運営し、のべ6,000人以上の人材を育成してきた東京大学松尾研究室がコンテンツを監修・開発しました。
各講座
第1回強化学習基礎・離散制御・ゲームAI
(担当講師:今井)
①基本的な強化学習アルゴリズムの復習〜深層強化学習の導入(価値に基づく手法・方策勾配法・DQN)
②主要ベンチマークの強化学習アルゴリズムと発展
③ゲームAI・他分野への強化学習応用
第2回連続値制御
(担当講師:北村)
① 連続値制御強化学習アルゴリズム
第3回モデルベース強化学習と世界モデル
(担当講師:松嶋)
① ロボット学習
② モデルに基づく制御
③ モデルベース強化学習
④ 強化学習の観点からみた世界モデル
第4回Control as Inference
(担当講師:谷口)
① Control as Inference
第5回オフラインデータを利用する手法
(担当講師:古田)
① 模倣学習
② オフライン強化学習
第6回応用を見据えた近年の発展的話題
(担当講師:小林・Sony AI 河本様)
①基盤モデルとロボティクス
② (特別講義)レーシングシミュレーションゲーム「グランツーリスモ」における連続値強化学習の応用
企画
監修・講師・教材作成

松嶋 達也
東京大学 大学院工学系研究科
技術経営戦略学専攻
技術経営戦略学専攻

今井 翔太
東京大学 大学院工学系研究科
技術経営戦略学専攻
技術経営戦略学専攻

北村 俊徳
東京大学大学院 工学系研究科
技術経営戦略学専攻
技術経営戦略学専攻

谷口 尚平
東京大学 大学院工学系研究科
技術経営戦略学専攻
技術経営戦略学専攻

古田 拓毅
東京大学 大学院工学系研究科
技術経営戦略学専攻
技術経営戦略学専攻

講師(ゲストスピーカー)

河本 献太
Sony AI
TA

髙城 頌太
東京大学大学院 工学系研究科
松尾研究室
松尾研究室

佐藤 誠人
奈良先端科学技術大学院大学
先端科学技術研究科
先端科学技術研究科

中野 聡大
東京大学大学院 工学系研究科
松尾研究室
松尾研究室

高波 亮介
東京大学大学院 工学系研究科
技術経営戦略学専攻
技術経営戦略学専攻
運営

大牧 信介
東京大学 松尾研究室職員
河合 真里
東京大学 松尾研究室職員

熊田 洋子
東京大学 松尾研究室職員
日程
募集開始 | 2023/1/23(月) |
---|---|
募集締切 | 2023/2/2(木)AM10:00 |
選考結果 | 2023/2/9(木)19:00までに、結果を応募者全員にメールで連絡します。 |
第1回(講師:今井) | 2023/2/13(月)14:00〜16:00 |
---|---|
第2回(講師:北村) | 2023/2/17(金)14:00〜16:00 |
第3回(講師:松嶋) | 2023/2/20(月)14:00〜16:00 |
第4回(講師:谷口) | 2023/2/24(金)14:00〜16:00 |
第5回(講師:古田) | 2023/2/27(月)14:00〜16:00 |
第6回(講師:小林・Sony AI 河本様) | 2023/3/3(金)14:00〜16:00 |
最終課題〆切 | 2023/3月中旬〜下旬(予定) |
最終課題発表会 | 2023/3月末予定・開催形式未定 |
募集要項
- 本セミナーは,ライブ配信される講義映像を,各人が自宅等で視聴・演習していただく形式です.
- 各講義日の14:00〜16:00にライブ配信します.ライブ配信では、リアルタイムに質問を受け付けます.
- ライブ配信への参加方法など詳細については,受講が決定された方にご連絡いたします.
- 対象:学生(大学院,大学,高専,専門学校生,高校,中学など)
(本講座は公開講座であり,大学から単位は出ません) - 受講料は無料です.
参加条件
- 深層学習/Deep Learningの基礎知識を備え,基礎的な実装が自身でできること
- 毎回の講義を確実に視聴できること
- 課題に取り組む時間を十分に作れること
- 応募フォーム内にある質問に回答できる方
留意事項・お知らせ
- 本セミナーには最終課題があります.各講義と最終課題の提出物を提出し基準以上の評価を得ることで修了となります.最終課題に取り組む時間を十分に用意してください.
- 最終課題の問題は「講義(と演習)で扱った内容を発展させたプロジェクトを計画・実験し,結果とともに報告してください」を予定しています.
- 本セミナーでは,「Google Classroom」を用いた運営を行います.受講者のGmailにクラスの招待を行いますので,申し込みの前に有効なGmailアカウント(@gmail.comで終わるメールアドレス)をご用意ください.
よくある質問、お問い合わせはこちら