概要
深層学習を用いた強化学習の研究・社会実装のスタートラインに立てるレベルの知識・実装力の習得を目指します。離散制御や連続値制御、モデルベース学習などの強化学習の基礎的なアルゴリズムから、sim2real、模倣学習、Control as Inference、世界モデルまで、深層強化学習の種々のトピックをカバーします。講義のみでなく、実践的な演習を通して、効率的に強化学習について手を動かしながら技術を深く理解します。
ロボット制御,システム制御の自動化,ゲームAI,マルチエージェントシステム,バイオインフォマティクス,分子設計,広告最適化,物理シミュレーション,交通工学, 金融
(2月15日)
受講の可否についてのメールをお送り済です。
お手元に届いていない方は、まず「迷惑メールフォルダ」をご確認ください。
上記を確認されても見当たらない場合は、お問い合わせフォームからご連絡ください。
ブラウザのみ必要
必要なものはWebブラウザのみです。ブラウザを通じてGPUを利用したPythonプログラミングが可能な開発環境「Omnicampus」が提供されます。講義ではGoogle colabと併用し、演習を進めていきます。
構築済み環境
必要な全てのDeep Learning・機械学習ライブラリがインストールされ、構築済みの環境が配布されますので、すぐに学習を開始し本題に集中して取り組むことが可能です。
演習中心で効率良く短期習得
本プログラムの最大の特徴の一つは、全てのトピックについて,演習を中心に構成されている点です。実際に手を動かしながら理解を進めることで、効率よく学習することができます。
モデルの学習
Deep Learning技術では、モデルが学習する様子を観測しながらパラメータを調整することで、アプリケーションに応じたパフォーマンスの最大化を図ることが非常に重要です。この一連の流れを全ての演習で経験することで、重要な要素を身につけられます。
松尾研究室がコンテンツ作成
実践型のデータサイエンティスト育成講座およびDeep Learning講座を6年以上公開運営し、のべ6,000人以上の人材を育成してきた東京大学松尾研究室がコンテンツを監修・開発しました。
各講座
第1回 強化学習基礎(復習)・離散制御
(担当講師:今井)
①基本的な強化学習アルゴリズムの復習〜深層強化学習の導入(価値に基づく手法・方策勾配法・DQN)
②主要ベンチマークの強化学習アルゴリズムと発展
第2回シミュレータの利用・連続値制御
(担当講師:太田)
① 物理シミュレータの利用,PyBullet
② 連続値制御強化学習アルゴリズム
第3回制御モデルの利用・モデルベース強化学習
(担当講師:松嶋)
① 順運動学・逆運動学
② モデルに基づく制御
③ モデルベース強化学習
第4回デモを利用する手法
(担当講師:古田)
① 模倣学習
② オフライン強化学習
第5回Control as Inference・世界モデル
(担当講師:谷口)
① Control as Inference
② 強化学習の観点からみた世界モデル
第6回応用を見据えた発展的話題
(担当講師:今井・松嶋)
① ゲームAI・他分野への強化学習応用
② ロボット学習
企画
監修・講師・教材作成
運営
河合 真里
内田 暁
日程
募集開始 | 2021/1/29(金) |
---|---|
募集締切 | 2021/2/8(月)AM10:00 |
選考結果 | 2021/2/15(月)までに受講決定者にはメールで連絡します。 |
第1回(担当講師:今井) | 2021/2/25(木)15〜17時(最大18時) |
---|---|
第2回(担当講師:太田) | 2021/3/1 (月)15〜17時(最大18時) |
第3回(担当講師:松嶋) | 2021/3/4 (木)15〜17時(最大18時) |
第4回(担当講師:古田) | 2021/3/8 (月)15〜17時(最大18時) |
第5回(担当講師:谷口) | 2021/3/11 (木)15〜17時(最大18時) |
第6回(担当講師:今井・松嶋) | 2021/3/18 (木)15〜17時(最大18時) |
最終課題〆切 | 2021/3/25 (木)23:59 |
募集要項
- 本セミナーは、ライブ配信される講義映像を、各人が自宅等で視聴・演習していただく形式です。
- 各講義日の15:00〜17:00にライブ配信します。ライブ配信では、リアルタイムに質問を受け付けます。
- ライブ配信への参加方法など詳細については、受講が決定された方にご連絡いたします。
- 対象:学生(大学院、大学、高専、専門学校生、高校、中学など)
(本講座は公開講座であり、大学から単位は出ません) - 受講料はかかりません。
参加条件
- 深層学習/Deep Learningの基礎知識を備え、基礎的な実装が自身でできること。
- 毎回の講義を確実に視聴できること
- 課題に取り組む時間を十分に作れること
- 応募フォーム内にある、以下の質問に回答できる方
「あなたのこれまでの研究内容や開発の経験・実績に関して教えてください」
「応募理由.本セミナーでどのようなことを学びたいですか?」
「このセミナーの内容を今後どのように役立てたいですか?」
「関連講義の修了状況」
「日常的に利用している数値計算や深層学習,ロボット制御など,セミナーの内容に関連するライブラリがあれば用途とともに教えてください」
「上記項目以外にアピールしたいことや,セミナーに対する質問など」
※フォームは一時保存ができないため、事前に回答をご用意いただくことをお勧めいたします。
よくある質問、お問い合わせはこちら
(2月15日)
受講の可否についてのメールをお送り済です。
お手元に届いていない方は、まず「迷惑メールフォルダ」をご確認ください。
上記を確認されても見当たらない場合は、お問い合わせフォームからご連絡ください。