サマースクール 2023

大規模言語モデル

概要

本講座はサマースクールの一環として大規模言語モデル（Large Language Models, LLM)に関して体系的に学べる講座を目的として開催されます。
具体的には以下のスキルを身につける事を目的としています。

LLMの原理について，事前学習からRLHFまでの一連の流れや意味合いを理解する
LLMの学習や推論を支える技術について理解する
既に公開されているLLMモデルやAPIなどの活用方法を理解する

本講座では、東京大学Deep Learning基礎講座・応用講座を公開してきた松尾研究室が全面的に演習コンテンツを監修・作成しています。実践的な演習を通して、手を動かしながら技術を深く理解し、幅広いトピックを網羅します。

※本講座はページ下部の前提条件をご確認の上、条件が当てはまる方を対象としています。
LLMのモデルのアーキテクチャーまで取り扱う実践的な講義のため、ご自身のレベルに見合っているかご確認の上ご応募ください。

本講義は完全オンラインで実施いたします。

松尾研究室がコンテンツ作成

実践型のデータサイエンティスト育成講座およびDeep Learning講座を9年以上公開運営し、のべ7,000人以上の人材を育成してきた東京大学松尾研究室がコンテンツを監修・開発しました。

モデルの学習

Deep Learning技術では、モデルが学習する様子を観測しながらパラメータを調整することで、アプリケーションに応じたパフォーマンスの最大化を図ることが非常に重要です。この一連の流れを全ての演習で経験することで、重要な要素を身につけられます。

演習中心で効率良く短期習得

本プログラムの最大の特徴の一つは、多くのトピックについて，演習が用意されている点です。実際に手を動かすことで理解を深めることができます。

コンテンツ（全7回）

第1回Overview of Language Models
（担当講師：岩澤 / 小島）

第2回Prompting and Augmented Language Model
（担当講師：岩澤／原田）

第3回Pre-training Pipeline
（担当講師：小島／原田）

※第2回と入れ替えもあり得る

第4回Scaling Pre-training
（担当講師：小島／沖村）

第5回Parameter Efficient Fine-Tuning
（担当講師：中筋／永積）

第6回RLHF (Advanced Topic for Tuning Pre-trained Models)
（担当講師：高城）

第7回 Going Beyond LLM
（担当講師：栗田 / 松尾 / 岩澤 / 小島）

※講義日程・講義内容等には追加・変更が生じる可能性があります。

企画

監修

岩澤有祐

東京大学大学院工学系研究科

講師

松尾豊

東京大学大学院工学系研究科

岩澤有祐

東京大学大学院工学系研究科

小島武

東京大学大学院工学系研究科

栗田修平

理化学研究所

中筋渉太

東京大学大学院工学系研究科

twitter

髙城頌太

東京大学大学院工学系研究科

原田憲旺

東京大学大学院工学系研究科

沖村樹

東京大学大学院工学系研究科

永積輝

早稲田大学情報理工専攻
株式会社neoAI

教材作成

原田憲旺

東京大学大学院工学系研究科

沖村樹

東京大学大学院工学系研究科

中筋渉太

東京大学大学院工学系研究科

twitter

柿崎透真

木更津工業高等専門学校制御・情報システム工学専攻

竹田悠哉

東京大学大学院工学系研究科

徳永優也

東京大学大学院工学系研究科

永積輝

早稲田大学基幹理工学術院情報理工学専攻 / 株式会社neoAI

TA

松島弘幸

会津大学コンピュータ理工学部　コンピュータ理工学科

システム

野海芳博

東京大学松尾研究室職員

和田俊輔

ワンダーソフト株式会社

運営

大牧信介

東京大学松尾研究室職員

川崎竜一

東京大学松尾研究室職員

河合真里

東京大学松尾研究室職員

保谷朝美

東京大学松尾研究室職員

登坂充

東京大学大学院新領域創成科学研究科メディカル情報生命専攻

木島悠輔

西川登偉

和歌山県立医科大学医学部医学科

日程

※日程・講師は変更となる場合があります

募集開始	2023/7/19（水）
募集締切	~~2023/7/31（月）23:59~~ 2023/8/7（月）23:59まで延長
選考結果	2023/8/25（金）19時までに応募者全員にお送りします。

第1回（担当講師：岩澤 / 小島）	2023/9/4 （月）14:00 ~ 16:00
第2回（担当講師：岩澤 / 原田）	2023/9/8（金）14:00 ~ 16:00
第3回（担当講師：小島 / 原田）	2023/9/11（月）14:00 ~ 16:00
第4回（担当講師：小島 / 沖村）	2023/9/15（金）14:00 ~ 16:00
第5回（担当講師：中筋 / 永積）	2023/9/19（火）14:00 ~ 16:00
第6回（担当講師：高城）	2023/9/22（金）14:00 ~ 16:00
第7回（担当講師：栗田 / 松尾 / 岩澤 / 小島）	2023/9/25（月）14:00 ~ 16:00
（全回監修：岩澤）	※第5回のみ火曜日（9/18月が祝日のため）

募集対象

学生
（社会人学生も可。ただし大学生と社会人学生の場合、学士以上の学位取得ができる学生が対象）
東京大学の教職員
国家、地方公務員　[7/28 追加]
研究者　[7/28 追加]
スタートアップ企業の社員　[7/28 追加]

※受講中に上記の条件に当てはまらないことが発覚した場合は、受講資格を取り消すことがあります。
※受講希望者が多数の場合には、抽選を行います。
※ご応募は1人1属性1回までです。別属性からの重複応募は無効となります。
※ご自身に応募資格があるのかわからない・どの属性にあてはまるのかわからない場合には、最も近いと判断する属性区分からお申し込みください。お問い合わせフォームからご質問をいただいてもお答えいたしかねます。

※応募後の内容変更はできません。送信ボタンを押す前に内容をよくご確認ください。

※本講座は下記の前提条件をご確認の上、条件が当てはまる方を対象としています。
LLMのモデルのアーキテクチャーまで取り扱う実践的な講義のため、ご自身のレベルに見合っているかご確認の上ご応募ください。
受講前提に達してない方々に関しては、松尾研の他講座（ GCI・DL基礎等）の受講を推奨します。(各講座受講対象制限あり。現在募集していません)

前提条件

Zoom、Googleサービス（google drive、google form、google colab等）、Webブラウザ、Slackを利用できるPCが用意できること
毎回の講義を確実に視聴できること
最低でも毎回3時間程度の自習時間が確保できること
大学の理系学部レベルの線形代数、微分積分、確率論・統計学に関する知識を有すること
機械学習の基礎知識を備え、基礎的な実装が自身でできること (Pytorch，TensorFlow，JAXなどのフレームワークを使ってモデルの構築・訓練・評価を行った経験があること)

受講方法

本講座はオンライン講座です。
受講は無償です。
講義時間にリアルタイムでの参加ができない場合は、講義翌日（予定）に公開されるアーカイブ動画での受講も可能です。お時間のある時に視聴し課題に取り組んでいただきます。
各回の課題は締切日までに提出してください。
修了基準の公開可否については追って発表とします。

よくある質問、お問い合わせはこちら

【重要】

受講可否メール等が迷惑メールフォルダに入ってしまう事例が多数発生しています。
下記2点をご対応いただいていない場合、「メールが届かない」とのお問い合わせは対応いたしかねます。

<@mail.edu.omnicamp.us>, <@weblab.t.u-tokyo.ac.jp>からのメールが「迷惑メールフォルダ」に入らないように必ず設定をお願いします。
結果通知の日時を過ぎてもメールが届かない場合は、まず「迷惑メールフォルダ」の確認をお願いします。

上記を確認されても見当たらない場合は、お問い合わせフォームからご連絡ください。

サマースクール 2023

大規模言語モデル

概要

※本講座はページ下部の前提条件をご確認の上、条件が当てはまる方を対象としています。 LLMのモデルのアーキテクチャーまで取り扱う実践的な講義のため、ご自身のレベルに見合っているかご確認の上ご応募ください。

松尾研究室がコンテンツ作成

モデルの学習

演習中心で効率良く短期習得

コンテンツ（全7回）

第1回Overview of Language Models （担当講師：岩澤 / 小島）

第2回Prompting and Augmented Language Model （担当講師：岩澤／原田）

第3回Pre-training Pipeline （担当講師：小島／原田）

第4回Scaling Pre-training （担当講師：小島／沖村）

第5回Parameter Efficient Fine-Tuning （担当講師：中筋／永積）

第6回RLHF (Advanced Topic for Tuning Pre-trained Models) （担当講師：高城）

第7回 Going Beyond LLM （担当講師：栗田 / 松尾 / 岩澤 / 小島）

企画

監修

岩澤 有祐

講師

松尾 豊

岩澤 有祐

小島 武

栗田 修平

中筋 渉太

髙城 頌太

原田 憲旺

沖村 樹

永積 輝

教材作成

原田 憲旺

沖村 樹

中筋 渉太

柿崎 透真

竹田 悠哉

徳永 優也

永積 輝

TA

松島 弘幸

システム

野海 芳博

和田 俊輔

運営

大牧 信介

川崎 竜一

河合 真里

保谷 朝美

登坂 充

木島 悠輔

西川 登偉

日程

募集対象

前提条件

受講方法

Other Course

※本講座はページ下部の前提条件をご確認の上、条件が当てはまる方を対象としています。
LLMのモデルのアーキテクチャーまで取り扱う実践的な講義のため、ご自身のレベルに見合っているかご確認の上ご応募ください。

第1回Overview of Language Models
（担当講師：岩澤 / 小島）

第2回Prompting and Augmented Language Model
（担当講師：岩澤／原田）

第3回Pre-training Pipeline
（担当講師：小島／原田）

第4回Scaling Pre-training
（担当講師：小島／沖村）

第5回Parameter Efficient Fine-Tuning
（担当講師：中筋／永積）

第6回RLHF (Advanced Topic for Tuning Pre-trained Models)
（担当講師：高城）

第7回 Going Beyond LLM
（担当講師：栗田 / 松尾 / 岩澤 / 小島）

岩澤有祐

松尾豊

岩澤有祐

小島武

栗田修平

中筋渉太

髙城頌太

原田憲旺

沖村樹

永積輝

原田憲旺

沖村樹

中筋渉太

柿崎透真

竹田悠哉

徳永優也

永積輝

松島弘幸

野海芳博

和田俊輔

大牧信介

川崎竜一

河合真里

保谷朝美

登坂充

木島悠輔

西川登偉