Автоматическая обработка текста 24/25 (МОВС23) — различия между версиями
м (add contacts) |
м (add syllabus) |
||
Строка 38: | Строка 38: | ||
Ссылка на плейлист курса на YouTube: [[ YouTube-playlist]] | Ссылка на плейлист курса на YouTube: [[ YouTube-playlist]] | ||
− | Ссылка на GitHub с материалами курса: [ | + | Ссылка на GitHub с материалами курса: [https://github.com/greedisneutral/NLP-course GitHub repository] |
{| class="wikitable" | {| class="wikitable" | ||
Строка 44: | Строка 44: | ||
! Занятие !! Тема !! Дата !! Материалы для самоподготовки к семинарам !! Дополнительные материалы | ! Занятие !! Тема !! Дата !! Материалы для самоподготовки к семинарам !! Дополнительные материалы | ||
|- | |- | ||
− | | style="background:#eaecf0;" | '''1''' [[ Запись]] || [[ | + | | style="background:#eaecf0;" | '''1''' [[ Запись]] || [[ Слайды]] Карта задач и методов NLP, эмбеддинги слов (word embeddings) || 06.11.24 (Ср.) || || |
|- | |- | ||
− | | style="background:#eaecf0;" | '''2''' [[ Запись]] || [[ Ноутбук]] || ... | + | | style="background:#eaecf0;" | '''2''' [[ Запись]] || [[ Ноутбук]] Классификация текста || 14.11.24 (Чт.) || || |
|- | |- | ||
− | | style="background:#eaecf0;" | '''3''' [[ Запись]] || [[ Ноутбук]] || ... | + | | style="background:#eaecf0;" | '''3''' [[ Запись]] || [[ Ноутбук]] Seq2seq, Трансформер и механим внимания || 21.11.24 (Чт.) || || |
|- | |- | ||
− | | style="background:#eaecf0;" | '''4''' [[ Запись]] || [[ Ноутбук]] || ... | + | | style="background:#eaecf0;" | '''4''' [[ Запись]] || [[ Ноутбук]] Transfer learning: BERT, ELMO, GPT || 28.11.24 (Чт.) || || |
|- | |- | ||
− | | style="background:#eaecf0;" | '''5''' [[ Запись]] || [[ Ноутбук]] || ... | + | | style="background:#eaecf0;" | '''5''' [[ Запись]] || [[ Ноутбук]] Обучение Больших языковых моделей (Large Language Models): Обучение с нуля vs Тонкая настройка (finetuning) || 05.12.24 (Чт.) || || |
|- | |- | ||
− | | style="background:#eaecf0;" | '''6''' [[ Запись]] || [[ Ноутбук]] || ... | + | | style="background:#eaecf0;" | '''6''' [[ Запись]] || [[ Ноутбук]] Reinforcement Learning From Human Feedback (RLHF), Direct Preference Optimization (DPO) || 12.12.24 (Чт.) || || |
|- | |- | ||
− | + | | style="background:#eaecf0;" | '''7''' [[ Запись]] || [[ Ноутбук]] Практические подходы для эффективного обучения и развертывания LLM || 19.12.24 (Чт.) || || | |
− | + | ||
− | | style="background:#eaecf0;" | '''7''' [[ Запись]] || [[ Ноутбук]] || . | + | |
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
− | + | ||
|- | |- | ||
+ | | style="background:#eaecf0;" | '''8''' [[ Запись]] || [[ Ноутбук]] Retrieval-Augmented (RAG) LLM || ...<date>... || || | ||
|} | |} | ||
=== Записи консультаций === | === Записи консультаций === | ||
− | |||
==Формула оценивания== | ==Формула оценивания== |
Версия 11:59, 8 ноября 2024
Содержание
О курсе
NLP — это область искусственного интеллекта, направленная на решение задач, связанных с обработкой человеческого языка, таких как извлечение информации, машинный перевод, автоматическое суммирование и диалоговые системы. За последние годы мы увидели значительный прогресс благодаря статистическому и глубокому обучению. Демонстрация возможностей современных диалоговых систем по типу ChatGPT от OpenAI позволила нам переосмыслить перспективы NLP в повседневной жизни, что привлекло к области внимание как со стороны исследователей и инженеров, так и институциональных инвесторов, готовых финансировать бурный рост отрасли.
Данный курс ставит перед собой следующие цели:
- познакомить слушателя с ключевыми направлениями современного развития области, сформировать понимание запросов, с которыми сталкиваются инженеры и исследователи в повседневной работе.
- развить понимание фундаментальных концепций, необходимых для самостоятельного решения задач как прикладного, так и исследовательского характера.
- познакомить слушателя с инструментами, необходимыми для решения прикладных задач.
Занятия проводятся в Zoom по четвергам в 19:40
Курс основан на материалах Школы Анализа Данных Яндекса (ШАД), CS224n by Stanford, а также личном опыте автора. Курс приоритезирует понимание слушателями пространства существующих на сегодня в отрасли задач и умение их решать над полнотой освещения исторически важных, однако на текущий день устаревших концепций
Контакты
Чат курса в TG: chat link
Преподаватель: Хажгериев Мурат Анзорович (@greedisneutral)
Ассистент | Контакты |
---|---|
Соня-Аня Никифорова | @sonya_leaf |
Стас Ивашков | @ps1va |
Маша Харченко | @mister_autocrat |
Савелий Прохоров | @Savely_Prokhorov |
Материалы курса
Ссылка на плейлист курса на YouTube: YouTube-playlist
Ссылка на GitHub с материалами курса: GitHub repository
Занятие | Тема | Дата | Материалы для самоподготовки к семинарам | Дополнительные материалы |
---|---|---|---|---|
1 Запись | Слайды Карта задач и методов NLP, эмбеддинги слов (word embeddings) | 06.11.24 (Ср.) | ||
2 Запись | Ноутбук Классификация текста | 14.11.24 (Чт.) | ||
3 Запись | Ноутбук Seq2seq, Трансформер и механим внимания | 21.11.24 (Чт.) | ||
4 Запись | Ноутбук Transfer learning: BERT, ELMO, GPT | 28.11.24 (Чт.) | ||
5 Запись | Ноутбук Обучение Больших языковых моделей (Large Language Models): Обучение с нуля vs Тонкая настройка (finetuning) | 05.12.24 (Чт.) | ||
6 Запись | Ноутбук Reinforcement Learning From Human Feedback (RLHF), Direct Preference Optimization (DPO) | 12.12.24 (Чт.) | ||
7 Запись | Ноутбук Практические подходы для эффективного обучения и развертывания LLM | 19.12.24 (Чт.) | ||
8 Запись | Ноутбук Retrieval-Augmented (RAG) LLM | ...<date>... |
Записи консультаций
Формула оценивания
Оценка = ...<вес 1>...*О...<форма контроля 1>... + ...<вес 2>...*О...<форма контроля 2>... + ...<вес 3>...*О...<форма контроля 3>...