Автоматическая обработка текста 24/25 (МОВС23) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м (add contacts)
м (add syllabus)
Строка 38: Строка 38:
 
Ссылка на плейлист курса на YouTube: [[ YouTube-playlist]]
 
Ссылка на плейлист курса на YouTube: [[ YouTube-playlist]]
  
Ссылка на GitHub с материалами курса: [[ GitHub repository]]
+
Ссылка на GitHub с материалами курса: [https://github.com/greedisneutral/NLP-course GitHub repository]
  
 
{| class="wikitable"
 
{| class="wikitable"
Строка 44: Строка 44:
 
  ! Занятие !! Тема !! Дата !! Материалы для самоподготовки к семинарам !! Дополнительные материалы
 
  ! Занятие !! Тема !! Дата !! Материалы для самоподготовки к семинарам !! Дополнительные материалы
 
|-
 
|-
| style="background:#eaecf0;" | '''1''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||  
+
| style="background:#eaecf0;" | '''1''' [[ Запись]] || [[ Слайды]] Карта задач и методов NLP, эмбеддинги слов (word embeddings) || 06.11.24 (Ср.) || ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''2''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||  
+
| style="background:#eaecf0;" | '''2''' [[ Запись]] || [[ Ноутбук]] Классификация текста || 14.11.24 (Чт.) || ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''3''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||
+
| style="background:#eaecf0;" | '''3''' [[ Запись]] || [[ Ноутбук]] Seq2seq, Трансформер и механим внимания || 21.11.24 (Чт.) || ||
 
|-
 
|-
| style="background:#eaecf0;" | '''4''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||  
+
| style="background:#eaecf0;" | '''4''' [[ Запись]] || [[ Ноутбук]] Transfer learning: BERT, ELMO, GPT || 28.11.24 (Чт.) || ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''5''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||  
+
| style="background:#eaecf0;" | '''5''' [[ Запись]] || [[ Ноутбук]] Обучение Больших языковых моделей (Large Language Models): Обучение с нуля vs Тонкая настройка (finetuning) || 05.12.24 (Чт.) || ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''6''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||  
+
| style="background:#eaecf0;" | '''6''' [[ Запись]] || [[ Ноутбук]] Reinforcement Learning From Human Feedback (RLHF), Direct Preference Optimization (DPO) || 12.12.24 (Чт.) || ||  
 
|-
 
|-
| Конец первого модуля |
+
| style="background:#eaecf0;" | '''7''' [[ Запись]] || [[ Ноутбук]] Практические подходы для эффективного обучения и развертывания LLM || 19.12.24 (Чт.) || ||  
|-
+
| style="background:#eaecf0;" | '''7''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||
+
|-
+
| style="background:#eaecf0;" | '''8''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||
+
|-
+
| style="background:#eaecf0;" | '''9''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||
+
|-
+
| style="background:#eaecf0;" | '''10''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||
+
|-
+
| style="background:#eaecf0;" | '''11''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||
+
|-
+
| style="background:#eaecf0;" | '''12''' [[ Запись]] || [[ Ноутбук]] || ...<date>... || ||  
+
 
|-
 
|-
 +
| style="background:#eaecf0;" | '''8''' [[ Запись]] || [[ Ноутбук]] Retrieval-Augmented (RAG) LLM || ...<date>... || ||
 
|}
 
|}
  
 
=== Записи консультаций ===
 
=== Записи консультаций ===
 
  
 
==Формула оценивания==
 
==Формула оценивания==

Версия 11:59, 8 ноября 2024

О курсе

NLP — это область искусственного интеллекта, направленная на решение задач, связанных с обработкой человеческого языка, таких как извлечение информации, машинный перевод, автоматическое суммирование и диалоговые системы. За последние годы мы увидели значительный прогресс благодаря статистическому и глубокому обучению. Демонстрация возможностей современных диалоговых систем по типу ChatGPT от OpenAI позволила нам переосмыслить перспективы NLP в повседневной жизни, что привлекло к области внимание как со стороны исследователей и инженеров, так и институциональных инвесторов, готовых финансировать бурный рост отрасли.

Данный курс ставит перед собой следующие цели:

  • познакомить слушателя с ключевыми направлениями современного развития области, сформировать понимание запросов, с которыми сталкиваются инженеры и исследователи в повседневной работе.
  • развить понимание фундаментальных концепций, необходимых для самостоятельного решения задач как прикладного, так и исследовательского характера.
  • познакомить слушателя с инструментами, необходимыми для решения прикладных задач.


Занятия проводятся в Zoom по четвергам в 19:40


Курс основан на материалах Школы Анализа Данных Яндекса (ШАД), CS224n by Stanford, а также личном опыте автора. Курс приоритезирует понимание слушателями пространства существующих на сегодня в отрасли задач и умение их решать над полнотой освещения исторически важных, однако на текущий день устаревших концепций

Контакты

Чат курса в TG: chat link

Преподаватель: Хажгериев Мурат Анзорович (@greedisneutral)

Ассистент Контакты
Соня-Аня Никифорова @sonya_leaf
Стас Ивашков @ps1va
Маша Харченко @mister_autocrat
Савелий Прохоров @Savely_Prokhorov

Материалы курса

Ссылка на плейлист курса на YouTube: YouTube-playlist

Ссылка на GitHub с материалами курса: GitHub repository

Занятие Тема Дата Материалы для самоподготовки к семинарам Дополнительные материалы
1 Запись Слайды Карта задач и методов NLP, эмбеддинги слов (word embeddings) 06.11.24 (Ср.)
2 Запись Ноутбук Классификация текста 14.11.24 (Чт.)
3 Запись Ноутбук Seq2seq, Трансформер и механим внимания 21.11.24 (Чт.)
4 Запись Ноутбук Transfer learning: BERT, ELMO, GPT 28.11.24 (Чт.)
5 Запись Ноутбук Обучение Больших языковых моделей (Large Language Models): Обучение с нуля vs Тонкая настройка (finetuning) 05.12.24 (Чт.)
6 Запись Ноутбук Reinforcement Learning From Human Feedback (RLHF), Direct Preference Optimization (DPO) 12.12.24 (Чт.)
7 Запись Ноутбук Практические подходы для эффективного обучения и развертывания LLM 19.12.24 (Чт.)
8 Запись Ноутбук Retrieval-Augmented (RAG) LLM ...<date>...

Записи консультаций

Формула оценивания

Оценка = ...<вес 1>...*О...<форма контроля 1>... + ...<вес 2>...*О...<форма контроля 2>... + ...<вес 3>...*О...<форма контроля 3>...


Домашние задания

Литература