МОВС Автоматический анализ текстов, NLP (2023-24 уч. год, 6 модуль) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(create NLP course page)
 
м (add dates)
Строка 30: Строка 30:
 
  ! Занятие !! Тема !! Дата !! Ссылки
 
  ! Занятие !! Тема !! Дата !! Ссылки
 
|-
 
|-
| style="background:#eaecf0;" | '''1''' [[ Запись]] || [[ Ноутбук]] Обработка и аугментация текстов, векторные модели представления текста и задача классификации || ||  
+
| style="background:#eaecf0;" | '''1''' [[ Запись]] || [[ Ноутбук]] Обработка и аугментация текстов, векторные модели представления текста и задача классификации || 01.11.23 ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''2''' [[ Запись]] || [[ Ноутбук]] Языковое моделирование. Модель Encoder-Decoder, Механизм внимания и задачи Seq2Seq || ||  
+
| style="background:#eaecf0;" | '''2''' [[ Запись]] || [[ Ноутбук]] Языковое моделирование. Модель Encoder-Decoder, Механизм внимания и задачи Seq2Seq || 08.11.23 ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''3''' [[ Запись]] || [[ Ноутбук]] Современные модели, основанные на модели Transformer || ||
+
| style="background:#eaecf0;" | '''3''' [[ Запись]] || [[ Ноутбук]] Современные модели, основанные на модели Transformer || 15.11.23 ||
 
|-
 
|-
| style="background:#eaecf0;" | '''4''' [[ Запись]] || [[ Ноутбук]] Few- и zero-shot learning. Использование предобученных языковых моделей для задач классификации и вопросно-ответных систем || ||  
+
| style="background:#eaecf0;" | '''4''' [[ Запись]] || [[ Ноутбук]] Few- и zero-shot learning. Использование предобученных языковых моделей для задач классификации и вопросно-ответных систем || 22.11.23 ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''5''' [[ Запись]] || [[ Ноутбук]] Sequence Labeling: POS-теггинг и извлечение именованных сущностей (NER) || ||  
+
| style="background:#eaecf0;" | '''5''' [[ Запись]] || [[ Ноутбук]] Sequence Labeling: POS-теггинг и извлечение именованных сущностей (NER) || 29.11.23 ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''6''' [[ Запись]] || [[ Ноутбук]] Тематическое моделирование и модель LDA || ||  
+
| style="background:#eaecf0;" | '''6''' [[ Запись]] || [[ Ноутбук]] Тематическое моделирование и модель LDA || 06.12.23 ||  
 
|-
 
|-
| style="background:#eaecf0;" | '''7''' [[ Запись]] || [[ Ноутбук]] Синтаксический парсинг предложений ||  ||  
+
| style="background:#eaecf0;" | '''7''' [[ Запись]] || [[ Ноутбук]] Синтаксический парсинг предложений || 13.12.23 ||
 +
|-
 +
| style="background:#eaecf0;" | '''8''' [[ Запись]] || [[ Ноутбук]] || 20.12.23 ||  
 
|-
 
|-
 
|}
 
|}
  
 
=== Записи консультаций ===
 
=== Записи консультаций ===
 
  
 
==Формула оценивания==
 
==Формула оценивания==

Версия 00:22, 30 октября 2023

О курсе

Цель курса - ознакомление студентов с задачами и современными технологиями Natural Language Processing. Планируется ознакомление со статистическими и нейросетевыми подходами в NLP, приобретение навыков их использования в реальных практических задачах.
По завершению программы студенты будут уметь работать с текстовыми данными, знать основные методы предобработки текста и его векторизации. Студенты также должны овладеть современными фреймворками для работы с нейросетевыми моделями, ориентироваться в основных задачах в области обработки текстов: уметь сформулировать задачу, выбрать и реализовать на практике модель для ее решения.

Занятия проводятся в Zoom по ... в ...

Онлайн-курс в дополнение к парам: https://openedu.ru/course/hse/TEXT/

Контакты

Чат курса в TG: https://t.me/+eyYewvjvsEU0NjVi

Преподаватель: Саркисян Вероника Вагановна

Ассистент Контакты
Артём Никитин @SHAMPINION
Андрей Дядюнов @mr_dyadyunov

Материалы курса

Плейлист курса на YouTube: https://www.youtube.com/playlist?list=PLmA-1xX7IuzBF1THckCvwhkITfhFs8ZB3

GitHub с материалами курса: GitHub repository

Занятие Тема Дата Ссылки
1 Запись Ноутбук Обработка и аугментация текстов, векторные модели представления текста и задача классификации 01.11.23
2 Запись Ноутбук Языковое моделирование. Модель Encoder-Decoder, Механизм внимания и задачи Seq2Seq 08.11.23
3 Запись Ноутбук Современные модели, основанные на модели Transformer 15.11.23
4 Запись Ноутбук Few- и zero-shot learning. Использование предобученных языковых моделей для задач классификации и вопросно-ответных систем 22.11.23
5 Запись Ноутбук Sequence Labeling: POS-теггинг и извлечение именованных сущностей (NER) 29.11.23
6 Запись Ноутбук Тематическое моделирование и модель LDA 06.12.23
7 Запись Ноутбук Синтаксический парсинг предложений 13.12.23
8 Запись Ноутбук 20.12.23

Записи консультаций

Формула оценивания

Оценка = 0.3*ОТесты + 0.7*ОДЗ, где ОТесты - средняя оценка по тестам на платформе онлайн-курса, а ОДЗ - максимальная из оценок по двум домашним заданиям

Домашние задания

  1. Классификация (будет выдана после 1-го занятия)
  2. NER (будет выдана после 5-го семинара)

Литература

  • Manning, Christopher D., and Hinrich Schütze. Foundations of statistical natural language processing. Vol. 999. Cambridge: MIT press, 1999.
  • Goldberg, Yoav. "Neural Network Methods for Natural Language Processing." Synthesis Lectures on Human Language Technologies 10, no. 1 (2017): 1-309.