Natural Language Processing Blended 2020 module4

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

Преподаватель - Шестаков Андрей
Форма обратной связи здесь
Оценки
Course repo

Описание курса

Коллосальный рост доступной текстовой информации ускорил развитие научной области, известной как автоматическая обработка естественного языка (англ. Natural Language Processing). В рамках данного курса студенты ознакомятся к задачами, которые решает NLP как с помощью классических, так и с помощью нейросетевых методов. В частности будут разобраны задачи классификации текстов, выявления именованный сущностей, поиск дубликатов и генерация текстов. В качестве выпускного проекта студентам будет предложено разработать бота-ассистента для поиска по порталу StackOverflow.

Курс основан на онлайн курсе “Natural Language Processing” - https://www.coursera.org/learn/language-processing (платформа - Coursera, разработки – ВШЭ)

Предполагается, что слушатели прошли вводный курс по языку Python, имеют базовые знания по высшей математике (линейная алгебра, мат. анализ) и методам машинного обучения

Программа курса

Темы занятий

Week1. Intro and text classification (tf2 version ), little nlp introduction
Week2. LSTMs
Week3. Word Embeddings and Topic Modelling
Week4. Sequence to sequence tasks , transformers library <