Python: работа с данными и текстом
Содержание
О чем данный курс?
В рамках курса “Python: работа с данными и текстом” студенты освоят базовые навыки и приобретут необходимые компетенции по работе со структурированными и неструктурированными типами данных. Курс состоит из двух блоков, в рамках которых студенты научатся автоматически обрабатывать таблицы чисел и тексты слов. Первый блок дисциплины посвящен работе со структурированными данными с использованием библиотеки Pandas. В рамках данного блока будут рассмотрены все этапы работы с табличными данными, начиная с доступа к данным из разных структур и заканчивая их визуализацией в виде графиков и полноценных дашбордов. Второй блок дисциплины будет посвящен работе с неструктурированными данными - главным образом с текстами. Студенты освоят библиотеку для обработки и анализа естественного языка NLTK, познакомятся с базовыми моделями классификации и кластеризации текстов, а также попробуют применить инструменты и методы тематического моделирования к корпусам текстов. Среди целей освоения дисциплины:
- Формирование у студентов теоретических знаний и профессиональных компетенций по работе со структурированными и неструктурированными типами данных;
- Формирование профессиональных компетенций и прикладных навыков по работе с табличными данными посредством использования инструментов и методов библиотеки Pandas;
- Формирование профессиональных компетенций и прикладных навыков по работе с текстовыми данными посредством использования инструментов и методов библиотеки NLTK;
- Обучение студентов прикладным навыкам по анализу данных аудиторий, рядов финансовых транзакций, больших необработанных массивов из открытых источников;
- Обучение студентов методам и моделям автоматической обработки и анализа естественного языка, включая статистический, дискурсивный и сенситивный анализ медиатекстов, автоматический контент анализ и др.
Кому писать и звонить?
Вся информация по курсу выкладывается на данной странице и дублируется в чат курса в Telegram.
Как зовут? | Куда писать в Telegram? | Куда писать на почту? | Куда звонить, если все пропало?! | |
---|---|---|---|---|
Преподаватель курса | Чмель Кирилл Шамилевич | сюда! | kchmel@hse.ru | +7 985 291-99-77 |
Учебный ассистент | Фидоринова Дарья Максимовна | сюда! | dmfidorinova@edu.hse.ru | Не надо звонить :) |
Что я получу за этот курс?
Ведомость доступна по ссылке. Оценка за курс выставляется по следующей формуле:
О_итоговая = 10%*(Тесты на семинарских занятиях) + 50%*(Домашние задания) + 15%*(Контрольная работа) + 25%*(Экзамен)
Форма контроля | Мягкий deadline | Строгий deadline | Ссылка для сдачи | Результаты |
---|---|---|---|---|
Домашнее задание №1 | TBA | TBA | TBA | TBA |
Домашнее задание №2 | TBA | TBA | TBA | TBA |
Домашнее задание №3 | TBA | TBA | TBA | TBA |
Домашнее задание №4 | TBA | TBA | TBA | TBA |
Контрольная работа | TBA | TBA | TBA | TBA |