Python: работа с данными и текстом

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О чем данный курс?

В рамках курса “Python: работа с данными и текстом” студенты освоят базовые навыки и приобретут необходимые компетенции по работе со структурированными и неструктурированными типами данных. Курс состоит из двух блоков, в рамках которых студенты научатся автоматически обрабатывать таблицы чисел и тексты слов. Первый блок дисциплины посвящен работе со структурированными данными с использованием библиотеки Pandas. В рамках данного блока будут рассмотрены все этапы работы с табличными данными, начиная с доступа к данным из разных структур и заканчивая их визуализацией в виде графиков и полноценных дашбордов. Второй блок дисциплины будет посвящен работе с неструктурированными данными - главным образом с текстами. Студенты освоят библиотеку для обработки и анализа естественного языка NLTK, познакомятся с базовыми моделями классификации и кластеризации текстов, а также попробуют применить инструменты и методы тематического моделирования к корпусам текстов. Среди целей освоения дисциплины:

  • Формирование у студентов теоретических знаний и профессиональных компетенций по работе со структурированными и неструктурированными типами данных;
  • Формирование профессиональных компетенций и прикладных навыков по работе с табличными данными посредством использования инструментов и методов библиотеки Pandas;
  • Формирование профессиональных компетенций и прикладных навыков по работе с текстовыми данными посредством использования инструментов и методов библиотеки NLTK;
  • Обучение студентов прикладным навыкам по анализу данных аудиторий, рядов финансовых транзакций, больших необработанных массивов из открытых источников;
  • Обучение студентов методам и моделям автоматической обработки и анализа естественного языка, включая статистический, дискурсивный и сенситивный анализ медиатекстов, автоматический контент анализ и др.

Кому писать и звонить?

Вся информация по курсу выкладывается на данной странице и дублируется в чат курса в Telegram.

Как зовут? Куда писать в Telegram? Куда писать на почту? Куда звонить, если все пропало?!
Преподаватель курса Чмель Кирилл Шамилевич сюда! kchmel@hse.ru +7 985 291-99-77
Учебный ассистент Фидоринова Дарья Максимовна сюда! dmfidorinova@edu.hse.ru Не надо звонить :)

Что я получу за этот курс?

Ведомость доступна по ссылке. Оценка за курс выставляется по следующей формуле:

О_итоговая = 10%*(Тесты на семинарских занятиях) + 50%*(Домашние задания) + 15%*(Контрольная работа) + 25%*(Экзамен)

Форма контроля Мягкий deadline Строгий deadline Ссылка для сдачи Результаты
Домашнее задание №1 TBA TBA TBA TBA
Домашнее задание №2 TBA TBA TBA TBA
Домашнее задание №3 TBA TBA TBA TBA
Домашнее задание №4 TBA TBA TBA TBA
Контрольная работа TBA TBA TBA TBA

План занятий и материалы