Python: работа с данными и текстом — различия между версиями
Строка 20: | Строка 20: | ||
== Что я получу за этот курс? == | == Что я получу за этот курс? == | ||
− | Ведомость доступна по ссылке. Оценка за курс выставляется по следующей формуле: | + | Ведомость доступна [https://docs.google.com/spreadsheets/d/1PUaYsdIs89pJFdEcUnkdjIE2MORjMlrRu6yvjSoxI0A/edit?usp=sharing '''по ссылке''']. Оценка за курс выставляется по следующей формуле: |
'''О_итоговая''' = 10%*('''Тесты на семинарских занятиях''') + 50%*('''Домашние задания''') + 15%*('''Контрольная работа''') + 25%*('''Экзамен''') | '''О_итоговая''' = 10%*('''Тесты на семинарских занятиях''') + 50%*('''Домашние задания''') + 15%*('''Контрольная работа''') + 25%*('''Экзамен''') |
Версия 17:41, 16 октября 2020
Содержание
О чем данный курс?
В рамках курса “Python: работа с данными и текстом” студенты освоят базовые навыки и приобретут необходимые компетенции по работе со структурированными и неструктурированными типами данных. Курс состоит из двух блоков, в рамках которых студенты научатся автоматически обрабатывать таблицы чисел и тексты слов. Первый блок дисциплины посвящен работе со структурированными данными с использованием библиотеки Pandas. В рамках данного блока будут рассмотрены все этапы работы с табличными данными, начиная с доступа к данным из разных структур и заканчивая их визуализацией в виде графиков и полноценных дашбордов. Второй блок дисциплины будет посвящен работе с неструктурированными данными - главным образом с текстами. Студенты освоят библиотеку для обработки и анализа естественного языка NLTK, познакомятся с базовыми моделями классификации и кластеризации текстов, а также попробуют применить инструменты и методы тематического моделирования к корпусам текстов. Среди целей освоения дисциплины:
- Формирование у студентов теоретических знаний и профессиональных компетенций по работе со структурированными и неструктурированными типами данных;
- Формирование профессиональных компетенций и прикладных навыков по работе с табличными данными посредством использования инструментов и методов библиотеки Pandas;
- Формирование профессиональных компетенций и прикладных навыков по работе с текстовыми данными посредством использования инструментов и методов библиотеки NLTK;
- Обучение студентов прикладным навыкам по анализу данных аудиторий, рядов финансовых транзакций, больших необработанных массивов из открытых источников;
- Обучение студентов методам и моделям автоматической обработки и анализа естественного языка, включая статистический, дискурсивный и сенситивный анализ медиатекстов, автоматический контент анализ и др.
Кому писать и звонить?
Вся информация по курсу выкладывается на данной странице и дублируется в чат курса в Telegram.
Как зовут? | Куда писать в Telegram? | Куда писать на почту? | Куда звонить, если все пропало?! | |
---|---|---|---|---|
Преподаватель курса | Чмель Кирилл Шамилевич | сюда! | kchmel@hse.ru | +7 985 291-99-77 |
Учебный ассистент | Фидоринова Дарья Максимовна | сюда! | dmfidorinova@edu.hse.ru | Не надо звонить :) |
Что я получу за этот курс?
Ведомость доступна по ссылке. Оценка за курс выставляется по следующей формуле:
О_итоговая = 10%*(Тесты на семинарских занятиях) + 50%*(Домашние задания) + 15%*(Контрольная работа) + 25%*(Экзамен)