Python: работа с данными и текстом — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница: «== О чем данный курс? == В рамках курса “Python: работа с данными и текстом” студенты освоят б…»)
 
 
(не показаны 2 промежуточные версии этого же участника)
Строка 7: Строка 7:
 
* Обучение студентов прикладным навыкам по анализу данных аудиторий, рядов финансовых транзакций, больших необработанных массивов из открытых источников;
 
* Обучение студентов прикладным навыкам по анализу данных аудиторий, рядов финансовых транзакций, больших необработанных массивов из открытых источников;
 
* Обучение студентов методам и моделям автоматической обработки и анализа естественного языка, включая статистический, дискурсивный и сенситивный анализ медиатекстов, автоматический контент анализ и др.
 
* Обучение студентов методам и моделям автоматической обработки и анализа естественного языка, включая статистический, дискурсивный и сенситивный анализ медиатекстов, автоматический контент анализ и др.
 
  
 
== Кому писать и звонить? ==
 
== Кому писать и звонить? ==
Строка 21: Строка 20:
  
 
== Что я получу за этот курс? ==
 
== Что я получу за этот курс? ==
 +
Ведомость доступна [https://docs.google.com/spreadsheets/d/1PUaYsdIs89pJFdEcUnkdjIE2MORjMlrRu6yvjSoxI0A/edit?usp=sharing '''по ссылке''']. Оценка за курс выставляется по следующей формуле:
 +
 +
'''О_итоговая''' = 10%*('''Тесты на семинарских занятиях''') + 50%*('''Домашние задания''') + 15%*('''Контрольная работа''') + 25%*('''Экзамен''')
 +
 +
{| class="wikitable"
 +
|-
 +
! Форма контроля !! Мягкий deadline !! Строгий deadline !! Ссылка для сдачи !! Результаты
 +
|-
 +
| Домашнее задание №1 || TBA || TBA || TBA || TBA
 +
|-
 +
| Домашнее задание №2 || TBA || TBA || TBA || TBA
 +
|-
 +
| Домашнее задание №3 || TBA || TBA || TBA || TBA
 +
|-
 +
| Домашнее задание №4 || TBA || TBA || TBA || TBA
 +
|-
 +
| '''Контрольная работа''' || TBA || TBA || TBA || TBA
 +
|}
 +
 +
== План занятий и материалы ==

Текущая версия на 17:47, 16 октября 2020

О чем данный курс?

В рамках курса “Python: работа с данными и текстом” студенты освоят базовые навыки и приобретут необходимые компетенции по работе со структурированными и неструктурированными типами данных. Курс состоит из двух блоков, в рамках которых студенты научатся автоматически обрабатывать таблицы чисел и тексты слов. Первый блок дисциплины посвящен работе со структурированными данными с использованием библиотеки Pandas. В рамках данного блока будут рассмотрены все этапы работы с табличными данными, начиная с доступа к данным из разных структур и заканчивая их визуализацией в виде графиков и полноценных дашбордов. Второй блок дисциплины будет посвящен работе с неструктурированными данными - главным образом с текстами. Студенты освоят библиотеку для обработки и анализа естественного языка NLTK, познакомятся с базовыми моделями классификации и кластеризации текстов, а также попробуют применить инструменты и методы тематического моделирования к корпусам текстов. Среди целей освоения дисциплины:

  • Формирование у студентов теоретических знаний и профессиональных компетенций по работе со структурированными и неструктурированными типами данных;
  • Формирование профессиональных компетенций и прикладных навыков по работе с табличными данными посредством использования инструментов и методов библиотеки Pandas;
  • Формирование профессиональных компетенций и прикладных навыков по работе с текстовыми данными посредством использования инструментов и методов библиотеки NLTK;
  • Обучение студентов прикладным навыкам по анализу данных аудиторий, рядов финансовых транзакций, больших необработанных массивов из открытых источников;
  • Обучение студентов методам и моделям автоматической обработки и анализа естественного языка, включая статистический, дискурсивный и сенситивный анализ медиатекстов, автоматический контент анализ и др.

Кому писать и звонить?

Вся информация по курсу выкладывается на данной странице и дублируется в чат курса в Telegram.

Как зовут? Куда писать в Telegram? Куда писать на почту? Куда звонить, если все пропало?!
Преподаватель курса Чмель Кирилл Шамилевич сюда! kchmel@hse.ru +7 985 291-99-77
Учебный ассистент Фидоринова Дарья Максимовна сюда! dmfidorinova@edu.hse.ru Не надо звонить :)

Что я получу за этот курс?

Ведомость доступна по ссылке. Оценка за курс выставляется по следующей формуле:

О_итоговая = 10%*(Тесты на семинарских занятиях) + 50%*(Домашние задания) + 15%*(Контрольная работа) + 25%*(Экзамен)

Форма контроля Мягкий deadline Строгий deadline Ссылка для сдачи Результаты
Домашнее задание №1 TBA TBA TBA TBA
Домашнее задание №2 TBA TBA TBA TBA
Домашнее задание №3 TBA TBA TBA TBA
Домашнее задание №4 TBA TBA TBA TBA
Контрольная работа TBA TBA TBA TBA

План занятий и материалы