Прикладные задачи анализа данных (майнор - весна 2018) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м (О курсе)
м (Система оценок)
Строка 41: Строка 41:
 
Результирующая оценка рассчитывается по формуле:
 
Результирующая оценка рассчитывается по формуле:
  
O<sub>итоговая</sub> = 0.8 * O<sub>накопл</sub> + 0.2 * О<sub>экз</sub>
+
O<sub>итоговая</sub> = 0.6 * O<sub>накопл</sub> + 0.4 * О<sub>экз</sub>
  
 
Накопленная оценка рассчитывается по формуле:
 
Накопленная оценка рассчитывается по формуле:
  
O<sub>накопл</sub> = 0.4 * O<sub>проект1</sub> +  0.4 * O<sub>проект2</sub> +  0.2 * О<sub>дз+cем
+
O<sub>накопл</sub> = 0.7 * O<sub>дз (4 шт)</sub> +  0.3 * O<sub>ср (2 шт)</sub>
  
 
[Здесь будет ссылка на ведомость, (ведомость)]
 
[Здесь будет ссылка на ведомость, (ведомость)]
 
  
 
=== Программа ===  
 
=== Программа ===  

Версия 18:29, 17 января 2018

О курсе

Читается для студентов 3 курса в 3-4 модулях.

Курс состоит из двух частей.

Лекторы:

В 3 модуле: Екатерина Черняк

В 4 модуле: Дмитрий Игнатов

Лекции проходят по четвергам, 10:30 – 11:50 , ауд. 5306 (Шаболовка, 26).

Карточка курса

Сдача домашних заданий в системе Anytask

Канал для оповещений в Telegram

Семинары

Семинары проходят по четвергам (Шаболовка, 26).

Группа Преподаватель Расписание чат группы
ИАД1 Наталья Козловская 12:10 – 13:30, ауд. 3316
ИАД2 Иван Смуров 12:10 – 13:30, ауд. 4428
ИАД3 Александр Панов 09:00 – 10:20, ауд. 4435
ИАД4 Анна Шишкова 12:10 – 13:00, ауд. 4335

Система оценок

Результирующая оценка рассчитывается по формуле:

Oитоговая = 0.6 * Oнакопл + 0.4 * Оэкз

Накопленная оценка рассчитывается по формуле:

Oнакопл = 0.7 * Oдз (4 шт) + 0.3 * Oср (2 шт)

[Здесь будет ссылка на ведомость, (ведомость)]

Программа

День первый (18 января)

Лекция (Е. Черняк):

Семинар: Regexp

Рекомендуемые ресурсы

На английском

  • Jurafsky & Martin (link)
  • Курс Лауры Каллмайер по МО для АОТ (link)
  • Курс Нильса Раймерса по DL для АОТ (link)
  • Курс в Оксфорде по DL для АОТ (link)
  • Курс в Стенфорде по DL для AOT (link)
  • Материалы по обучению с подкреплением (Reinforcment Learning) (link)

На русском (и про русский, в основном)

  • НКРЯ (link)
  • Открытый корпус (link)
  • Дистрибутивные семантические модели для русского языка (link)
  • Морфология (link)
  • Синтаксис (link)
  • Томита-парсер (link)
  • Все на свете: (mathlingvo), (nlpub)
  • Text Visualisation browser: (link)

Ссылка на дополнительную литературу:

  • [1] Books on natural language processing
  • [2] Text mining for central banks

Литература

  1. Manning, Christopher D., and Hinrich Schütze. Foundations of statistical natural language processing. Vol. 999. Cambridge: MIT press, 1999.
  2. Martin, James H., and Daniel Jurafsky. "Speech and language processing." International Edition 710 (2000): 25.
  3. Cohen, Shay. "Bayesian analysis in natural language processing." Synthesis Lectures on Human Language Technologies 9, no. 2 (2016): 1-274.
  4. Goldberg, Yoav. "Neural Network Methods for Natural Language Processing." Synthesis Lectures on Human Language Technologies 10, no. 1 (2017): 1-309.

Используемые библиотеки

  1. NLTK (link)
  2. pymorphy2 (link)
  3. pymystem3 (link)
  4. readability (link)