Анализ неструктурированных данных — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м
Строка 43: Строка 43:
  
 
O<sub>накопл</sub> = 0.4 *( O<sub>проект1</sub> + O<sub>проект2</sub>)/2 +  0.2 * (О<sub>дз</sub> + О<sub>сем</sub>)
 
O<sub>накопл</sub> = 0.4 *( O<sub>проект1</sub> + O<sub>проект2</sub>)/2 +  0.2 * (О<sub>дз</sub> + О<sub>сем</sub>)
 +
 +
 +
=== Программа ===
 +
 +
==== Неделя 1 ====
 +
 +
'''Лекция''': Обзор курса: мастер-классы, кейсы, проекты. Форматы данных, способы хранения, принципы работы интернета. Краулинг. Regexp. Unicode.
 +
'''Семинар''': Библиотеки nltk, lxml, beautifulsoup, scrapy

Версия 20:57, 3 сентября 2017

О курсе

Курс читается для студентов 3-го и 4-го курсов ПМИ ФКН ВШЭ в 1-2 модулях.

Лекторы: Петр Алексеевич Ромов, Екатерина Леонидовна Черняк

Лекции проходят по вторникам, 15:10 – 16:30 , ауд. 509.

Полезные ссылки

Карточка курса

Репозиторий с материалами на GitHub: https://github.com/HSE-NLP

Сдача домашних заданий по электронной почте: amilinguaHW@gmail.com

telegram: https://t.me/nlp_hse

Семинары

Группа Преподаватель Расписание
АДИС Дмитрий Фролов вторник, 18:10 – 19:30, ауд. 501
БПМИ141 МОП Анна Шишкова четверг, 13:40 – 15:00, ауд. 322
БПМИ142 МОП Мурат Апишев четверг, 10:30 – 11:50, ауд. 322

Дата выдачи/сдачи дз

TBA

Система оценок

Результирующая оценка рассчитывается по формуле:

Oитоговая = 0.8 * Oнакопл + 0.2 * Оэкз

Накопленная оценка рассчитывается по формуле:

Oнакопл = 0.4 *( Oпроект1 + Oпроект2)/2 + 0.2 * (Одз + Осем)


Программа

Неделя 1

Лекция: Обзор курса: мастер-классы, кейсы, проекты. Форматы данных, способы хранения, принципы работы интернета. Краулинг. Regexp. Unicode. Семинар: Библиотеки nltk, lxml, beautifulsoup, scrapy