Профориентационный семинар (Data Culture) — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
 
(не показано 13 промежуточных версии 2 участников)
Строка 3: Строка 3:
  
 
Цель курса — знакомство слушателей с основами анализа данных.
 
Цель курса — знакомство слушателей с основами анализа данных.
 +
 +
Оценка по курсу составляет 40% от накопленной оценки по Профориентационному семинару и равна
 +
Оср  = (Оср1 + Оср2 + Оср3 + Оср4)/4 (среднее за четыре ДЗ).
  
 
== Преподаватели и контакты==
 
== Преподаватели и контакты==
Строка 24: Строка 27:
  
 
===Ведомости===
 
===Ведомости===
[БСЦ171]
+
'''БСЦ181'''
  
[БСЦ172]
+
[https://docs.google.com/spreadsheets/d/1fUGAPfiJ3qka1mE2VdtHuHwAonkeUPCIJn2ykxAsSEY/edit?usp=sharing 181 ДЗ1 Опрос]
  
[БСЦ173]
+
'''БСЦ182'''
  
[БСЦ174]
+
[https://docs.google.com/spreadsheets/d/1BemCIb07WATm-Naf2t4vjvffBHCRvWUzsYn5kjooODw/edit?usp=sharing 182 ДЗ1 Опрос]
  
[БСЦ175]
+
'''БСЦ183'''
  
[БСЦ176]
+
'''БСЦ184'''
  
[БСЦ177]
+
'''БСЦ185'''
  
[БСЦ178]
+
'''БСЦ186'''
 +
 
 +
'''БСЦ187'''
  
 
== Материалы курса ==
 
== Материалы курса ==
Строка 46: Строка 51:
 
! № !! Неделя !! Тема !! Лекция !! Семинар !! Домашнее задание   
 
! № !! Неделя !! Тема !! Лекция !! Семинар !! Домашнее задание   
 
|-
 
|-
|  1  || 15.04 - 21.04  || Введение в анализ данных и ML || [https://docs.google.com/presentation/d/1LaWeLxyyIJ6t3Ja5Jrm3_3yUOevsCtL8y-wtgUyiBjQ/edit?usp=sharing Лекция 1 Презентация]  || NA || NA  <br />   
+
|  1  || 15.04 - 21.04  || Введение в анализ данных и ML. Введение в постановку гипотез и поиск исследовательского вопроса || [https://docs.google.com/presentation/d/1LaWeLxyyIJ6t3Ja5Jrm3_3yUOevsCtL8y-wtgUyiBjQ/edit?usp=sharing Лекция 1 Презентация]  || [https://docs.google.com/presentation/d/1EAVFuH3QNrmZzxaCmqrtO0hP-eUgVgjnv1WIQeVYUPA/edit?usp=sharing Семинар 1 Презентация]|| [https://docs.google.com/document/d/1r8sOP9c3p7buoSaocgb1xlsJ3fHSNhUS8cPy1mnU21w/edit# ДЗ_1 Опрос Дедлайны, документы, критерии] <br />   
 
|-
 
|-
|  2  || 22.04 - 28.04  || Введение в постановку гипотез и поиск исследовательского вопроса || NA  || [https://docs.google.com/presentation/d/1EAVFuH3QNrmZzxaCmqrtO0hP-eUgVgjnv1WIQeVYUPA/edit?usp=sharing Семинар 1 Презентация] ||<br />  | [https://docs.google.com/document/d/1r8sOP9c3p7buoSaocgb1xlsJ3fHSNhUS8cPy1mnU21w/edit# ДЗ_1 Опрос Дедлайны, документы, критерии]
+
|  2  || 22.04 - 28.04  || Основы работы с Jupyter Notebook и Pandas. Работа с табличными данными, фильтрация и агрегация  || NA  || [https://github.com/rogovich/2019_POS_Sociology/blob/master/Data/2_3_Seminar.zip Titanic.csv] [https://github.com/rogovich/2019_POS_Sociology/blob/master/Files/2_Seminar.ipynb Семинар 2 Блокнот] || NA  || <br />  |
 
|-
 
|-
|  3  || 13.05 - 19.05  ||   ||  || [https://drive.google.com/open?id=11eNDOL50NqJhxF8C1HJ82OitNPnsh2e2 Архив с материалами] [https://www.anaconda.com/distribution/ Здесь можно скачать Анаконду, нужная версия 3.7] ||<br />  |  
+
|  3  || 13.05 - 19.05  ||Big Data и социальные науки. Где брать цифровые данные? Этика, анонимность и данные (лекция). Дескриптивные статистики и работа с пропущенными данными (семинар) || [https://docs.google.com/presentation/d/1zywiWRqB1lpUY1IX9QJ7d4zAn1nuuubN0Nq7zpTCNCE/edit?usp=sharing Лекция 2] || [https://github.com/rogovich/2019_POS_Sociology/blob/master/Files/3_Seminar.ipynb Семинар 3 Блокнот] || [https://github.com/rogovich/2019_POS_Sociology/tree/master/Homework ДЗ2 Работа с табличными данными] || <br />  |  
 
|-
 
|-
|  4  || 20.05 - 26.05 ||   || ||  ||<br />  |  
+
|  4  || 20.05 - 26.05 || Введение в машинное обучение: первое приближение. Методы: kNN и решающие деревья (лекция). Визуализации в Python. Библиотека matploltlib (семинар). || [https://docs.google.com/presentation/d/1MtMYyb65Mg8D85paH-8Z8GDy951LMvV5Uol4pjXArdo/edit?usp=sharing Лекция 3] || [https://github.com/rogovich/2019_POS_Sociology/blob/master/Data/4_Seminar.zip Семинар 4 данные] [https://github.com/rogovich/2019_POS_Sociology/blob/master/Files/4_Seminar.ipynb Семинар 4 Блокнот] || [https://github.com/rogovich/2019_POS_Sociology/tree/master/Homework ДЗ3 Визуализации] || <br />  |  
 
|-
 
|-
|  5  || 27.05 - 02.06  ||   || || ||<br />   
+
|  5  || 27.05 - 02.06  || Разбираем кейс ML: предсказание с помощью решающих деревьев  || NA || [https://github.com/rogovich/2019_POS_Sociology/blob/master/Data/5_Seminar.zip Семинар 5 данные] || [https://github.com/rogovich/2019_POS_Sociology/blob/master/Homework/4_HW_Survey_Analysis.ipynb ДЗ4 Анализ Собранных данных] ||<br />   
 
|-
 
|-
 
|}
 
|}
 +
 +
[https://www.anaconda.com/distribution/ Здесь можно скачать Анаконду, нужная версия 3.7]
 +
Выбираете сперва свою операционную систему, потом нужную версию Анаконды.
 +
<gallery>
 +
Файл:Anaconda.png
 +
</gallery>
 +
После установки у вас на рабочем столе создастся ярлык.
  
 
== Полезные ссылки и материалы ==
 
== Полезные ссылки и материалы ==

Текущая версия на 14:54, 29 мая 2019

О курсе

Курс является частью Профориентационного семинара на 1 курсе ОП "Социология", читается в 4 модуле 2018/2019 учебного года.

Цель курса — знакомство слушателей с основами анализа данных.

Оценка по курсу составляет 40% от накопленной оценки по Профориентационному семинару и равна Оср = (Оср1 + Оср2 + Оср3 + Оср4)/4 (среднее за четыре ДЗ).

Преподаватели и контакты

Рогович Татьяна (лектор) Почта

Группа Семинарист Ассистент Чат группы
БСЦ181, БСЦ182 Рогович Татьяна, Почта Филатов Михаил Почта Чат 181 Чат 182
БСЦ183, БСЦ184 Саркисян Вероника, Почта Глухова Анна Почта Чат 183 Чат 184
БСЦ185 Дайховская Ольга, Почта -- Чат 185
БСЦ186, БСЦ187 Старухин Ярослав, Почта Федоров Павел, Почта Чат 186-187


Ведомости

БСЦ181

181 ДЗ1 Опрос

БСЦ182

182 ДЗ1 Опрос

БСЦ183

БСЦ184

БСЦ185

БСЦ186

БСЦ187

Материалы курса

Неделя Тема Лекция Семинар Домашнее задание
1 15.04 - 21.04 Введение в анализ данных и ML. Введение в постановку гипотез и поиск исследовательского вопроса Лекция 1 Презентация Семинар 1 Презентация ДЗ_1 Опрос Дедлайны, документы, критерии
2 22.04 - 28.04 Основы работы с Jupyter Notebook и Pandas. Работа с табличными данными, фильтрация и агрегация NA Titanic.csv Семинар 2 Блокнот NA
3 13.05 - 19.05 Big Data и социальные науки. Где брать цифровые данные? Этика, анонимность и данные (лекция). Дескриптивные статистики и работа с пропущенными данными (семинар) Лекция 2 Семинар 3 Блокнот ДЗ2 Работа с табличными данными
4 20.05 - 26.05 Введение в машинное обучение: первое приближение. Методы: kNN и решающие деревья (лекция). Визуализации в Python. Библиотека matploltlib (семинар). Лекция 3 Семинар 4 данные Семинар 4 Блокнот ДЗ3 Визуализации
5 27.05 - 02.06 Разбираем кейс ML: предсказание с помощью решающих деревьев NA Семинар 5 данные ДЗ4 Анализ Собранных данных

Здесь можно скачать Анаконду, нужная версия 3.7 Выбираете сперва свою операционную систему, потом нужную версию Анаконды.

После установки у вас на рабочем столе создастся ярлык.

Полезные ссылки и материалы

Базовые учебники

1. David Julian, Designing Machine Learning Systems with Python, PACKT, 2016

2. Gene Kim, Kevin Behr, George Spafford, The Phoenix Project: A Novel About IT, DevOps, and Helping Your Business Win, IT Revolution Press, 2014

3. Jennifer Davis, Katherine Daniels, Effective DevOps: Building a Culture of Collaboration, Affinity, and Tooling at Scale, O'Reilly Media, Inc., 2016

4. Mark C. Layton, Agile Project Management For Dummies, John Wiley & Sons, 2012