Data Science Case Studies (JD SAS) 21/22 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Новая страница: « справа === Расписание занятий === Занятия проводятся по '''субб…»)
 
 
(не показаны 43 промежуточные версии 8 участников)
Строка 2: Строка 2:
 
[[Файл:Capture.PNG|1000px|безрамки|справа]]
 
[[Файл:Capture.PNG|1000px|безрамки|справа]]
  
=== Расписание занятий ===
+
=== Timetable of classes ===
Занятия проводятся по '''субботам'''<br />
+
Classes on '''saturday'''<br />
  
'''Общая ссылка для всех лекций и семинаров:''' https://zoom.us/j/99220349786?pwd=WjFZTEFiQzA4b1lzVmVDbXdmNVMwUT09<br />
+
'''Link to all lectures and workshops:''' https://zoom.us/j/99220349786?pwd=WjFZTEFiQzA4b1lzVmVDbXdmNVMwUT09<br />
  
Идентификатор конференции: 992 2034 9786<br />
+
Conference ID: 992 2034 9786<br />
Код доступа: 476860<br />
+
Code: 476860<br />
 
<br />
 
<br />
'''''9:30''''' - Семинар на русском - ФЭН 3 курс (совместно с БК ГК "Открытие") <br />
+
'''''9:30''''' - Seminar in Russian - Economics 3 year (with GC "Open") <br />
'''''11:10''''' - Семинар на русском - ФЭН 4 курс (совместно с БК ГК "Открытие")<br />
+
'''''11:10''''' - Seminar in Russian - Economics 4 year (with GC "Open")<br />
'''''13:00''''' - Лекция на английском (запись) - ПАД и МИЭФ<br />
+
'''''13:00''''' - English lecture (recording) - DSBA and ICEF<br />
'''''14:40''''' - Лекция на русском (запись) - ПМИ, ФЭН, МК<br />
+
'''''14:40''''' - Russian lecture (recording) - AMI, Economics, Economics and Statistics, Intercampus <br />
'''''16:20''''' - Семинар на русском (запись) - ПМИ и МК<br />
+
'''''16:20''''' - Russian seminar (recording) - AMI, Economics <br />
'''''18:10''''' - Семинар на английском (запись) - ПАД1 и МИЭФ<br />
+
'''''18:10''''' - Russian seminar (recording) - DSBA1 and ICEF<br />
'''''19:40''''' - Семинар на английском - ПАД2<br />
+
'''''19:40''''' - English seminar - DSBA2<br />
 
<br />
 
<br />
  
При посещении лекции и семинара в Zoom просим студентов '''сделать Rename''' и подписаться в формате «Префикс_Фамилия Имя», указав один из префиксов (МИЭФ, МК, ПАД, ПМИ, ФЭН). Например, «БИ_Иванов Алексей»
+
We ask you to '''rename''' and write your name as «Prefix_Last name First name» choosing prefix from (ICEF, DSBA, AMI, Economics), when attending lectures and seminars on Zoom. For example, "DSBA_Oxlong Mike".
  
=== О курсе ===
+
=== About course ===
Данная страничка содержит ссылки на материалы по курсу в 2021/2022 учебном году на потоке образовательных программ :  
+
This page contains links to materials for 2021/2022 course for educational programs:  
 
<br />
 
<br />
  
 
{| class="wikitable"
 
{| class="wikitable"
! Образовательная программа !! Курс !! Факультет !! Ссылка на страницу курса АДвБ
+
! Educational program !! Year !! Faculty !! Link to the DSCS page
 
|-
 
|-
| [https://cs.hse.ru/ami Прикладная Математика и Информатика] || 3 курс || Факультета Компьютерных Наук НИУ ВШЭ || [https://www.hse.ru/edu/courses/339498590 Анализ данных в бизнесе]
+
| [https://www.hse.ru/en/ba/ami/ Applied Mathematics and Computer Science] || 3 year || Faculty of Computer Science, NRU HSE || [https://www.hse.ru/en/edu/courses/339498590 Business Data Analytics]
 
|-
 
|-
| [https://www.hse.ru/ba/data/about Прикладной анализ данных] || 3 курс || Факультета Компьютерных Наук НИУ ВШЭ || [https://www.hse.ru/edu/courses/339492551 Анализ данных в бизнесе]
+
| [https://www.hse.ru/en/ba/data/about/ Bachelor’s Programme 'HSE University and University of London Double Degree Programme in Data Science and Business Analytics'] || 3 year || Faculty of Computer Science, NRU HSE || [https://www.hse.ru/en/edu/courses/339492551 Business Data Analytics]
 
|-
 
|-
| [https://www.hse.ru/ba/economics/ Экономика] || 3 курс || Факультета Экономических Наук НИУ ВШЭ || [https://www.hse.ru/edu/courses/470904614 Анализ данных в бизнесе]
+
| [https://www.hse.ru/en/ba/economics/ Economics] || 3 year || Faculty of Economic Sciences, NRU HSE || [https://www.hse.ru/en/edu/courses/470904614 Business Data Analytics]
 
|-
 
|-
| [https://www.hse.ru/ba/economics/ Экономика] || 4 курс || Факультета Экономических Наук НИУ ВШЭ || [https://www.hse.ru/edu/courses/470904606 Анализ данных в бизнесе]
+
| [https://www.hse.ru/en/ba/economics/ Economics] || 4 year || Faculty of Economic Sciences, NRU HSE || [https://www.hse.ru/en/edu/courses/470904606 Business Data Analytics]
 
|-
 
|-
| [https://www.hse.ru/ba/stat/ Экономика и статистика] || 3 курс || Факультета Экономических Наук НИУ ВШЭ || [https://www.hse.ru/edu/courses/470904618 Анализ данных в бизнесе]  
+
| [https://www.hse.ru/en/ba/stat/ Economics and Statistics] || 3 year || Faculty of Economic Sciences, NRU HSE || [https://www.hse.ru/en/edu/courses/470904618 Business Data Analytics]  
 
|-
 
|-
| [https://www.hse.ru/ba/stat/ Экономика и статистика] || 4 курс || Факультета Экономических Наук НИУ ВШЭ || [https://www.hse.ru/edu/courses/470904610 Анализ данных в бизнесе]  
+
| [https://www.hse.ru/en/ba/stat/ Economics and Statistics] || 4 year || Faculty of Economic Sciences, NRU HSE || [https://www.hse.ru/en/edu/courses/470904610 Business Data Analytics]  
 
|-
 
|-
| [https://www.hse.ru/ba/icef// Программа двух дипломов по экономике НИУ ВШЭ <br />и Лондонского университета] || 3 курс || Международный институт экономики и финансов НИУ ВШЭ || нет
+
| [https://www.hse.ru/en/ba/icef/ Double Degree Program in Economics at the Higher School of Economics and <br /> the University of London] || 3 курс || International Institute of Economics and Finance NRU HSE || No
 
|}
 
|}
 
<br />
 
<br />
дополнительные ссылки:
+
Additional links:
*[https://cs.hse.ru/sas/ Базовая кафедра компании SAS на факультете компьютерных наук ВШЭ ]
+
*[https://cs.hse.ru/en/sas/ Joint Department with SAS at the HSE Faculty of Computer Science ]
*[https://cs.hse.ru/electives/sas_dscs Карточка курса и программа]
+
*[https://cs.hse.ru/electives/sas_dscs Course card and program]
*[https://www.sas.com/ru_ru/home.html Сайт компании  SAS]
+
*[https://www.sas.com/ru_ru/home.html SAS website]
  
*'''[https://www.sas.com/ru_ru/careers/internship-program.html Календарь стажерской программы на 2021/2022 год]'''
+
*'''[https://www.sas.com/ru_ru/careers/internship-program.html Internship program calendar for 2021/2022]'''
  
== Программа курса==
+
== Course program==
  
'''Первый модуль''' будет читаться для 3 и 4 курса - обзор разделов:
+
'''The first module''' will be read for the 3rd and 4th courses - an overview of the sections:
* Клиентская аналитика;
+
* Client analytics;
*       Текстовая аналитика;
+
* Text analytics;
* Задачи анализа данных в розничных сетях продаж товаров;
+
* Tasks of data analysis in retail sales networks of goods;
* Основы оценки рисков;
+
* Fundamentals of risk assessment;
*       ModelOps.
+
*Model Ops.
  
Первый модуль сможет погрузить студентов в актуальные задачи в бизнесе, а также в особенности анализа данных и построения аналитических моделей по каждому разделу модуля.  
+
The first module will be able to immerse students in current business issues, as well as in particular data analysis and analytical model building for each section of the module.
В этом модуле студентов познакомят с программным обеспечением SAS.
+
In this module, students will be introduced to the SAS software.
  
'''Второй модуль''' – командный проект только для 3 курса.
+
'''The second module''' is a team project for the 3rd course only.
  
Студенты будут разделены на группы по 2-7 человек и каждой группе будет дана практическая задача.
+
Students will be divided into groups of 2-7 people and each group will be given a practical task.
Данный модуль позволит получить студентам практический опыт в анализе данных, разработке и в построении аналитических моделей на реальных данных.
+
This module will allow students to gain practical experience in data analysis, development and building analytical models on real data.
  
== Использование и изучение ПО SAS в курсе «Анализ данных в бизнесе»==
+
== Studying and using SAS software in «Data Analytics in Business» course ==
  
Студент по своему желанию может выбирать программный инструмент для выполнения практики: SAS, R, Python.
+
To perform practical tasks, a student is free of choice to pick any of the given software tools: SAS, R, Python.
  
'''Студенты, планирующие выполнять практику на SAS''', могут пройти бесплатно углубленные онлайн курсы.
+
'''Students who plan to perform practical tasks on SAS platform''', may take advanced online courses for free.
  
''Для получения доступа к курсу необходимо обратиться к преподавателю курса Титовой Наталии или написать запрос в Телеграм чате.''
+
''To access the course, you must contact the course instructor - Natalia Titova via Telegram.''
  
'''Если студент выполнил все практические задания на SAS и сдал курс на отлично''', то он может получить:
+
Links to access the software SAS - <br />
*сертификат о прохождении академической программы SAS
+
https://sas-viya.cs.hse.ru/SASStudioV/main?locale=en_US <br />
*электронный бейдж Acclaim, подтверждающий сдачу курса и перечень использованных SAS технологий
+
https://sas-viya.cs.hse.ru/SASStudioV/main?locale=ru_RU
  
Все желающие студенты могут бесплатно пройти базовые онлайн курсы SAS:
+
'''If a student has completed all the practical tasks on the SAS and passed the course with excellence''', then he will receive:
*по основам программирования на SAS Base [https://support.sas.com/edu/schedules.html?id=2588&ctry=RU ссылка на курс]
+
*academic SAS program completion certificate
*по основам статистического анализа с использованием ПО SAS [https://support.sas.com/edu/schedules.html?id=5235&ctry=RU ссылка на курс]
+
*Acclaim electronic badge confirming completion of the course and a list of technologies used by SAS
  
Также желающие студенты, готовые потратить дополнительное время на изучение программирования в SAS, могут бесплатно попробовать сдать профессиональную сертификацию в рамках программы SCYP (SAS® Software Certified Young Professionals) [https://www.sas.com/sas/training/scyp.html ссылка на курс].
+
All interested students can take basic SAS online courses for free:
 +
*basics of programming on SAS Base [https://support.sas.com/edu/schedules.html?id=2588&ctry=RU link to the course]
 +
*basics of statistical analysis using SAS software[https://support.sas.com/edu/schedules.html?id=5235&ctry=RU link to the course]
  
== Лекции ==
+
Students who are willing to spend extra time learning to program in SAS can try to take a professional certification within the SCYP program for free (SAS® Software Certified Young Professionals) [https://www.sas.com/sas/training/scyp.html link to the course].
  
 +
== Lectures ==
  
   '''суббота     '''
+
 
 +
   '''Saturday     '''
 
{| class="wikitable"
 
{| class="wikitable"
'''      ПАД и МИЭФ - 13:00 - 14:30; <br />
+
'''      DSBA & ICEF - 13:00 - 14:30; <br />
'''ПМИ, Экономика, Экономика и статистика, МК - 14:40 - 16:10 '''<br />
+
'''AMI, Economics, Economics & Statistics, Intercampus - 14:40 - 16:10 '''<br />
 
<br />
 
<br />
'''ссылка на подключение к лекции''' - https://zoom.us/j/99220349786?pwd=WjFZTEFiQzA4b1lzVmVDbXdmNVMwUT09<br />
+
'''link to lectures''' - https://zoom.us/j/99220349786?pwd=WjFZTEFiQzA4b1lzVmVDbXdmNVMwUT09<br />
Идентификатор конференции: 992 2034 9786<br />
+
Сonference ID: 992 2034 9786<br />
Код доступа: 476860<br />
+
Сode: 476860<br />
 
|-
 
|-
! Название раздела !! Тема !! Дата для 3 и 4 курса !! Презентация!! Запись
+
! Section name !! Theme!! Date for 3 & 4 year !! Slides !! Recording
 
|-
 
|-
| Клиентская аналитика || Введение в клиентскую и онлайн аналитику || 15.01.2022  || ||  
+
| Client analytics || Intro to client & online analytics || 15.01.2022  || [https://drive.google.com/file/d/1b3Wslg2tgxijoLuhSy7eip1ZE8iQMX_1/view Lecture №1 - RUS] || [https://drive.google.com/file/d/1nEbogpqbZBBrjOJy-sVmq4SdVn_svef6/view?usp=sharing Lecture №1 - RUS]
 
|-
 
|-
| Клиентская аналитика || Построение прогнозных моделей и визуализация данных || 22.01.2022  || ||  
+
| Client analytics || Predictive models & visualizing data || 22.01.2022  || [https://drive.google.com/file/d/18YeB7g3ABo3RCLhDbz_jR2eYarDOChqu/view Lecture №2 - RUS] || [https://drive.google.com/file/d/1qE2bJ5q13pRBxU5n5G4Ucoql8yUKFHY_/view Lecture №2 - RUS]
 
|-
 
|-
| Текстовая аналитика || Введение в задачи анализа текстовых данных || 29.01.2022  || ||  
+
| Text analytics || Intro to text data analysis tasks || 29.01.2022  || [https://drive.google.com/file/d/1FxrHyjZSp0I67v96agB9L5c9ynlcleO3/view?usp=sharing Slides №3 - RUS], [https://drive.google.com/file/d/1ewHktWWM2EoFeYw3yx3W2ydM4s2lWX-3/view?usp=sharing Slides №3 - ENG] || [https://drive.google.com/file/d/198Bq5dSBZmA9mmfuqa6fji1Dv5rHCddu/view Lecture №3 - RUS], [https://drive.google.com/file/d/1_wcmio9ij-DyrS3hhi2DLy7fdXmaWnCc/view?usp=sharing Lecture №3 - ENG]
 
|-
 
|-
| Текстовая аналитика || Инструменты и методы текстовой аналитики || 05.02.2022 || ||   
+
| Text analytics || Tools & methods of text analytics || 05.02.2022 || [https://drive.google.com/file/d/1aDxbh-WjkPXgM5GkZ1nDk0YO_ZEjM-Ym/view?usp=sharing Slides №4 - RUS], [https://drive.google.com/file/d/1CPacF3ca7ZIjgdKD8YDyJOG7poTAOnDJ/view?usp=sharing Slides №4 - ENG] ||  [https://drive.google.com/file/d/1hUoaxTvZvdMajkdkv0Z9sIYsHvvgHo4t/view?usp=sharing Lecture №4 - RUS], [https://drive.google.com/file/d/1_h6bXlPQ7_Wi0fixQdCOq7bdRpuOH7mJ/view?usp=sharing Lecture №4 - ENG]
 
|-
 
|-
| Задачи анализа данных в розничных сетях продаж товаров || Введение в задачи анализа данных в ритейле. Прогнозирование спроса || 12.02.2022 || ||   
+
| Tasks of data analysis in retail || Intro to data analysis in retail. Demand Forecasting || 12.02.2022 || [https://drive.google.com/file/d/1WHZqWR6RttWieTPQToWOAqLaDIhLPAvu/view?usp=sharing Slides №5 - RUS], [https://drive.google.com/file/d/1cps96LPwUPmevmMMNmhuAKLiEMQFmHiR/view?usp=sharing Slides №5 - ENG]  ||  [https://drive.google.com/file/d/1nQP0ZOsu793mGZqKB99_OPs8nQXpgxbG/view?usp=sharing Lecture №5 - RUS], [https://drive.google.com/file/d/1nlim70P7x68knzPL7UwgKFH1f-05GvK1/view?usp=sharing Lecture №5 - ENG]
 
|-
 
|-
| Задачи анализа данных в розничных сетях продаж товаров || Описательная аналитика в Ритейл: кластеризация магазинов, сегментация товаров, восстановление спроса|| 19.02.2022 || ||  
+
| Tasks of data analysis in retail || Descriptive analytics in Retail: store clustering, product segmentation, demand recovery|| 19.02.2022 || [https://drive.google.com/file/d/1x_UIv-ErQgLpiq9D8R4QPSzTyo1fomZ4/view?usp=sharing Slides №6 - RUS], [https://drive.google.com/file/d/1V_HHoJ3jXeEkMHewYYtWRk3YEUgXKTy2/view?usp=sharing Slides №6 - ENG] || [https://drive.google.com/file/d/1HLGiQYXFFkSwM5hOjP3Nc1qrtJxkR4a5/view?usp=sharing Lecture №6 - RUS], [https://drive.google.com/file/d/1np2DNe2Z_-Mc9PT6uaUnyFc6GDilP8SE/view?usp=sharing Lecture №6 - ENG]
 
|-
 
|-
| Задачи анализа данных в розничных сетях продаж товаров || Задачи оптимизации запасов товаров в ритейл-сети, оптимизация цен, оптимизация ассортимента  || 26.02.2022  || ||  
+
| Tasks of data analysis in retail || Optimising stocks of goods in a retail, price optimisation, assortment optimisation || 26.02.2022  || [https://drive.google.com/file/d/153z7PBkPDsr-hD0u3_5Hg2CMEqqEpxW1/view?usp=sharing Slides №7 - RUS], [https://drive.google.com/file/d/1F13GMb9RmP2Z_vRks6ZD3JduehJVvU6O/view?usp=sharing Slides №7 - ENG] || [https://drive.google.com/file/d/13RNMSJGJyHMsy7M4szj9l5MHSSCv2jtT/view?usp=sharing Lecture №7 - RUS], [https://drive.google.com/file/d/1bTMBC5ZuSAoSE6PT_SGbdT-iC990RKty/view?usp=sharing Lecture №7 - ENG] 
 
|-
 
|-
| Основы оценки рисков || Введение в кредитные риски || 5.03.2022  ||  ||  
+
| Basic risk assessment || Intro to Market Risk || 5.03.2022  ||  ||  
 
|-
 
|-
| Основы оценки рисков || Введение в рыночные риски || 12.03.2022  ||  ||  
+
| Basic risk assessment || Intro to Market Risk || 12.03.2022  ||  ||  
 
|-
 
|-
| Основы оценки рисков || Валидация моделей || 19.03.2022  ||  ||  
+
| Basic risk assessment || Model Validation || 19.03.2022  ||  ||  
 
|-
 
|-
| ModelOps || Операционализация моделей машинного обучения || 26.03.2022  ||  ||  
+
| ModelOps || Operationalisation of ML Models || 26.03.2022  ||  ||  
 
|}
 
|}
  
== Семинары ==
+
== Seminars==
  
  '''суббота    
+
  '''Saturday    
'''Группа ФЭН 3 курс - 9:30,<br /> Группы ФЭН 4 курс - 11:10,<br /> Группа ПМИ+МК - 16:20,<br />
+
'''Economics 3 year - 9:30,<br /> Economics 4 year - 11:10,<br /> AMI & Intercampus - 16:20,<br />
'''Группа ПАД 1 и МИЭФ - 18:10,<br /> Группа ПАД 2 - 19:40<br />
+
'''DSBA-1 & ICEF - 18:10,<br /> DSBA-2 - 19:40<br />
  
'''ссылка на подключение к семинару''' - https://zoom.us/j/99220349786?pwd=WjFZTEFiQzA4b1lzVmVDbXdmNVMwUT09<br />
+
'''link to seminars''' - https://zoom.us/j/99220349786?pwd=WjFZTEFiQzA4b1lzVmVDbXdmNVMwUT09<br />
Идентификатор конференции: 992 2034 9786<br />
+
Conference ID: 992 2034 9786<br />
Код доступа: 476860<br />
+
Code: 476860<br />
 +
 
 +
'''link to additional materials''' - [https://drive.google.com/drive/folders/1UNGRXQLbulMkvc-yexPHqZauGvwVJF17?usp=sharing for seminars]<br />
  
 
{| class="wikitable"
 
{| class="wikitable"
 
|-
 
|-
! Название раздела !! Тема !! Дата для ПМИ, ПАД, МИЭФ и МК !! Дата для ФЭН  !!  Презентация !! Запись
+
! Section name !! Theme!! Date for AMI, DSBA, ICEF & Intercampus !! Date for Economics !!  Slides !! Recording
 
|-
 
|-
| Клиентская аналитика || Введение в клиентскую и онлайн аналитику || 15.01.2022 || 22.01.2022 || ||  
+
| Client analytics || Intro to client and online analytics || 15.01.2022 || 22.01.2022 || [https://drive.google.com/file/d/1b3Wslg2tgxijoLuhSy7eip1ZE8iQMX_1/view Slides №1 - RUS] || [https://drive.google.com/file/d/1j9-eoZSxLfprqsg_cpqnUfTNLwt_Rhpn/view?usp=sharing Seminar №1 - RUS]
 
|-
 
|-
| Клиентская аналитика || Построение прогнозных моделей и визуализация данных ||22.01.2022 || 29.01.2022 ||  ||  
+
| Client analytics || Predictive models & visualizing data ||22.01.2022 || 29.01.2022 ||  || [https://drive.google.com/file/d/15oev17SngGJRj3s1TduqkqSm4ZOPD2aK/view Slides №2.1 - RUS], [https://drive.google.com/file/d/1DoDLCCOkJrBDb3xfBV2CgpRYwnYV7081/view Seminar №2.2 - RUS]
 
|-
 
|-
| Текстовая аналитика || Введение в задачи анализа текстовых данных || 29.01.2022 || 05.02.2022 || ||  
+
| Text analytics || Intro to text data analysis tasks || 29.01.2022 || 05.02.2022 || [https://drive.google.com/file/d/1iU0te3dUC_ZUgiq0T2S1Zb7KCE5apvPu/view?usp=sharing Slides №3 - RUS], [https://drive.google.com/file/d/1tD98fE8GDREpapVoa_B4PPm1SMyV4XxB/view?usp=sharing Slides №3 - ENG] || [https://drive.google.com/file/d/1CdCXvizg4WM4iFSsiLo1Raa_7v4HLuCA/view?usp=sharing Seminar №3 - RUS] [https://drive.google.com/file/d/1D6pwgtBBxYTmGSYF2mnpLdNNrd6K5TZw/view?usp=sharing Seminar №3 - ENG]
 
|-
 
|-
| Текстовая аналитика || Инструменты и методы текстовой аналитики || 05.02.2022 || 12.02.2022 || ||
+
| Text analytics || Tools & methods of text analytics || 05.02.2022 || 12.02.2022 || [https://drive.google.com/file/d/1CTiq3gwA-R8P-TI0sM4OFJZNCqKuVdrB/view?usp=sharing Slides №4 - RUS], [https://drive.google.com/file/d/1YAwdsFH5bWhY6EoD49Y3lCROaF0aoVue/view?usp=sharing Slides №4 - ENG] || [https://drive.google.com/file/d/1JiTiaUHGVN46Jiz6kA22RcVMxSympskl/view?usp=sharing Seminar №4 - RUS], [https://drive.google.com/file/d/17mRNqP6yVLAT5ivU5BuJp18Q_GOEBCxU/view?usp=sharing Seminar №4 - ENG]
 
|-
 
|-
| Задачи анализа данных в розничных сетях продаж товаров || Введение в задачи анализа данных в ритейле. Прогнозирование спроса || 12.02.2022 || 19.02.2022 ||  ||   
+
| Tasks of data analysis in retail || Intro to data analysis in retail. Demand Forecasting || 12.02.2022 || 19.02.2022 ||  ||   
 
|-
 
|-
| Задачи анализа данных в розничных сетях продаж товаров || Описательная аналитика в Ритейл: кластеризация магазинов, сегментация товаров, восстановление спроса || 19.02.2022 || 26.02.2022 ||  ||  
+
| Tasks of data analysis in retail || Descriptive analytics in Retail: store clustering, product segmentation, demand recovery || 19.02.2022 || 26.02.2022 ||  ||  
 
|-
 
|-
| Задачи анализа данных в розничных сетях продаж товаров || Задачи оптимизации запасов товаров в ритейл-сети, оптимизация цен, оптимизация ассортимента || 26.02.2022 || 5.03.2022 || ||  
+
| Tasks of data analysis in retail || Optimising stocks of goods in a retail, price optimisation, assortment optimisation || 26.02.2022 || 5.03.2022 || ||  
 
|-
 
|-
| Основы оценки рисков || Введение в кредитные риски || 5.03.2022 || 12.03.2022 ||  ||  
+
| Basic risk assessment || Intro to Market Risk || 5.03.2022 || 12.03.2022 ||  ||  
 
|-
 
|-
| Основы оценки рисков || Введение в рыночные риски || 12.03.2022 || 19.03.2022 ||  ||  
+
| Basic risk assessment || Intro to Market Risk || 12.03.2022 || 19.03.2022 ||  ||  
 
|-
 
|-
| Основы оценки рисков || Валидация моделей || 19.03.2022 || 26.03.2022 ||  ||  
+
| Basic risk assessment || Model Validation || 19.03.2022 || 26.03.2022 ||  ||  
 
|-
 
|-
| ModelOps || Операционализация моделей машинного обучения || 26.03.2022 || 2.04.2022 ||  ||  
+
| ModelOps || Operationalisation of ML Models || 26.03.2022 || 2.04.2022 ||  ||  
 
|}
 
|}
  
== Отчётность по курсу и критерии оценки ==
+
== Course report and grade evaluation ==
  
В курсе предусмотрено несколько форм контроля знания:
+
The course includes several forms of knowledge control:
* 3 практических домашних задания
+
* 3 practical homework assignments
* Письменный экзамен, вопросы в виде теста с вариантами ответов
+
* Written exam, questions in the form of a test with multiple choice
* Командный проект ( только для 3 курса )
+
* Team project (only for 3rd-year students)
  
'''Критерии оценки знаний, навыков'''
+
'''Criteria for assessing knowledge, skills'''
  
*Оценки за все домашние задания выставляются по 2-балльной шкале, где «2» — задание решено полностью, «1» — задание решено не полностью или с недочётами, «0» — задание не решено или решено неверно.  
+
*All homework assignments are graded on a 2-point scale, where «2» — task is fully completed, «1» — the task is not completely solved or with slight mistakes, «0» — task is not solved or solved incorrectly.  
  
Если домашнее задание разбито на несколько частей, то каждая часть оценивается по 2-балльной шкале как описано выше, а затем оценки усредняются с равными весами без округления.  
+
In case if the homework is divided into several parts, then each part is evaluated on a 2-point scale as described above, and then the marks are averaged with equal weights without rounding.
  
Перевод оценки за домашние задания из 2-балльной шкалы в 10-балльную проводится путём умножения оценки на 5 без округления.  
+
The transfer of grades for homework from a 2-point scale to a 10-point scale is done by means of multiplying the grade by 5 without any rounding.
  
*Оценка за экзамен выставляется по 10-балльной шкале.  
+
*The grade for the exam is set on a 10-point scale.  
  
*Оценка за командный проект выставляется по 10-балльной шкале.
+
*The grade for the team project is also set on a 10-point scale.
  
'''Порядок формирования оценок по дисциплине'''
+
'''The order of the formation of grades for the discipline '''
  
Пусть оценки за 3 домашних задания по 10-балльной шкале —  '''O_1,O_2,O_3,''' а оценка за экзамен в конце первого модуля по 10-балльной шкале — '''O_экз'''.  
+
Let's denote the grades for 3 homework assignments on a 10-point scale —  '''O_1,O_2,O_3,''' and the grade for the exam at the end of the 1st module on a 10-point scale — '''O_ex'''.  
  
  
Итоговая оценка для студентов ''4 курса'' '''O_итог''' рассчитывается по формуле
+
The final grade for 4th-year students  '''O_final''' is evaluated by the  following formula
  
'''O_итог = 0.225 * O_1 + 0.225 * O_2 + 0.225 * O_3 + 0.325 * O_экз'''
+
'''O_final = 0.225 * O_1 + 0.225 * O_2 + 0.225 * O_3 + 0.325 * O_ex'''
  
  
Итоговая оценка для студентов ''3 курса'' в первом модуле '''O_мод''' рассчитывается по формуле
+
The final grade for 3rd-year students in the 1st module '''O_mod''' is evaluated by the following formula
  
'''O_мод = 0.1 * O_1 + 0.1 * O_2 + 0.1 * O_3 + 0.2 * O_экз'''
+
'''O_mod = 0.1 * O_1 + 0.1 * O_2 + 0.1 * O_3 + 0.2 * O_ex'''
  
Оценка за проект во втором модуле '''O_пр''' выставляется по 10-балльной шкале по итогам защиты проекта.  
+
The grade for the project in the 2nd module '''O_prj''' is set on a 10-point scale by means of the project defense.  
  
Итоговая оценка '''O_итог''' определяется по формуле '''O_итог = O_мод + 0.5 * O_пр'''
+
The final grade '''O_final''' is defined by the formula '''O_final = O_mod + 0.5 * O_prj'''
  
  
Округление происходит только в самом конце — в итоговой оценке. Округление арифметическое.  
+
Rounding occurs only at the very end - in the final grade, i.e. arithmetic rounding.
 
   
 
   
Каждое задание и экзамен оцениваются по 10-балльной шкале (по заданиям допускается дробная оценка). За некоторые задания можно будет получить бонусные баллы, о чем будет объявляться при выдаче задания.
+
Each task and exam is evaluated on a 10-point scale (fractional marks are allowed for tasks). For some tasks, it will be possible to receive bonus points, which will be announced when the task is issued.
  
== Домашние задания ==
+
== Home assignments ==
  
'''Домашнее задание №1'''
+
'''Home assignment #1'''
  
Задание состоит из 2 частей:
+
The home task #1 consists of 2 parts:
  
1. Исследование данных и обработка данных для проведения последующей сегментации;
+
1. Data research and data processing for subsequent segmentation;
  
2. Составить профили клиентов на основе проведенных сегментаций (использовать минимум 2 метода сегментации).
+
2. Making customer profiles based on segmentations (use at least 2 segmentation methods).
  
 +
An example of a detailed description of Home assignment №1 2020-2021 with examples and results [https://drive.google.com/file/d/16WFqo1xfPvnlGLwyorWFGdiL2ZM8xp8D/view?usp=sharing read in the attached file]
  
Пример подробного описания Домашнего задания №1 2020-2021 уч.года с примерами и результатами [https://drive.google.com/file/d/16WFqo1xfPvnlGLwyorWFGdiL2ZM8xp8D/view?usp=sharing читай в приложенном файле]
+
Each student chooses the version that is indicated opposite his name in the list
 +
[https://docs.google.com/spreadsheets/d/19HGjq6sUJ__0Cg0akOr7AIivKvIRh7ttas_9QE4Q3E0/edit?usp=sharing link]
  
 +
Versions and data description are presented [https://drive.google.com/open?id=1jxwwFMEHVh91ZKx5_PqnMSUlsICytIbI in the folder at the link]
  
Каждый студент выбирает вариант, который указан напротив его ФИО в списке
+
In order to receive an assessment, you need:
[https://docs.google.com/spreadsheets/d/19HGjq6sUJ__0Cg0akOr7AIivKvIRh7ttas_9QE4Q3E0/edit?usp=sharing по ссылке]
+
  
 +
1. Send an archive with files where all calculations were made and a cover letter with conclusions and comments on
 +
each part:
  
Варианты и описание данных представлены  [https://drive.google.com/open?id=1jxwwFMEHVh91ZKx5_PqnMSUlsICytIbI в папке по ссылке]
+
* Calculations can be done using code (python/sas/sql), pivot tables and formulas in excel or SAS Viya project;
 +
* All conclusions must be supported by visually interpretable graphs and data.
  
 +
2. The archive (.zip) with the files must be sent to ntitova@hse.ru with the email subject “FCS HSE”
  
Для того, чтобы получить оценку, требуется:
+
3. The file name must be sent according to the template <First Name>_<Last name>_<group number>_hw1.zip.
  
1. Прислать архив с файлами, где производились все расчеты и сопроводительное письмо с выводами и комментариями по
+
For example, Alexander_Sharipov_156_hw1
каждой части:
+
  
* Расчеты могут производиться через код (python/sas/sql), сводные таблицы и формулы в excel или проект SAS Viya;
+
'''Grade for Home assignment #1''' is given on a 10-point scale, where:
* Все выводы необходимо подтверждать визуально интерпретируемыми графиками и данными.
+
  
2. Архив (.zip) с файлами требуется отправить на почту ntitova@hse.ru с темой «ФКН ВШЭ»
+
"8-10" - the task is completely solved, all 2 parts of homework are completed:
 +
* data analysis was carried out, a code is working, and tables for data research were provided;
 +
* constructed segmentation by 2 methods;
 +
* provided clear conclusions with confirmed data (tables, graphs);
  
3. Название файла требуется отправлять по шаблону <Имя>_<Фамилия>_<номер группы>_hw1.zip.
+
"6-7" - the task is solved incompletely or with shortcomings:
 +
* data analysis was carried out, a working code and tables for data research were provided;
 +
* built segmentation using at least one method;
 +
* provided clear conclusions with confirmed data (tables, graphs);
  
Пример, Alexander_Sharipov_156_hw1
+
"4-5" - the task was solved with significant shortcomings,
 +
* data analysis was carried out, a working code and tables for data research were provided;
 +
* revealed top-level dependencies and patterns for customers without building a segmentation model;
  
 +
"0-3" - the task is not solved or solved incorrectly.
  
 +
''Deadline – 2 weeks (February 19, 2022 23:59).''
  
'''Оценка за  домашнее задание  №1''' выставляется по 10-балльной шкале, где:
+
'''Home assignment #2'''
  
«8-10» — задание решено полностью, выполнены все 2 части домашней работы:
+
Description of Home assignment #2 is in the file [https://drive.google.com/file/d/1R6BLH40CLk7uewRn02JlGj64Ov2peJgK/view?usp=sharing link]
* проведен анализ данных, предоставлен рабочий код и таблицы по исследованию данных;
+
* построены сегментации 2-мя методами;
+
* предоставлены понятные выводы с подтверждёнными данными (таблицы, графики);
+
  
«6-7» —задание решено неполностью или с недочётами:
+
''Deadline - March 12, 2022 23:59.''
* проведен анализ данных, предоставлен рабочий код и таблицы по исследованию данных;
+
Solutions should be sent to aromanenko@hse.ru
* построена сегментация хотя бы одним методом;
+
* предоставлены понятные выводы с подтверждёнными данными (таблицы, графики);
+
  
«4-5» —задание решено с существенными недочетами,
+
The subject of the letter must contain the following: HSE + Course number + version_number + full name.
* проведен анализ данных, предоставлен рабочий код и таблицы по исследованию данных;
+
* выявлены верхнеуровневые зависимости и закономерности по клиентам без построения модели сегментации;
+
  
«0-3» — задание не решено или решено неверно.
+
The file name must include:
  
''Срок сдачи – 2 недели (19 февраля 2022 23:59).''
+
*Course number
 +
*Version number
 +
*Full name
  
 +
Example: "AMIS_3course_Version_8_IvanovIvanIvanovich"
  
'''Домашнее задание №2'''
+
'''Home assignment #3'''
  
Описание ДЗ 2 находится в файле [https://drive.google.com/file/d/1R6BLH40CLk7uewRn02JlGj64Ov2peJgK/view?usp=sharing по ссылке]
+
It is necessary to build a scoring model that assesses the probability of a client default at the stage of making a loan application.
 +
To do this you need:
  
''Срок сдачи – 12 марта 2022 23:59.''
+
0. Download data from the link https://drive.google.com/drive/u/0/folders/16CMyPnLu7Fv7IgsYOZimQK-7MaFZEWEZ
Решения присылать на почту aromanenko@hse.ru
+
  
В теме письма обязательно должно быть следующее:  ВШЭ + Номер курса+номер_вариант+ФИО.  
+
Each student selects 2 data samples "accept" and "reject", which start with the student's HW version.
 +
Version numbers for HW #3 must be taken the same as for HW #1.
  
В названии файла необходимо указать:
+
The completed task must be sent in the following form:
*Номер курса
+
*Номер варианта
+
*ФИО
+
  
Пример: «ПМИ_3курс_Вариант_8_ИвановИванИванович»
+
1) File/scripts with built models (there must be comments, without comments the task is considered as unresolved)
  
 +
2) Excel file with answers to the following questions:
  
'''Домашнее задание №3'''
+
1. What is the proportion of 1 in the "accept" sample?
  
Необходимо построить скориниговую модель, оценивающую вероятность дефолта клиента на стадии заведения кредитной заявки.
+
2. It is necessary to calculate the following for all interval variables:
Для этого необходимо:
+
- Proportion of missing values
 +
- Median
 +
- Mean
 +
- Standard deviation
 +
- Are there any abnormal values, outliers?
 +
- Information Value
 +
3. It is necessary to calculate for all categorical variables the following:
 +
- Mode
 +
- Proportion of missing values
 +
- Information Value
 +
- Are there outliers, abnormal values?
 +
4. Build logistic regression only on approved applications with transformed WoE variables. What is the meaning of GINI? F1 measure?
  
0. Скачать данные по ссылке https://drive.google.com/drive/u/0/folders/16CMyPnLu7Fv7IgsYOZimQK-7MaFZEWEZ
+
5. Conduct a Reject Inference analysis. What is the percentage of rejected applications?
  
Каждый студент выбирает 2 выборки "accept" и "reject", которые начинаются с варианта студента.  
+
6. Build a logistic regression on all applications with transformed WoE variables. What GINI, F1 mean? Has the model changed?
Номера вариантов для ДЗ №3 необходимо взять  такие же как и для ДЗ №1
+
  
Выполненное задание необходимо отправить в следующем виде:
+
7. What model would you recommend for implementation in a productive environment? Give a detailed explanation
  
1) Файл/скрипты с построенными моделями (обязательно должны быть комментарии, без комментариев задание считается нерешенным)
+
Assessment for HW #3 is set on a 2-point scale, where "2" - the task is solved completely, "1" - the task is not completely solved or with shortcomings, "0" - the task is not solved or solved incorrectly.
 +
The transfer of grades for homework from a 2-point scale to a 10-point scale is carried out by multiplying the grade by 5 without rounding.
  
2) Excel файл с ответами на следующие вопросы:  
+
For HW #3, marks will be given:  
 +
"2" - the model is correctly built on both the accept and reject samples. Correct answers given.
 +
"1.6" - the model is correctly built both on the accept sample and on the reject sample. 50% of answers are correct.
 +
"1.4" - the model is correctly built both on the accept sample and on the reject sample. Wrong answers are given.
 +
"1" are given - the model is built only on the accept sample.
 +
"0.8" - the task is not completely solved. 50% of answers are correct.
 +
"0" - the task is not solved or solved incorrectly.
  
1. Какая доля 1 в выборке "accept"?
+
Deadline - until 26.03.2022 (including 26.03.2022)
  
2. Необходимо рассчитать для всех интервальных переменных следующее:
+
Decisions should be sent to msvorobeva@hse.ru
  - Доля пропущенных значений
+
The subject of the letter must contain the following: HSE + Course number + version_number + full name.
  - Медиана
+
  - Среднее
+
  - Среднеквадратическое отклонение
+
  - Есть ли аномальные значения, выбросы?
+
  - Information Value
+
3. Необходимо рассчитать для всех категориальных переменных следующее:
+
  - Мода
+
  - Доля пропущенных значений
+
  - Information Value
+
  - Есть ли выбросы, аномальные значений
+
4. Построить логистическую регрессию только на одобренных заявках с преобразованными переменными WoE. Какое значение GINI? F1 мера?
+
  
5. Провести анализ Reject Inference. Какая доля отказанных заявок?
+
The file name must include:
  
6. Построить логистическую регрессию на всех заявках с преобразованными переменными WoE. Какое значение GINI, F1? Изменилась ли модель?
+
*Course number
 +
*Version number
 +
*Full name
  
7. Какую модель вы рекомендуете для внедрения в продуктивную среду? Дать развернутое пояснение
+
Example: "AMIS_3course_Version_8_IvanovIvanIvanovich"
 
+
  
Оценка за  домашние задания  №3 выставляется по 2-балльной шкале, где «2» — задание решено полностью, «1» — задание решено не полностью или с недочётами, «0» — задание не решено или решено неверно.
+
If the works will repeat each other, both works will be considered unresolved.
Перевод оценки за домашние задания из 2-балльной шкалы в 10-балльную проводится путём умножения оценки на 5 без округления.
+
  
За домашнюю работу №3  будут выставляться оценки:
+
== Team project for 3rd course ==
«2» – правильно построена модель и на выборке accept, и на выборке reject. Даны верные ответы.
+
«1,6» – правильно построена модель и на выборке accept, и на выборке reject. 50% ответов верные.
+
«1,4» – правильно построена модель и на выборке accept, и на выборке reject. Даны неверные ответы
+
«1» - построена модель только на выборке accept.
+
«0,8» - задание решено не полностью. 50% ответов верные.
+
«0» — задание не решено или решено неверно.
+
  
''Срок сдачи –  до 26.03.2022 включительно''
+
'''Choosing a topic for a team project on the course "Data Science Case Studies (JD SAS)" '''
 
+
Решения присылать на почту msvorobeva@hse.ru
+
В теме письма обязательно должно быть следующее:  ВШЭ + Номер курса+номер_вариант+ФИО.
+
 
+
В названии файла необходимо указать:
+
*Номер курса
+
*Номер варианта
+
*ФИО
+
 
+
 
+
Пример: «ПМИ_3курс_Вариант_8_ИвановИванИванович»
+
 
+
Если работы будут повторять друг друга, обе работы будут считаться нерешенными.
+
 
+
== Командный проект для 3 курса ==
+
 
+
'''Выбор темы для командного проекта по курсу "Анализ данных в бизнесе" '''
+
 
   
 
   
Студенты делятся на группы по 3 человека. В дальнейшем 2-3 группы могут соединить в одну. Внутри группы должен быть определен капитан команды - ответственное лицо группы.
+
Students are divided into groups of 3 people. In the future, 2-3 groups can be combined into one. Within the group, the team captain must be determined - the responsible person of the group.
 
+
Ответственное лицо отвечает за выполнение и результат следующих основных функций:
+
*  отправка заявки на тему проекта и согласование темы проекта от лица всей группы с преподавателями;
+
*  предоставление информации куратору о текущем статусе проекта: учет, распределение и контроль выполнения задания по проекту;
+
*  отправка отчетов, презентаций, технической документации по выполненными работам группы в электронном виде.
+
 
+
  
Описания тем проектов: [https://docs.google.com/document/d/1p_gECsEVi95_3-WW2eBJaA3yEGCJBzejDILSkPQDX7c/edit?usp=sharing ссылка на файл]
+
The responsible person is responsible for the performance and result of the following main functions:
 +
*  sending an application for a project topic and agreeing on a project topic on behalf of the whole group with professors;
 +
*  providing information to the curator about the current status of the project: accounting, distribution and control of the implementation of the project task;
 +
*  sending reports, presentations, technical documentation on the work performed by the group in electronic form.
  
Ссылка на форму подачи заявки на тему: [https://forms.gle/QG2SwvYZ5tN2Pwow5 ссылка на файл]
+
Project topic descriptions: [https://docs.google.com/document/d/1p_gECsEVi95_3-WW2eBJaA3yEGCJBzejDILSkPQDX7c/edit?usp=sharing link to file]
  
 +
Link to the application form on the topic: [https://forms.gle/QG2SwvYZ5tN2Pwow5 link to file]
  
'''Сроки выбора тем:'''
 
  
'''До 17 апреля группа должна  выбрать две темы из указанного списка''', указав первый и второй приоритет для этих тем.
+
'''Topic selection deadlines:'''
  
'''18 апреля - каждой группе, которая подала заявку на проект, через указанную форму, будет назначена тема проекта и куратор.''' При назначении тем будут учитываться приоритеты указанные студентами, а также средний балл студентов в группе по первому модулю курса. На одну тему назначается не более 3-х групп студентов.
+
'''Until April 17, the group must select two topics from the specified list''', indicating the first and second priority for these topics.
  
 +
'''April 18 - each group that has applied for the project, through the specified form, will be assigned a project topic and curator.''' While assigning topics, the priorities indicated by the students will be taken into account, as well as the average score of students in the group for the first module of the course. No more than 3 groups of students are assigned to one topic.
  
При возникновении вопросов пишите в Telegram Титовой Наталии.
+
If you have any questions, write to Natalia Titova on Telegram.
  
  
Итогом каждого проекта должна быть презентация результатов проекта на 10-15 минут.  
+
The result of each project should be a presentation of the results of the project for 10-15 minutes.
  
Защита проекта для ПАД и МИЭФ будет в середине мая  (17-22 мая), а также для всех желающих, которые готовы будут защититься.  
+
The defense of the project for DSBA and ICEF will be in mid-May (May 17-22), as well as for everyone who is ready to defend themselves.
  
Финальная защита для ПМИ, ФЭН  пройдет в середине июня (15-19 июня) до начала сессии.  
+
The final defense for AMIS, Economics, Economics and Statistics will take place in mid-June (June 15-19) before the start of the session.
  
Оценка за проект во втором модуле выставляется по 10-балльной шкале по итогам защиты проекта.
+
The assessment for the project in the second module is set on a 10-point scale based on the results of the defense of the project.
  
Те студенты, которые не нашли себе группу  тоже подают заявку на тему, но на одного себя. Мы сами соединим с группой по схожей теме.
+
Those students who did not find a group for themselves also apply for a topic, but for themselves alone. We ourselves will connect with a group on a similar topic.
  
  
'''Даты защиты учебных проектов в 4 модуле:'''
+
'''Dates for the defense of educational projects in module 4:'''
  
Защиты проектов пройдут с 17 по 19 июня 2021 года.
+
Project defenses will be held from 17 to 19 June 2021.
  
В файле по ссылке вы найдете список проектных групп с привязкой к дате и времени защиты, а так же ссылки для подключения к самим защитам.  
+
In the file you will find a link to the list of project groups with reference to the date and time of project defense, as well as links to defenses.
  
[https://docs.google.com/spreadsheets/d/127uq1MwiwZlPahfLj1AwBAuxMdpp44EM6hlYiLnYKyI/edit?usp=sharing Командные проекты - даты защит по группам и ссылки на подключение.]
+
[https://docs.google.com/spreadsheets/d/127uq1MwiwZlPahfLj1AwBAuxMdpp44EM6hlYiLnYKyI/edit?usp=sharing Team projects - dates for defenses by groups and links to join.]
  
== Задать вопрос по курсу ==
+
== How to ask a question about the course ==
'''Вопросы''' по курсу можно задавать в telegram чат курса, преподавателю курса Титовой Наталии @Natalitics или менеджеру кафедры SAS Лобок Татьяне (@tatianalobok) tlobok@hse.ru.
+
  
 +
'''Questions''' about the course can be asked in the telegram chat of the course, the course professor Natalia Titova @Natalitics or the manager of the SAS department Tatiana Lobok @tatianalobok (tlobok@hse.ru).
  
Канал в telegram для объявлений: https://t.me/+Lj-yHhfNJTQxYWEy
+
Telegram channel for announcements: https://t.me/+Lj-yHhfNJTQxYWEy
  
Чат в telegram для обсуждений: https://t.me/+a1VMTe2xwNA5Mzcy
+
Chat in telegram for discussions: https://t.me/+a1VMTe2xwNA5Mzcy
  
  
''' Все объявления и материалы по курсу будут выкладываться в чате и в канале telegram! '''
+
''' All announcements and course materials will be posted in the telegram chat and in the telegram channel! '''
Преподаватели в чате бывают, но не всегда.  
+
There are professors in the chat, but not always.
По всем важным вопросам стоит писать преподавателю Титовой Наталии в чате telegram @Natalitics или на почту Natalia.Titova@sas.com. В название письма обязательно добавлять тег [ПМИ ФКН ВШЭ/ПАД ФКН ВШЭ/МИЭФ ФКН ВШЭ/Эк ФЭН ВШЭ/ЭкСт ФЭН ВШЭ], а также указывать свою фамилию и имя.
+
For all important questions, you should write to Natalia Titova in the telegram chat @Natalitics or mail Natalia.Titova@sas.com. Be sure to add the tag [AMIS FCS HSE/DSBA FCS HSE/ICEF FCS HSE/Ec FES HSE/EcSt FES HSE] to the title of the letter, and also indicate your last name and first name.
  
Все приведенные файлы предназначены для использования студентами во время обучения и обновляются в течение года.
+
All files provided are intended for use by students during their studies and are updated throughout the year.
По найденным опечаткам, неточностям, сбоям работы странички просьба писать на электронную почту tlobok@hse.ru.
+
If you find any typos, inaccuracies, malfunctions of the page, please send email tlobok@hse.ru.
  
== Материалы по курсу ==
+
== Course materials ==
'''Документы и программа курса'''
+
'''Documents and program of the course'''
''Внимание: файлы обновляются!''
+
''Attention: files are being updated!''
  
*Рабочая программа дисциплины для 3 и 4 курса можно найти по следующей [https://docs.google.com/document/d/1Sh-KjlZlAmk1kIEndmM7mF7nAj6iL6ZI/edit?usp=sharing&ouid=109416058723510784590&rtpof=true&sd=true ссылке].  
+
*The working program of the discipline for the 3rd and 4th courses document is located at the following [https://docs.google.com/document/d/1Sh-KjlZlAmk1kIEndmM7mF7nAj6iL6ZI/edit?usp=sharing&ouid=109416058723510784590&rtpof=true&sd=true link].  
  
*'''[https://drive.google.com/open?id=1J7MHkux4wBq828_6Lg3trCmkxdutXV1K Инструкция по подключению к SAS OnDemand и скачиванию ПО SAS]'''
+
*'''[https://drive.google.com/open?id=1J7MHkux4wBq828_6Lg3trCmkxdutXV1K Instructions for connecting to SAS OnDemand and downloading SAS software]'''
  
*[https://drive.google.com/open?id=1ANDlimb5hp4ds0sUcReR6xq5sVrcX5n9 Лекции и семинары]  ''Внимание: файлы в папке обновляются!''
+
*[https://drive.google.com/open?id=1ANDlimb5hp4ds0sUcReR6xq5sVrcX5n9 Lectures and seminars]  ''Attention: files in the folder are being updated!''
  
== Рекомендуемая литература и полезные дополнительные материалы ==
+
== Recommended literature and useful additional materials ==
  
'''Полезные материалы'''
+
'''Useful materials'''
  
*[https://support.sas.com/en/software/enterprise-guide.html#freetutorials Обучающий портал с дополнительной литературой для работы с SAS Enterprise Guide]
+
*[https://support.sas.com/en/software/enterprise-guide.html#freetutorials Training portal with additional literature for working with SAS Enterprise Guide]
*[https://habr.com/company/sas/blog/ Блок компании  SAS на хабре (Основы программирования на SAS Base)]
+
*[https://habr.com/company/sas/blog/ SAS Company's block on Habr (Basics of programming on SAS Base)]
  
  
'''Полезная литература'''
+
'''Useful literature'''
  
''К разделу 1:''
+
''Section 1:''
 
*[https://www.sas.com/store/books/categories/business-concepts-leadership/data-mining-techniques-for-marketing-sales-and-customer-relationship-management-third-edition/prodBK_64447_en.html Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management, Third Edition Michael J. A. Berry Gordon S. Linoff ]
 
*[https://www.sas.com/store/books/categories/business-concepts-leadership/data-mining-techniques-for-marketing-sales-and-customer-relationship-management-third-edition/prodBK_64447_en.html Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management, Third Edition Michael J. A. Berry Gordon S. Linoff ]
 
*[https://www.springer.com/gp/book/9780387725789  Database Marketing. Analyzing and Managing Customers, Blattberg, Robert C., Kim, Byung-Do, Neslin, Scott A. ]
 
*[https://www.springer.com/gp/book/9780387725789  Database Marketing. Analyzing and Managing Customers, Blattberg, Robert C., Kim, Byung-Do, Neslin, Scott A. ]
Строка 440: Строка 436:
  
  
''К разделу 2:''
+
''Section 2:''
  
 
* Шапиро Дж (2006). Моделирование цепи поставок. Питер. Серия «Теория менеджмента».
 
* Шапиро Дж (2006). Моделирование цепи поставок. Питер. Серия «Теория менеджмента».
Строка 446: Строка 442:
  
  
''К разделу 3:''
+
''Section 3:''
  
 
* Christoffersen P. (2012) Elements of Financial Risk Management. 2nd ed. Elseiver Academic Press.
 
* Christoffersen P. (2012) Elements of Financial Risk Management. 2nd ed. Elseiver Academic Press.
  
''К разделу 4:''
+
''Section 4:''
  
 
* Мортон С. (2016) Лаборатория презентаций. Формула идеального выступления. Альпина Паблишер.
 
* Мортон С. (2016) Лаборатория презентаций. Формула идеального выступления. Альпина Паблишер.
  
== Контакты  ==
+
== Contacts ==
  
[[Файл:Титова Наталья Николаевна.jpg|микро|70px|безрамки|слева]] '''Титова Наталия Николаевна''' - старший преподаватель
+
[[Файл:Титова Наталья Николаевна.jpg|микро|70px|безрамки|слева]] '''Titova Natalia Nikolaevna''' - Senior tutor
 
Natalia.Titova@sas.com
 
Natalia.Titova@sas.com
  
Строка 462: Строка 458:
  
  
[[Файл:Лобок Татьяна Сергеевна.jpg|микро|70px|безрамки|слева]] '''Лобок Татьяна Сергеевна''' - менеджер базовой кафедры SAS
+
[[Файл:Лобок Татьяна Сергеевна.jpg|микро|70px|безрамки|слева]] '''Lobok Tatiana Sergeevna''' - Manager of the basic SAS Department
 
tlobok@hse.ru
 
tlobok@hse.ru

Текущая версия на 09:54, 28 февраля 2022

Capture.PNG

Timetable of classes

Classes on saturday

Link to all lectures and workshops: https://zoom.us/j/99220349786?pwd=WjFZTEFiQzA4b1lzVmVDbXdmNVMwUT09

Conference ID: 992 2034 9786
Code: 476860

9:30 - Seminar in Russian - Economics 3 year (with GC "Open")
11:10 - Seminar in Russian - Economics 4 year (with GC "Open")
13:00 - English lecture (recording) - DSBA and ICEF
14:40 - Russian lecture (recording) - AMI, Economics, Economics and Statistics, Intercampus
16:20 - Russian seminar (recording) - AMI, Economics
18:10 - Russian seminar (recording) - DSBA1 and ICEF
19:40 - English seminar - DSBA2

We ask you to rename and write your name as «Prefix_Last name First name» choosing prefix from (ICEF, DSBA, AMI, Economics), when attending lectures and seminars on Zoom. For example, "DSBA_Oxlong Mike".

About course

This page contains links to materials for 2021/2022 course for educational programs:

Educational program Year Faculty Link to the DSCS page
Applied Mathematics and Computer Science 3 year Faculty of Computer Science, NRU HSE Business Data Analytics
Bachelor’s Programme 'HSE University and University of London Double Degree Programme in Data Science and Business Analytics' 3 year Faculty of Computer Science, NRU HSE Business Data Analytics
Economics 3 year Faculty of Economic Sciences, NRU HSE Business Data Analytics
Economics 4 year Faculty of Economic Sciences, NRU HSE Business Data Analytics
Economics and Statistics 3 year Faculty of Economic Sciences, NRU HSE Business Data Analytics
Economics and Statistics 4 year Faculty of Economic Sciences, NRU HSE Business Data Analytics
Double Degree Program in Economics at the Higher School of Economics and
the University of London
3 курс International Institute of Economics and Finance NRU HSE No


Additional links:

Course program

The first module will be read for the 3rd and 4th courses - an overview of the sections:

  • Client analytics;
  • Text analytics;
  • Tasks of data analysis in retail sales networks of goods;
  • Fundamentals of risk assessment;
  • Model Ops.

The first module will be able to immerse students in current business issues, as well as in particular data analysis and analytical model building for each section of the module. In this module, students will be introduced to the SAS software.

The second module is a team project for the 3rd course only.

Students will be divided into groups of 2-7 people and each group will be given a practical task. This module will allow students to gain practical experience in data analysis, development and building analytical models on real data.

Studying and using SAS software in «Data Analytics in Business» course

To perform practical tasks, a student is free of choice to pick any of the given software tools: SAS, R, Python.

Students who plan to perform practical tasks on SAS platform, may take advanced online courses for free.

To access the course, you must contact the course instructor - Natalia Titova via Telegram.

Links to access the software SAS -
https://sas-viya.cs.hse.ru/SASStudioV/main?locale=en_US
https://sas-viya.cs.hse.ru/SASStudioV/main?locale=ru_RU

If a student has completed all the practical tasks on the SAS and passed the course with excellence, then he will receive:

  • academic SAS program completion certificate
  • Acclaim electronic badge confirming completion of the course and a list of technologies used by SAS

All interested students can take basic SAS online courses for free:

Students who are willing to spend extra time learning to program in SAS can try to take a professional certification within the SCYP program for free (SAS® Software Certified Young Professionals) link to the course.

Lectures

 Saturday      
DSBA & ICEF - 13:00 - 14:30;
AMI, Economics, Economics & Statistics, Intercampus - 14:40 - 16:10

link to lectures - https://zoom.us/j/99220349786?pwd=WjFZTEFiQzA4b1lzVmVDbXdmNVMwUT09
Сonference ID: 992 2034 9786
Сode: 476860
Section name Theme Date for 3 & 4 year Slides Recording
Client analytics Intro to client & online analytics 15.01.2022 Lecture №1 - RUS Lecture №1 - RUS
Client analytics Predictive models & visualizing data 22.01.2022 Lecture №2 - RUS Lecture №2 - RUS
Text analytics Intro to text data analysis tasks 29.01.2022 Slides №3 - RUS, Slides №3 - ENG Lecture №3 - RUS, Lecture №3 - ENG
Text analytics Tools & methods of text analytics 05.02.2022 Slides №4 - RUS, Slides №4 - ENG Lecture №4 - RUS, Lecture №4 - ENG
Tasks of data analysis in retail Intro to data analysis in retail. Demand Forecasting 12.02.2022 Slides №5 - RUS, Slides №5 - ENG Lecture №5 - RUS, Lecture №5 - ENG
Tasks of data analysis in retail Descriptive analytics in Retail: store clustering, product segmentation, demand recovery 19.02.2022 Slides №6 - RUS, Slides №6 - ENG Lecture №6 - RUS, Lecture №6 - ENG
Tasks of data analysis in retail Optimising stocks of goods in a retail, price optimisation, assortment optimisation 26.02.2022 Slides №7 - RUS, Slides №7 - ENG Lecture №7 - RUS, Lecture №7 - ENG
Basic risk assessment Intro to Market Risk 5.03.2022
Basic risk assessment Intro to Market Risk 12.03.2022
Basic risk assessment Model Validation 19.03.2022
ModelOps Operationalisation of ML Models 26.03.2022

Seminars

Saturday   

Economics 3 year - 9:30,
Economics 4 year - 11:10,
AMI & Intercampus - 16:20,
DSBA-1 & ICEF - 18:10,
DSBA-2 - 19:40

link to seminars - https://zoom.us/j/99220349786?pwd=WjFZTEFiQzA4b1lzVmVDbXdmNVMwUT09
Conference ID: 992 2034 9786
Code: 476860

link to additional materials - for seminars

Section name Theme Date for AMI, DSBA, ICEF & Intercampus Date for Economics Slides Recording
Client analytics Intro to client and online analytics 15.01.2022 22.01.2022 Slides №1 - RUS Seminar №1 - RUS
Client analytics Predictive models & visualizing data 22.01.2022 29.01.2022 Slides №2.1 - RUS, Seminar №2.2 - RUS
Text analytics Intro to text data analysis tasks 29.01.2022 05.02.2022 Slides №3 - RUS, Slides №3 - ENG Seminar №3 - RUS Seminar №3 - ENG
Text analytics Tools & methods of text analytics 05.02.2022 12.02.2022 Slides №4 - RUS, Slides №4 - ENG Seminar №4 - RUS, Seminar №4 - ENG
Tasks of data analysis in retail Intro to data analysis in retail. Demand Forecasting 12.02.2022 19.02.2022
Tasks of data analysis in retail Descriptive analytics in Retail: store clustering, product segmentation, demand recovery 19.02.2022 26.02.2022
Tasks of data analysis in retail Optimising stocks of goods in a retail, price optimisation, assortment optimisation 26.02.2022 5.03.2022
Basic risk assessment Intro to Market Risk 5.03.2022 12.03.2022
Basic risk assessment Intro to Market Risk 12.03.2022 19.03.2022
Basic risk assessment Model Validation 19.03.2022 26.03.2022
ModelOps Operationalisation of ML Models 26.03.2022 2.04.2022

Course report and grade evaluation

The course includes several forms of knowledge control:

  • 3 practical homework assignments
  • Written exam, questions in the form of a test with multiple choice
  • Team project (only for 3rd-year students)

Criteria for assessing knowledge, skills

  • All homework assignments are graded on a 2-point scale, where «2» — task is fully completed, «1» — the task is not completely solved or with slight mistakes, «0» — task is not solved or solved incorrectly.

In case if the homework is divided into several parts, then each part is evaluated on a 2-point scale as described above, and then the marks are averaged with equal weights without rounding.

The transfer of grades for homework from a 2-point scale to a 10-point scale is done by means of multiplying the grade by 5 without any rounding.

  • The grade for the exam is set on a 10-point scale.
  • The grade for the team project is also set on a 10-point scale.

The order of the formation of grades for the discipline

Let's denote the grades for 3 homework assignments on a 10-point scale — O_1,O_2,O_3, and the grade for the exam at the end of the 1st module on a 10-point scale — O_ex.


The final grade for 4th-year students O_final is evaluated by the following formula

O_final = 0.225 * O_1 + 0.225 * O_2 + 0.225 * O_3 + 0.325 * O_ex


The final grade for 3rd-year students in the 1st module O_mod is evaluated by the following formula

O_mod = 0.1 * O_1 + 0.1 * O_2 + 0.1 * O_3 + 0.2 * O_ex

The grade for the project in the 2nd module O_prj is set on a 10-point scale by means of the project defense.

The final grade O_final is defined by the formula O_final = O_mod + 0.5 * O_prj


Rounding occurs only at the very end - in the final grade, i.e. arithmetic rounding.

Each task and exam is evaluated on a 10-point scale (fractional marks are allowed for tasks). For some tasks, it will be possible to receive bonus points, which will be announced when the task is issued.

Home assignments

Home assignment #1

The home task #1 consists of 2 parts:

1. Data research and data processing for subsequent segmentation;

2. Making customer profiles based on segmentations (use at least 2 segmentation methods).

An example of a detailed description of Home assignment №1 2020-2021 with examples and results read in the attached file

Each student chooses the version that is indicated opposite his name in the list link

Versions and data description are presented in the folder at the link

In order to receive an assessment, you need:

1. Send an archive with files where all calculations were made and a cover letter with conclusions and comments on each part:

  • Calculations can be done using code (python/sas/sql), pivot tables and formulas in excel or SAS Viya project;
  • All conclusions must be supported by visually interpretable graphs and data.

2. The archive (.zip) with the files must be sent to ntitova@hse.ru with the email subject “FCS HSE”

3. The file name must be sent according to the template <First Name>_<Last name>_<group number>_hw1.zip.

For example, Alexander_Sharipov_156_hw1

Grade for Home assignment #1 is given on a 10-point scale, where:

"8-10" - the task is completely solved, all 2 parts of homework are completed:

  • data analysis was carried out, a code is working, and tables for data research were provided;
  • constructed segmentation by 2 methods;
  • provided clear conclusions with confirmed data (tables, graphs);

"6-7" - the task is solved incompletely or with shortcomings:

  • data analysis was carried out, a working code and tables for data research were provided;
  • built segmentation using at least one method;
  • provided clear conclusions with confirmed data (tables, graphs);

"4-5" - the task was solved with significant shortcomings,

  • data analysis was carried out, a working code and tables for data research were provided;
  • revealed top-level dependencies and patterns for customers without building a segmentation model;

"0-3" - the task is not solved or solved incorrectly.

Deadline – 2 weeks (February 19, 2022 23:59).

Home assignment #2

Description of Home assignment #2 is in the file link

Deadline - March 12, 2022 23:59. Solutions should be sent to aromanenko@hse.ru

The subject of the letter must contain the following: HSE + Course number + version_number + full name.

The file name must include:

  • Course number
  • Version number
  • Full name

Example: "AMIS_3course_Version_8_IvanovIvanIvanovich"

Home assignment #3

It is necessary to build a scoring model that assesses the probability of a client default at the stage of making a loan application. To do this you need:

0. Download data from the link https://drive.google.com/drive/u/0/folders/16CMyPnLu7Fv7IgsYOZimQK-7MaFZEWEZ

Each student selects 2 data samples "accept" and "reject", which start with the student's HW version. Version numbers for HW #3 must be taken the same as for HW #1.

The completed task must be sent in the following form:

1) File/scripts with built models (there must be comments, without comments the task is considered as unresolved)

2) Excel file with answers to the following questions:

1. What is the proportion of 1 in the "accept" sample?

2. It is necessary to calculate the following for all interval variables:

- Proportion of missing values
- Median
- Mean
- Standard deviation
- Are there any abnormal values, outliers?
- Information Value

3. It is necessary to calculate for all categorical variables the following:

- Mode
- Proportion of missing values
- Information Value
- Are there outliers, abnormal values?

4. Build logistic regression only on approved applications with transformed WoE variables. What is the meaning of GINI? F1 measure?

5. Conduct a Reject Inference analysis. What is the percentage of rejected applications?

6. Build a logistic regression on all applications with transformed WoE variables. What GINI, F1 mean? Has the model changed?

7. What model would you recommend for implementation in a productive environment? Give a detailed explanation

Assessment for HW #3 is set on a 2-point scale, where "2" - the task is solved completely, "1" - the task is not completely solved or with shortcomings, "0" - the task is not solved or solved incorrectly. The transfer of grades for homework from a 2-point scale to a 10-point scale is carried out by multiplying the grade by 5 without rounding.

For HW #3, marks will be given: "2" - the model is correctly built on both the accept and reject samples. Correct answers given. "1.6" - the model is correctly built both on the accept sample and on the reject sample. 50% of answers are correct. "1.4" - the model is correctly built both on the accept sample and on the reject sample. Wrong answers are given. "1" are given - the model is built only on the accept sample. "0.8" - the task is not completely solved. 50% of answers are correct. "0" - the task is not solved or solved incorrectly.

Deadline - until 26.03.2022 (including 26.03.2022)

Decisions should be sent to msvorobeva@hse.ru The subject of the letter must contain the following: HSE + Course number + version_number + full name.

The file name must include:

  • Course number
  • Version number
  • Full name

Example: "AMIS_3course_Version_8_IvanovIvanIvanovich"

If the works will repeat each other, both works will be considered unresolved.

Team project for 3rd course

Choosing a topic for a team project on the course "Data Science Case Studies (JD SAS)"

Students are divided into groups of 3 people. In the future, 2-3 groups can be combined into one. Within the group, the team captain must be determined - the responsible person of the group.

The responsible person is responsible for the performance and result of the following main functions:

  • sending an application for a project topic and agreeing on a project topic on behalf of the whole group with professors;
  • providing information to the curator about the current status of the project: accounting, distribution and control of the implementation of the project task;
  • sending reports, presentations, technical documentation on the work performed by the group in electronic form.

Project topic descriptions: link to file

Link to the application form on the topic: link to file


Topic selection deadlines:

Until April 17, the group must select two topics from the specified list, indicating the first and second priority for these topics.

April 18 - each group that has applied for the project, through the specified form, will be assigned a project topic and curator. While assigning topics, the priorities indicated by the students will be taken into account, as well as the average score of students in the group for the first module of the course. No more than 3 groups of students are assigned to one topic.

If you have any questions, write to Natalia Titova on Telegram.


The result of each project should be a presentation of the results of the project for 10-15 minutes.

The defense of the project for DSBA and ICEF will be in mid-May (May 17-22), as well as for everyone who is ready to defend themselves.

The final defense for AMIS, Economics, Economics and Statistics will take place in mid-June (June 15-19) before the start of the session.

The assessment for the project in the second module is set on a 10-point scale based on the results of the defense of the project.

Those students who did not find a group for themselves also apply for a topic, but for themselves alone. We ourselves will connect with a group on a similar topic.


Dates for the defense of educational projects in module 4:

Project defenses will be held from 17 to 19 June 2021.

In the file you will find a link to the list of project groups with reference to the date and time of project defense, as well as links to defenses.

Team projects - dates for defenses by groups and links to join.

How to ask a question about the course

Questions about the course can be asked in the telegram chat of the course, the course professor Natalia Titova @Natalitics or the manager of the SAS department Tatiana Lobok @tatianalobok (tlobok@hse.ru).

Telegram channel for announcements: https://t.me/+Lj-yHhfNJTQxYWEy

Chat in telegram for discussions: https://t.me/+a1VMTe2xwNA5Mzcy


All announcements and course materials will be posted in the telegram chat and in the telegram channel! There are professors in the chat, but not always. For all important questions, you should write to Natalia Titova in the telegram chat @Natalitics or mail Natalia.Titova@sas.com. Be sure to add the tag [AMIS FCS HSE/DSBA FCS HSE/ICEF FCS HSE/Ec FES HSE/EcSt FES HSE] to the title of the letter, and also indicate your last name and first name.

All files provided are intended for use by students during their studies and are updated throughout the year. If you find any typos, inaccuracies, malfunctions of the page, please send email tlobok@hse.ru.

Course materials

Documents and program of the course Attention: files are being updated!

  • The working program of the discipline for the 3rd and 4th courses document is located at the following link.

Recommended literature and useful additional materials

Useful materials


Useful literature

Section 1:


Section 2:

  • Шапиро Дж (2006). Моделирование цепи поставок. Питер. Серия «Теория менеджмента».
  • Tijms H.C., Groenevelt H. (1984). Simple approximations for the reorder point in periodic and continuous review (s, S) inventory systems with service level constraints. European Journal of Operational Research, Vol. 17, Issue 2, August 1984, Pages 175-190.]


Section 3:

  • Christoffersen P. (2012) Elements of Financial Risk Management. 2nd ed. Elseiver Academic Press.

Section 4:

  • Мортон С. (2016) Лаборатория презентаций. Формула идеального выступления. Альпина Паблишер.

Contacts

микро
Titova Natalia Nikolaevna - Senior tutor

Natalia.Titova@sas.com



микро
Lobok Tatiana Sergeevna - Manager of the basic SAS Department

tlobok@hse.ru