Statistics 4mr 2021-22 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
(Полезные источники в перемешку)
Строка 105: Строка 105:
 
* [https://dl.acm.org/doi/10.1145/3159652.3159699 Transformation of Ratio Metrics]
 
* [https://dl.acm.org/doi/10.1145/3159652.3159699 Transformation of Ratio Metrics]
 
* [https://www.stat.cmu.edu/~hseltman/files/ratio.pdf Approximate E, Var for ratio]
 
* [https://www.stat.cmu.edu/~hseltman/files/ratio.pdf Approximate E, Var for ratio]
* [https://towardsdatascience.com/a-b-testing-a-complete-guide-to-statistical-testing-e3f1db140499 Guide to AB]
+
* [https://towardsdatascience.com/a-b-testing-a-complete-guide-to-statistical-testing-e3f1db140499 Guide to AB]:
* [https://arxiv.org/abs/1803.06336 Applying delta method]
+
Welch test, Mann-Whitney,
 +
* Deng, [https://arxiv.org/abs/1803.06336 Applying delta method:] practical guide with novel ideas
 
* Deng, [https://alexdeng.github.io/public/files/wsdm2017-rup.pdf Trustworthy analysis of online A/B tests: Pitfalls, challenges and solutions]
 
* Deng, [https://alexdeng.github.io/public/files/wsdm2017-rup.pdf Trustworthy analysis of online A/B tests: Pitfalls, challenges and solutions]
 
* Deng, [https://alexdeng.github.io/ webpage]  
 
* Deng, [https://alexdeng.github.io/ webpage]  
 +
* [https://www.researchgate.net/publication/345698207_Control_Using_Predictions_as_Covariates_in_Switchback_Experiments CUPAC]
 +
Де-факто: признак генерируется любым алгоритмом машинного обучения, затем множественная регрессия с кластер-робастными стандартными ошибками.
 
* Stats SE, [https://stats.stackexchange.com/questions/398436/a-b-testing-ratio-of-sums AB testing for ratio of sums]
 
* Stats SE, [https://stats.stackexchange.com/questions/398436/a-b-testing-ratio-of-sums AB testing for ratio of sums]

Версия 20:35, 26 октября 2021

О курсе

Youtube-канал с лекциями

Оценивание

UoL = Экзамен * 0.7 + Письменная (или курсовая) работа * 0.3

Итоговая оценка = Экзамен * 0.5 + 0.3 * Контрольная работа + 0.2 * Домашняя работа

Module 1

(1 lecture + 1 class per group X 7 weeks)

  • Bootstrap
  • Welch test
  • Mann-Whitney test
  • CUPED
  • Difference in Difference estimator
  • Matching
  • Multiple comparison corrections

Module 2

(1 lecture + 1 class per group X 8 weeks)

  • Sampling
  • Sample size calculation
  • Contingency tables, Chi-squared tests
  • ANOVA, ANCOVA
  • Partial correlation

Module 3

(1 lecture + 1 class per group X 11 weeks)

  • Discriminant analysis
  • Logit
  • PCA
  • Factor analysis
  • Cluster analysis, Dendrogramms
  • Conjoint Analysis
  • Multidimensional scaling

Литература

Вспоминаем тервер и матстат

Книжки попроще

  • Frederick Gravetter, Larry Wallnau. Statistics for the Behavioral Sciences
  • Феллер В. Введение в теорию вероятностей и её приложения

Посложнее

  • Larry Wasserman. All of Statistics: A Concise Course in Statistical Inference
  • David Williams. Weighing the Odds. A Course in Probability and Statistics
  • Ширяев А.Н. Вероятность - 1 .

Советы от UoL

  • Malhotra, N.K. D.F. Birks and P.A. Wills Marketing Research, Pearson, fourth edition

Материалы

Лекция 1. Наивный bootstrap, bootstrap t-статистики, bootstrap в bootstrap

Запись лекции

Полезно почитать:

Тетрадка с семинара:

Лекция 2. Дикий bootstrap, парный bootstrap, пуассоновский bootstrap

Запись лекции

Полезно почитать:

Тетрадка с семинара:

Лекция 3. Ещё немного про бутстрэп, тест Уэлча

Запись лекции

Тетрадка с семинара:

Лекция 4. Манн Уитни, CUPED

Запись лекции

Полезно почитать:

Тетрадка с семинара:

Лекция 5. CUPED, DND

Запись лекции

Лекция 6. Мэтчинг

Запись лекции


Полезные источники в перемешку

Оригинальная статья, на CUPED можно смотреть как на две подряд применённых регрессии :)

Welch test, Mann-Whitney,

Де-факто: признак генерируется любым алгоритмом машинного обучения, затем множественная регрессия с кластер-робастными стандартными ошибками.