Statistics 4mr 2021-22 — различия между версиями
Bdemeshev (обсуждение | вклад) (→Полезные источники в перемешку) |
м (лекция 10) |
||
(не показано 10 промежуточных версии 2 участников) | |||
Строка 53: | Строка 53: | ||
* '''Malhotra, N.K. D.F. Birks and P.A. Wills Marketing Research, Pearson, fourth edition''' | * '''Malhotra, N.K. D.F. Birks and P.A. Wills Marketing Research, Pearson, fourth edition''' | ||
− | == | + | == Боевой листок == |
==== Лекция 1. Наивный bootstrap, bootstrap t-статистики, bootstrap в bootstrap ==== | ==== Лекция 1. Наивный bootstrap, bootstrap t-статистики, bootstrap в bootstrap ==== | ||
[https://www.youtube.com/watch?v=wIPq_OoYcjc Запись лекции] | [https://www.youtube.com/watch?v=wIPq_OoYcjc Запись лекции] | ||
Полезно почитать: | Полезно почитать: | ||
− | * [https://arxiv.org/abs/1411.5279 | + | * Tim Hestenberg, [https://arxiv.org/abs/1411.5279 What teachers should know about the bootstrap] |
− | * [https://people.eecs.berkeley.edu/~jordan/sail/readings/edgeworth.pdf | + | * [https://people.eecs.berkeley.edu/~jordan/sail/readings/edgeworth.pdf Edgeworth expansion] |
Тетрадка с семинара: | Тетрадка с семинара: | ||
* [https://github.com/xenakas/stat4mr_2021/tree/main/seminar1 bootstrap_part1] | * [https://github.com/xenakas/stat4mr_2021/tree/main/seminar1 bootstrap_part1] | ||
Строка 67: | Строка 67: | ||
Полезно почитать: | Полезно почитать: | ||
− | * [https://core.ac.uk/download/pdf/6494253.pdf | + | * James MacKinnon, [https://core.ac.uk/download/pdf/6494253.pdf Bootstrap Methods in Econometrics (про дикий и парный бутстрэп)] |
− | * [https://www.unofficialgoogledatascience.com/2015/08/an-introduction-to-poisson-bootstrap26.html | + | * [https://www.unofficialgoogledatascience.com/2015/08/an-introduction-to-poisson-bootstrap26.html Poisson bootstrap] |
Тетрадка с семинара: | Тетрадка с семинара: | ||
Строка 91: | Строка 91: | ||
==== Лекция 5. CUPED, DND ==== | ==== Лекция 5. CUPED, DND ==== | ||
[https://youtu.be/saeAPdTTfTM Запись лекции] | [https://youtu.be/saeAPdTTfTM Запись лекции] | ||
+ | |||
+ | Тетрадка с семинара: | ||
+ | * [https://github.com/xenakas/stat4mr_2021/tree/main/seminar5_cuped cuped] | ||
==== Лекция 6. Мэтчинг ==== | ==== Лекция 6. Мэтчинг ==== | ||
[https://youtu.be/BQt-YZtknG4 Запись лекции] | [https://youtu.be/BQt-YZtknG4 Запись лекции] | ||
+ | Тетрадка с семинара: | ||
+ | * [https://github.com/xenakas/stat4mr_2021/tree/main/seminar6_did matching] | ||
+ | |||
+ | ==== Лекция 7. Поправка Бонферрони ==== | ||
+ | [https://youtu.be/NNT4cVwZdmo Запись лекции] | ||
+ | |||
+ | Тетрадка с семинара: | ||
+ | * [https://github.com/xenakas/stat4mr_2021/tree/main/seminar7_matching_bonferroni matching & bonferroni] | ||
+ | |||
+ | ==== Лекция 8. Sampling ==== | ||
+ | [https://youtu.be/ti9Tg8O-dhc Запись лекции] | ||
+ | |||
+ | ==== Лекция 9. Стратификация, вычисление размера выборки ==== | ||
+ | [https://youtu.be/en93OWTQRnU Запись лекции] | ||
+ | ==== Лекция 10. MDE ==== | ||
+ | [https://youtu.be/sufwhXz-0Co Запись лекции] | ||
== Полезные источники в перемешку == | == Полезные источники в перемешку == | ||
Строка 104: | Строка 123: | ||
* Deng, [https://alexdeng.github.io/ webpage] | * Deng, [https://alexdeng.github.io/ webpage] | ||
* Stats SE, [https://stats.stackexchange.com/questions/398436/a-b-testing-ratio-of-sums AB testing for ratio of sums] | * Stats SE, [https://stats.stackexchange.com/questions/398436/a-b-testing-ratio-of-sums AB testing for ratio of sums] | ||
− | * [https://towardsdatascience.com/a-b-testing-a-complete-guide-to-statistical-testing-e3f1db140499 Guide to AB] | + | * [https://towardsdatascience.com/a-b-testing-a-complete-guide-to-statistical-testing-e3f1db140499 Guide to AB]. Тесты для таблиц сопряжённости, Welch test, Mann-Whitney. |
− | Welch test, Mann-Whitney | + | |
− | + | ||
Bootstrap: | Bootstrap: | ||
+ | * Tim Hestenberg, [https://arxiv.org/abs/1411.5279 What teachers should know about the bootstrap]. Лучшее первое знакомство с бутстрэпом. Если есть время на один источник по бутстрэпу, то это то, что нужно. | ||
+ | * [https://people.eecs.berkeley.edu/~jordan/sail/readings/edgeworth.pdf Edgeworth expansion]. Большая книжка с брутальной теорией, преобразованиями Фурье, доказательствами и картинкой с матрёшками. | ||
+ | * James MacKinnon, [https://core.ac.uk/download/pdf/6494253.pdf Bootstrap Methods in Econometrics (про дикий и парный бутстрэп)] | ||
+ | * [https://www.unofficialgoogledatascience.com/2015/08/an-introduction-to-poisson-bootstrap26.html Poisson bootstrap] | ||
* [https://arxiv.org/abs/1304.7406 Evaluation of Bootstrap Methods] | * [https://arxiv.org/abs/1304.7406 Evaluation of Bootstrap Methods] | ||
+ | Робастные ошибки в регрессии: | ||
+ | |||
+ | * James Mackinnon, [https://www.researchgate.net/publication/254447243_Thirty_Years_of_Heteroskedasticity-Robust_Inference 30 years of robust inference] | ||
CUPED + CUPAC: | CUPED + CUPAC: | ||
Строка 127: | Строка 151: | ||
* [https://www.stat.cmu.edu/~hseltman/files/ratio.pdf Approximate E, Var for ratio] | * [https://www.stat.cmu.edu/~hseltman/files/ratio.pdf Approximate E, Var for ratio] | ||
* Deng, [https://arxiv.org/abs/1803.06336 Applying delta method:] practical guide with novel ideas | * Deng, [https://arxiv.org/abs/1803.06336 Applying delta method:] practical guide with novel ideas | ||
+ | |||
+ | |||
+ | Эффекты воздействия: | ||
+ | |||
+ | * Рубен Ениколопоп, [http://quantile.ru/06/06-RE.pdf Эффекты воздействия]. Мэтчинг, propensity score. | ||
+ | * Matheus Facure, [https://matheusfacure.github.io/python-causality-handbook/landing-page.html Causal inference for Brave and True]. Инструментальные переменные, мэтчинг, RDD и прочие попытки выяснить причинно-следственные связи на неэкспериментальных данных. С мемасиками и в питоне. |
Версия 17:54, 23 ноября 2021
Содержание
- 1 О курсе
- 2 Литература
- 3 Боевой листок
- 3.1 Лекция 1. Наивный bootstrap, bootstrap t-статистики, bootstrap в bootstrap
- 3.2 Лекция 2. Дикий bootstrap, парный bootstrap, пуассоновский bootstrap
- 3.3 Лекция 3. Ещё немного про бутстрэп, тест Уэлча
- 3.4 Лекция 4. Манн Уитни, CUPED
- 3.5 Лекция 5. CUPED, DND
- 3.6 Лекция 6. Мэтчинг
- 3.7 Лекция 7. Поправка Бонферрони
- 3.8 Лекция 8. Sampling
- 3.9 Лекция 9. Стратификация, вычисление размера выборки
- 3.10 Лекция 10. MDE
- 4 Полезные источники в перемешку
О курсе
Оценивание
UoL = Экзамен * 0.7 + Письменная (или курсовая) работа * 0.3
Итоговая оценка = Экзамен * 0.5 + 0.3 * Контрольная работа + 0.2 * Домашняя работа
Module 1
(1 lecture + 1 class per group X 7 weeks)
- Bootstrap
- Welch test
- Mann-Whitney test
- CUPED
- Difference in Difference estimator
- Matching
- Multiple comparison corrections
Module 2
(1 lecture + 1 class per group X 8 weeks)
- Sampling
- Sample size calculation
- Contingency tables, Chi-squared tests
- ANOVA, ANCOVA
- Partial correlation
Module 3
(1 lecture + 1 class per group X 11 weeks)
- Discriminant analysis
- Logit
- PCA
- Factor analysis
- Cluster analysis, Dendrogramms
- Conjoint Analysis
- Multidimensional scaling
Литература
Вспоминаем тервер и матстат
Книжки попроще
- Frederick Gravetter, Larry Wallnau. Statistics for the Behavioral Sciences
- Феллер В. Введение в теорию вероятностей и её приложения
Посложнее
- Larry Wasserman. All of Statistics: A Concise Course in Statistical Inference
- David Williams. Weighing the Odds. A Course in Probability and Statistics
- Ширяев А.Н. Вероятность - 1 .
Советы от UoL
- Malhotra, N.K. D.F. Birks and P.A. Wills Marketing Research, Pearson, fourth edition
Боевой листок
Лекция 1. Наивный bootstrap, bootstrap t-статистики, bootstrap в bootstrap
Полезно почитать:
- Tim Hestenberg, What teachers should know about the bootstrap
- Edgeworth expansion
Тетрадка с семинара:
Лекция 2. Дикий bootstrap, парный bootstrap, пуассоновский bootstrap
Полезно почитать:
Тетрадка с семинара:
Лекция 3. Ещё немного про бутстрэп, тест Уэлча
Тетрадка с семинара:
Лекция 4. Манн Уитни, CUPED
Полезно почитать:
- Deng, Improving the Sensitivity of Online Experiments
- Victor Lei, How booking increases power with CUPED
Тетрадка с семинара:
Лекция 5. CUPED, DND
Тетрадка с семинара:
Лекция 6. Мэтчинг
Тетрадка с семинара:
Лекция 7. Поправка Бонферрони
Тетрадка с семинара:
Лекция 8. Sampling
Лекция 9. Стратификация, вычисление размера выборки
Лекция 10. MDE
Полезные источники в перемешку
General AB:
- VK practitioner guide
- Deng, Trustworthy analysis of online A/B tests: Pitfalls, challenges and solutions
- Deng, webpage
- Stats SE, AB testing for ratio of sums
- Guide to AB. Тесты для таблиц сопряжённости, Welch test, Mann-Whitney.
Bootstrap:
- Tim Hestenberg, What teachers should know about the bootstrap. Лучшее первое знакомство с бутстрэпом. Если есть время на один источник по бутстрэпу, то это то, что нужно.
- Edgeworth expansion. Большая книжка с брутальной теорией, преобразованиями Фурье, доказательствами и картинкой с матрёшками.
- James MacKinnon, Bootstrap Methods in Econometrics (про дикий и парный бутстрэп)
- Poisson bootstrap
- Evaluation of Bootstrap Methods
Робастные ошибки в регрессии:
- James Mackinnon, 30 years of robust inference
CUPED + CUPAC:
Оригинальная статья, на CUPED можно смотреть как на две подряд применённых регрессии :)
- Victor Lei, How booking increases power with CUPED
- CUPAC
Де-факто: признак генерируется любым алгоритмом машинного обучения, затем множественная регрессия с кластер-робастными стандартными ошибками.
Linearization + Delta-method:
- Transformation of Ratio Metrics
- Approximate E, Var for ratio
- Deng, Applying delta method: practical guide with novel ideas
Эффекты воздействия:
- Рубен Ениколопоп, Эффекты воздействия. Мэтчинг, propensity score.
- Matheus Facure, Causal inference for Brave and True. Инструментальные переменные, мэтчинг, RDD и прочие попытки выяснить причинно-следственные связи на неэкспериментальных данных. С мемасиками и в питоне.