Обработка и анализ данных физического эксперимента
Материал из Wiki - Факультет компьютерных наук
Содержание
О курсе
Преподаватели:
Аннотация курса:
В курсе рассматривается база, которую должен иметь физик, работающий с данными: статистический анализ, проверка гипотез, методы оптимизации и т.п. Также мы планируем в конце курса заняться машинным обучением. Основа курса — практикум по программированию на Python.
Страничка курса:
Табличка с успеваемостью: [3]
Программа Курса
- Обзор форматов научных данных и основных способов хранения данных.
- Хранение данных в виде текстовых файлов. Основные форматы текстовых таблиц.
- Хранение данных в виде бинарных файлов. Некоторые примеры бинарных форматов данных, их преимущества.
- Хранение данных в базе данных. Реляционные и документно-ориентированные базы данных.
- Подходы к распределенному хранению данных.
- Распределенная обработка данных.
- Работа на системах с общей памятью. Различные концепции параллельных вычислений, параллельные вычисления в Python.
- Работа на системах с распределенной памятью. Концепция MapReduce.
- Применение методов оптимизации к анализу экспериментальных данных.
- Обзор методов оптимизации для нахождения модельных параметров по данным эксперимента.
- Детерминистические методы оптимизации. Метод крыловских подпространств: метод сопряженных градиентов и его модификации.
- Оптимизация с ограничениями. Метод множителей Лагранжа. Линейное программирование, симплекс-метод.
- Стохастические методы оптимизации. Моделирование методом Монте-Карло с помощью Марковских цепей (MCMC).
- Обработка экспериментальных данных
- Нахождение сигнала на фоне шума: соотношение сигнал/шум, арифметика с шумными сигналами.
- Свертка сигнала с фильтром. Быстрое преобразование Фурье и его использование для свертки. Оптимальная фильтрация, фильтр Винера.
- Основные принципы метода регуляризации Тихонова
- Работа со статистическими распределениями.
- Определение параметров статистического распределения из набора экспериментальных данных: принцип максимального правдоподобия и метод наименьших квадратов
- Проверка статистических гипотез. Статистические критерии: t-критерий Стьюдента, критерий Колмогорова—Смирнова. Тестирование многомерных нормальных распределений.
- Применение методов машинного обучения для анализа физических данных.
- Обзор основных методов машинного обучения. Их классификация: классификация/регрессия, обучение с учителем и без.
- Линейные методы на примере линейной регрессии.
- Решающие деревья. Случайный лес для задач классификации и регрессии
Каналы взаимодействия со студентами
Все взаимодействие со студентами происходит в telegram.
Контакты учебных ассистентов
Виолетта Иванова:
- tg: @ivetasand
Павел Юрлов:
- tg: @paulyurlov
Литература и интернет-ресурсы
- Все можно найти на этом сайте: [4]