Культура работы с данными, КМБТ

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск

О курсе

Преподаватель: Кириллов Богдан Александрович, e-mail

Аннотация курса: Программа предназначена для студентов первого года обучения в бакалавриате по направлению 06.03.01 «Клеточная и молекулярная биотехнология». Главная цель изучения учебной дисциплины «Культура работы с данными» – освоение основ работы с различными видами данных (основы статистики и теории вероятности, машинного обучения), что предполагает также овладение базовыми навыками работы с современными языками программирования, применяемыми в анализе данных (Python и bash), библиотеками для статистической обработки данных (numpy, scipy, matplotlib), библиотеками машинного обучения (Scikit Learn и Ludwig). Во втором модуле студенты изучают онлайн-курс «Цифровая грамотность». Курс «Цифровая грамотность» является элементом общеуниверситетского образовательного проекта Data Culture. Курс направлен на формирования начальных и базовых компетенций в области работы с данными, которые необходимы для безопасного и эффективного использования цифровых технологий и ресурсов интернета в рамках академической деятельности. В курсе рассматриваются такие общие темы, как: - компьютерная грамотность, - работа поисковых систем, - компьютерная безопасность, - медиаграмотность, - работа с облачными инструментами и пакетом MS Office, - работа с источниками при написании исследовательских работ, - большие данные и машинное обучение. В результате освоения этих тем слушатели научатся более эффективно пользоваться технологиями, с которыми ежедневно сталкиваются как в стенах университета, так и за его пределами. Большинство заданий в курсе будут носить практический характер и помогать в отработке того или иного навыка, необходимого для жизни в 21 веке. Основные положения дисциплины используются в дальнейшем при изучении следующих дисциплин учебных программ бакалавра и магистра: Методы машинного обучения и разработки данных; Современные методы анализа данных; Сравнительная геномика; Теория вероятностей и математическая статистика; Прикладная статистика; Молекулярная эволюция; Основы программирования; Алгоритмы и структуры данных.

Программа курса: https://www.hse.ru/ba/cmb/courses/307300317.html

Правила выставления оценок

Итоговая оценка по дисциплине складывается из накопленных оценок за домашние задания (3 задания), тесты (11 тестов), самостоятельные работы (6 работ), теста на цифровую грамотность и экзамена. В ходе курса студенты могут получить в сумме 44 балла за всё.

Оценки за курс выставляются в течение сессии четвертого модуля.

Каналы взаимодействия со студентами

Все взаимодействие со студентами происходит в телеграмме https://t.me/joinchat/Bw4cgkLpSMgC52DEEfj_aw, также все материалы курса предоставляются (презентации лекций, материалы к практическим занятиям, тексты статей или ссылки на онлайн-материалы) в github-репозитории https://github.com/bakirillov/hse-dc-2020.

Литература и интернет-ресурсы

  • Войтов Н.М. — Основы работы с Linux. Учебный курс - Издательство "ДМК Пресс" - 2010 - ISBN: 978-5-94074-148-0 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/1198
  • - Гудфеллоу Я., Бенджио И., Курвилль А. — Глубокое обучение - Издательство "ДМК Пресс" - 2018 - ISBN: 978-5-97060-618-6 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/107901
  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
  • Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
  • Matthes, E. Python crash course: a hands-on, project-based introduction to programming. – No Starch Press, 2015. – 562 pp.
  • Под ред. Кедровой Г. Е.-ИНФОРМАТИКА ДЛЯ ГУМАНИТАРИЕВ. Учебник и практикум для академического бакалавриата-М.:Издательство Юрайт,2019-439-Бакалавр. Академический курс-978-5-534-01031-2: -Текст электронный // ЭБС Юрайт - https://biblio-online.ru/book/informatika-dlya-gumanitariev-436461
  • Секреты приложений Google / Балуев Д. - М.:Альпина Пабл., 2016. - 287 с.: ISBN 978-5-9614-1274-1 - Режим доступа: http://znanium.com/catalog/product/923761
  • Теория вероятностей и математическая статистика. Оценка параметров распределений : учебное пособие, Иванов А. В., 2009
  • - Несен А.В. — Microsoft Word 2010: от новичка к профессионалу - Издательство "ДМК Пресс" - 2011 - ISBN: 978-5-94074-713-0 - Текст электронный // ЭБС Лань - URL: https://e.lanbook.com/book/1210
  • Nelli, F. (2018). Python Data Analytics : With Pandas, NumPy, and Matplotlib (Vol. Second edition). New York, NY: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1905344
  • Анализ данных в MS Excel : основные сведения о MS Excel, статистические таблицы и графики, статистические функции, пакет анализа (анализ данных) : учеб. пособие для вузов, Мхитарян, В. С., Шишов, В. Ф., 2018
  • Комбинаторика, Виленкин Н. Я., Виленкин А. Н., 2013
  • Кувшинская Ю. М., Зевахина Н. А., Ахапкина Я. Э., Гордиенко Е. И. ; Под ред. Кувшинской Ю.М.-АКАДЕМИЧЕСКОЕ ПИСЬМО. ОТ ИССЛЕДОВАНИЯ К ТЕКСТУ. Учебник и практикум для академического бакалавриата-М.:Издательство Юрайт,2019-284-Бакалавр. Академический курс-978-5-534-08297-5: -Текст электронный // ЭБС Юрайт - https://biblio-online.ru/book/akademicheskoe-pismo-ot-issledovaniya-k-tekstu-424762
  • Миркин Б. Г.-ВВЕДЕНИЕ В АНАЛИЗ ДАННЫХ. Учебник и практикум-М.:Издательство Юрайт,2019-174-Авторский учебник-978-5-9916-5009-0: -Текст электронный // ЭБС Юрайт - https://biblio-online.ru/book/vvedenie-v-analiz-dannyh-432851
  • Презентация: Лучше один раз увидеть! / Лазарев Д. - М.:Альпина Пабл., 2016. - 126 с.: ISBN 978-5-9614-1445-5 - Режим доступа: http://znanium.com/catalog/product/916181