Большие языковые модели 25 26 — различия между версиями

Материал из Wiki - Факультет компьютерных наук
Перейти к: навигация, поиск
м
м
Строка 10: Строка 10:
 
* AnyTask
 
* AnyTask
 
* [ Оценки]
 
* [ Оценки]
* [ Видеозаписи лекций]
+
* [https://disk.yandex.ru/d/b0_3gsFRgXIpBw Видеозаписи лекций]
  
 
=== Организационное ===
 
=== Организационное ===
Строка 38: Строка 38:
  
 
1. [https://cloud.mail.ru/public/Szou/fsZ1nYgaz Введение в языковое моделирование]
 
1. [https://cloud.mail.ru/public/Szou/fsZ1nYgaz Введение в языковое моделирование]
 +
 +
2. [https://cloud.mail.ru/public/N1tk/bSfbMezvb Архитектура трансформера, GPT, Bert]
  
 
== Семинары ==
 
== Семинары ==

Версия 17:30, 29 сентября 2025

О курсе

Курс посвящен Большим Языковым Моделям a.k.a. LLM и затрагивает темы от базовой теории до практических применений.

Проводится экспертами из VK.

Полезные ссылки

Организационное

В курсе планируется 10 лекций, по 9 из них (кроме последней) будет летучка в начале следующего занятия. Летучка - это 5 вопросов на 10 минут по мотивам лекций.

Иногда мы будем проводить практические занятия, это могут быть

  • Вспомогательные лекции, например, вспомнить PyTorch
  • Дополнительный полезный материал, например, как масштабировать модели на кластерах
  • Семинары или reading club - возможность выступить с разбором статьи на полезную тему
  • QA сессии и философские разговоры - по необходимости

В качестве практики, будет 4 домашних работы, на них будет действовать стандартная система с дедлайнами - мягкий через 2 недели и жесткий через месяц. После мягкого дедлайна оценка за ДЗ уменьшается в 2 раза.

Выставление оценок

Активности за баллы:

  • Домашняя работа - каждая оценивается от 0 до 10 баллов
  • Летучка - каждая летучка из 5 вопросов, полностью решенная приносит 10 баллов (по 2 балла за вопрос)
  • Выступление на семинаре - 10 баллов

Оценка = Округление(0.80 * AVG(ДЗ) + 0.09 * AVG(Л) + 0.11 * C)

Лекции

1. Введение в языковое моделирование

2. Архитектура трансформера, GPT, Bert

Семинары

1. Learning PyTorch

2. Dealing with LARGE models

Домашние работы