- Цели и задачи дисциплины
- Сформировать у студентов теоретические знания и практические навыки по применению методов машинного обучения в условиях нестандартных данных: малых выборок, несбалансированных распределений, больших объёмов, сдвига данных (drift) и высокого уровня шума. Студенты освоят современные подходы к повышению обобщаемости, устойчивости и эффективности моделей, включая few-shot learning, domain adaptation, федеративное обучение, робастные методы и методы снижения размерности. Особое внимание уделяется обоснованию выбора алгоритмов, анализу trade-off между производительностью, безопасностью и вычислительной стоимостью. Задача курса — подготовить студентов к решению прикладных задач в условиях ограниченных, неоднородных или распределённых данных с использованием современных инструментов машинного обучения.
- Краткое содержание дисциплины
- В рамках дисциплины изучаются типы нестандартных данных и вызовы, с которыми сталкиваются классические методы машинного обучения. Рассматриваются методы работы с несбалансированными данными (oversampling, undersampling), обучение на малых выборках (few-shot, метаобучение, байесовские методы), робастные подходы (RANSAC), масштабирование на большие данные (mini-batch, online, federated learning), а также методы повышения обобщаемости (domain adaptation, transfer learning, регуляризация). Отдельное внимание уделено сравнительному анализу моделей по эффективности, устойчивости и безопасности. Практические занятия ориентированы на реализацию и адаптацию алгоритмов с использованием Python, Scikit-learn, PyTorch и специализированных библиотек.
- Компетенции обучающегося, формируемые в результате освоения дисциплины
- Выпускник должен обладать:
- ПК-13 [ML-8] Способен применять алгоритмы обучения на нестандартных объемах данных
- Образование
- Учебный план 09.03.04, 2025, (4.0), Программная инженерия
- Машинное обучение на нестандартных данных


