Машинное обучение на нестандартных данных

Цели и задачи дисциплины
Сформировать у студентов теоретические знания и практические навыки по применению методов машинного обучения в условиях нестандартных данных: малых выборок, несбалансированных распределений, больших объёмов, сдвига данных (drift) и высокого уровня шума. Студенты освоят современные подходы к повышению обобщаемости, устойчивости и эффективности моделей, включая few-shot learning, domain adaptation, федеративное обучение, робастные методы и методы снижения размерности. Особое внимание уделяется обоснованию выбора алгоритмов, анализу trade-off между производительностью, безопасностью и вычислительной стоимостью. Задача курса — подготовить студентов к решению прикладных задач в условиях ограниченных, неоднородных или распределённых данных с использованием современных инструментов машинного обучения.
Краткое содержание дисциплины
В рамках дисциплины изучаются типы нестандартных данных и вызовы, с которыми сталкиваются классические методы машинного обучения. Рассматриваются методы работы с несбалансированными данными (oversampling, undersampling), обучение на малых выборках (few-shot, метаобучение, байесовские методы), робастные подходы (RANSAC), масштабирование на большие данные (mini-batch, online, federated learning), а также методы повышения обобщаемости (domain adaptation, transfer learning, регуляризация). Отдельное внимание уделено сравнительному анализу моделей по эффективности, устойчивости и безопасности. Практические занятия ориентированы на реализацию и адаптацию алгоритмов с использованием Python, Scikit-learn, PyTorch и специализированных библиотек.
Компетенции обучающегося, формируемые в результате освоения дисциплины
Выпускник должен обладать:
  • ПК-13 [ML-8] Способен применять алгоритмы обучения на нестандартных объемах данных
You are reporting a typo in the following text:
Simply click the "Send typo report" button to complete the report. You can also include a comment.