- Цели и задачи дисциплины
- Целью курса является изучение студентами задач, связанных с распределенным хранением и обработкой больших данных с использованием экосистемы Hadoop. При изучении этого курса должны быть решены следующие задачи: изучить понятие и проблематику больших данных, основы распределенного хранения и обработки больших данных на платформе Hadoop, изучить экосистему Hadoop и ее использование для решения прикладных задач.
- Краткое содержание дисциплины
- В содержание дисциплины входит изучение понятия больших данных, изучение платформы распределенной обработки больших наборов данных Hadoop, изучение экосистемы Hadoop: Pig, Apache Hive, Apache Spark, MLlib, Hadoop YARN, Zookeeper, Apache Kafka.
- Компетенции обучающегося, формируемые в результате освоения дисциплины
- Выпускник должен обладать:
- ОПК-2 Способен применять компьютерные/суперкомпьютерные методы, современное программное обеспечение (в том числе отечественного производства) для решения задач профессиональной деятельности
- ОПК-5 Способен инсталлировать и сопровождать программное обеспечение информационных систем, осуществлять эффективное управление разработкой программных средств и проектов
- УК-1 Способен осуществлять критический анализ проблемных ситуаций на основе системного подхода, вырабатывать стратегию действий
- Образование
- Учебный план 02.04.02, 2021, (2.0), Фундаментальная информатика и информационные технологии
- Введение в экосистему Hadoop