- Цели и задачи дисциплины
- Цель: Формирование у студентов знаний и навыков работы с базами данных (БД) и системами управления базами данных (СУБД), включая проектирование, создание и использование БД в биоинформатике и биоинженерии. Задачи: 1. Изучение теоретических основ БД и СУБД. 2. Освоение методов проектирования реляционных и NoSQL БД. 3. Приобретение практических навыков работы с СУБД (PostgreSQL, MySQL, MongoDB). 4. Изучение специализированных БД в биоинформатике (NCBI, UniProt, PDB). 5. Разработка запросов на SQL и NoSQL языках. 6. Анализ данных с использованием СУБД в биоинженерии.
- Краткое содержание дисциплины
- Дисциплина направлена на формирование у студентов-биоинформатиков компетенций в области проектирования, создания и использования баз данных в биологических исследованиях. Модуль 1. Введение в основные понятия баз данных и систем управления ими, где рассматриваются ключевые термины, классификация БД, включая реляционные и NoSQL-системы, а также их роль в биоинформатике для хранения геномных, белковых и клинических данных. Модуль 2. Реляционные базы данных и язык SQL. В этом разделе студенты осваивают принципы построения ER-диаграмм, нормализацию данных, синтаксис SQL, включая создание и изменение структуры БД, а также выполнение запросов на выборку, обновление и агрегацию данных. Особое внимание уделяется сложным операциям, таким как соединения таблиц и группировка данных. Модуль 3. NoSQL-базы данных: документоориентированные, графовые и колоночные. На примерах из биоинженерии разбираются сценарии их применения, например, для анализа сетей белок-белковых взаимодействий или хранения сложноструктурированных данных в формате JSON. Модуль 4. Изучение специализированных биоинформатических баз данных, таких как NCBI, UniProt, PDB и KEGG. Студенты учатся работать с этими ресурсами, в том числе через программные интерфейсы (API), используя инструменты, например, библиотеку Biopython. Модуль 5. Оптимизация и администрирование БД. Методы повышения производительности, включая индексацию, управление транзакциями, репликацию данных, а также основы безопасности и контроля доступа. Практическая часть курса включает лабораторные работы, где студенты развертывают СУБД, проектируют базы данных для биологических исследований, пишут SQL-запросы для анализа данных, а также работают с реальными биоинформатическими ресурсами. В рамках курса выполняются проекты, связанные с импортом биологических данных, их обработкой и визуализацией. В результате освоения дисциплины студенты приобретают навыки проектирования реляционных и NoSQL-БД, написания сложных SQL-запросов, взаимодействия с биоинформатическими базами данных через API, а также оптимизации БД для работы с большими объемами данных. Контроль знаний осуществляется через тесты, защиту лабораторных работ и экзамен, включающий теоретические вопросы и практическое задание по проектированию базы данных. Программа ориентирована на применение полученных знаний в реальных задачах биоинженерии и биоинформатики.
- Компетенции обучающегося, формируемые в результате освоения дисциплины
- Выпускник должен обладать:
- ПК-5 Способен осуществлять поиск информации и данных в специализированных базах данных; анализировать и передавать информацию с использованием цифровых средств для решения задач биоинженерии; проводить оценку достоверности информации, строить логические умозаключения на основании поступающих информации и данных
- Образование
- Учебный план 06.05.01, 2025, (5.0), Биоинженерия и биоинформатика
- Базы данных и системы управления базами данных