Junior data scientist: младший специалист по анализу больших данных
Приоритет - 2030
Аналитика и Data Science

Образовательный центр МГТУ им. Н.Э. Баумана в целях выполнения программы стратегического академического лидерства «Приоритет-2030» разработал курс по направлению анализа данных: «Junior data scientist: младший специалист по анализу больших данных».

В настоящее время работа в сфере Big Data (больших данных) невозможна без искусственного интеллекта, а именно без нейронных сетей. Развитие этого направления приведет к тому, что к 2030 году среднестатистический человек будет взаимодействовать с устройствами, соединенными с сетями, более 5000 раз в день. Соответственно необходимы специалисты, которые будут создавать алгоритмы обработки данных для подачи их в модель нейронной сети, подбирать ее модель и архитектуру, использовать механизмы для решения реальных задач и многое другое. Курс подойдет специалистам, которые обладают базовыми знаниями в анализе больших данных и хотят изучать эту область углубленно, а также планирует профессиональный рост до позиции middle data scientist.

Продолжительность курса составляет 48 академических часов. Занятия включают в себя лекционные материалы, решение практикоориентированных кейсов, домашние задания и итоговое тестирование. Преподаватели – не только ведущие ученые – практики, но и специалисты в области больших данных (Big Data) и науке о данных (Data science).

По окончании курса слушатель получит удостоверение о повышении квалификации установленного образца.

Для кого
подойдет этот курс
Начинающим аналитикам

Вы сможете углубить свои знания и получить навыки для повышения до уровня middle

Программистам

Вы научитесь строить и обучать нейронные сети для выполнения практических задач

Чему вы научитесь

Выполнять обработку данных и препроцессинг для подачи их в модель нейронной сети

Подобрать модель или архитектуру нейронной сети, обучить ее для использования в практических задачах

Решать задачи классификации и регрессии с применением нейронных сетей

Программа курса
В этом курсе вас ожидает
13 тематических
модулей
25 академических
часов
В этом курсе вас ожидает
13 тематических
модулей
25 академических
часов
Введение в нейронные сети. Обзор библиотеки tensorflow.keras
    • В рамках данной темы будут рассмотрены термины и определения, библиотеки tensorflow.keras, основной функционал. Методы написания нейронных сетей. Разбор основных разделов библиотеки. Области решаемых задач.
Активационные функции
    • В рамках данной темы будут рассмотрены основные активационные функции, применяемые в нейронных сетях: linear, relu, elu, sigmoid, softmax, tang, лучшие практики применения.
Полносвязные нейронные сети. Dense слои
    • В данной теме будут рассмотрены полносвязные нейронные сети Dense слои (перцептрон). Области решаемых задач, основные особенности архитектуры.
Свёрточные нейронные сети. Conv слои
    • В рамках данной темы будут рассмотрены свёрточные нейронные сети Conv слои. Особенности архитектуры свёрточной нейронной сети. Области решаемых задач, принимаемые форматы данных на входе.
Метрики, минимизация ошибки. Градиентный спуск. Борьба с переобучением
    • В рамках данной темы будут рассмотрены основные термины и определения метрик потерь в нейронных сетях, градиентный спуск и его практическое применение, также будут рассмотрены ошибки binary-cross entropy, categorical cross entropy, расстояние кульбака-лейблера. Будет рассмотрено понятие «переобучение», случаи переобучения и методы предотвращения переобучения – случайный выброс нейронов (dropout), нормализация (batch normalization).
Построение архитектуры нейронной сети для задач бинарной и множественной классификации
    • Собрать и обучить простую нейронную сеть, решить задачу множественной классификации. Проверить точность сети, сделать визуализацию процесса обучения.
Анализ аудиосигналов. Особенности препроцессинга и архитектуры нейронной сети
    • В рамках данной темы будут рассмотрены основные принципы при проведении препроцессинга аудиосигналов и их параметризации, пересечение нуля, мел-кепстральные, частота цветности, а также оптимальные архитектуры для работы с аудиосигналами, обзор библиотеки librosa.
Сохранение моделей
    • В рамках данной темы будут рассмотрены основные методы сохранения моделей в различных форматах h5, pkl, save_model. Промежуточное сохранение и callback.
Работа с предобученными моделями
    • В рамках данной темы будут рассмотрены основные вопросы, связанные с использование моделей машинного обучения и нейронных сетей от сторонних поставщиков, понятие сигнатура модели, подготовка данных и входная размерность.
Введение в рекомендательные системы. Коллаборативная фильтрация
    • В рамках данной темы будут рассмотрены области применения рекомендательных систем, основная концепция. Будет разобран метод коллаборативная фильтрация.
Content based фильтрация
    • В рамках данной темы будет рассмотрен метод рекомендательных систем, основанный на информационном следе, потребленном контенте. Будет рассмотрена проблема холодного старта в рекомендательных системах.
Similarity based
    • В рамках данной темы будут рассмотрен метод рекомендательной системы, основанный на схожести объектов.
Сингулярное (SVD) разложение матрицы. Решение проблемы холодного старта
    • В рамках данной темы будут рассмотрена рекомендательная система, основанная на сингулярном разложении матрицы (датасета), как способ решить проблему холодного старта.
Требования к подготовке

Среднее профессиональное или высшее образование. Знание основ статистики и языка программирования Python. 

Связанные курсы
Задать свой вопрос
+7 495 182-83-85
edu@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00
+7 495 182-83-85
edu@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00