Junior data scientist: младший специалист по анализу больших данных

Аналитика и Data Science
Приоритет - 2030

Образовательный центр МГТУ им. Н.Э. Баумана в целях выполнения программы стратегического академического лидерства «Приоритет-2030» разработал курс по направлению анализа данных: «Junior data scientist: младший специалист по анализу больших данных».

В настоящее время работа в сфере Big Data (больших данных) невозможна без искусственного интеллекта, а именно без нейронных сетей. Развитие этого направления приведет к тому, что к 2030 году среднестатистический человек будет взаимодействовать с устройствами, соединенными с сетями, более 5000 раз в день. Соответственно необходимы специалисты, которые будут создавать алгоритмы обработки данных для подачи их в модель нейронной сети, подбирать ее модель и архитектуру, использовать механизмы для решения реальных задач и многое другое. Курс подойдет специалистам, которые обладают базовыми знаниями в анализе больших данных и хотят изучать эту область углубленно, а также планирует профессиональный рост до позиции middle data scientist.

Продолжительность курса составляет 47 академических часов. Занятия включают в себя лекционные материалы, решение практикоориентированных кейсов, домашние задания и итоговое тестирование. Преподаватели – не только ведущие ученые – практики, но и специалисты в области больших данных (Big Data) и науке о данных (Data science).

По окончании курса слушатель получит удостоверение о повышении квалификации установленного образца.

Записаться на курс

Ближайший старт групп

11 декабря

Длительность курса

47 ак. часов

Стоимость курса

16 980 руб.

Форматы обучения

онлайн

Курс подойдет

Начинающим аналитикам

Вы сможете углубить свои знания и получить навыки для повышения до уровня middle

Программистам

Вы научитесь строить и обучать нейронные сети для выполнения практических задач

Чему вы научитесь

Выполнять обработку данных и препроцессинг для подачи их в модель нейронной сети

Подобрать модель или архитектуру нейронной сети, обучить ее для использования в практических задачах

Решать задачи классификации и регрессии с применением нейронных сетей

Программа курса
В этом курсе вас ожидает
14 тематических
модулей
47 академических
часов
В этом курсе вас ожидает
14 тематических
модулей
47 академических
часов
Введение в нейронные сети. Обзор библиотеки tensorflow.keras
    • В рамках данной темы будут рассмотрены термины и определения, библиотеки tensorflow.keras, основной функционал. Методы написания нейронных сетей. Разбор основных разделов библиотеки. Области решаемых задач.
Активационные функции
    • В рамках данной темы будут рассмотрены основные активационные функции, применяемые в нейронных сетях: linear, relu, elu, sigmoid, softmax, tang, лучшие практики применения.
Полносвязные нейронные сети. Dense слои
    • В данной теме будут рассмотрены полносвязные нейронные сети Dense слои (перцептрон). Области решаемых задач, основные особенности архитектуры.
Свёрточные нейронные сети. Conv слои
    • В рамках данной темы будут рассмотрены свёрточные нейронные сети Conv слои. Особенности архитектуры свёрточной нейронной сети. Области решаемых задач, принимаемые форматы данных на входе.
Метрики, минимизация ошибки. Градиентный спуск. Борьба с переобучением
    • В рамках данной темы будут рассмотрены основные термины и определения метрик потерь в нейронных сетях, градиентный спуск и его практическое применение, также будут рассмотрены ошибки binary-cross entropy, categorical cross entropy, расстояние кульбака-лейблера. Будет рассмотрено понятие «переобучение», случаи переобучения и методы предотвращения переобучения – случайный выброс нейронов (dropout), нормализация (batch normalization).
Построение архитектуры нейронной сети для задач бинарной и множественной классификации
    • Собрать и обучить простую нейронную сеть, решить задачу множественной классификации. Проверить точность сети, сделать визуализацию процесса обучения.
Анализ аудиосигналов. Особенности препроцессинга и архитектуры нейронной сети
    • В рамках данной темы будут рассмотрены основные принципы при проведении препроцессинга аудиосигналов и их параметризации, пересечение нуля, мел-кепстральные, частота цветности, а также оптимальные архитектуры для работы с аудиосигналами, обзор библиотеки librosa.
Сохранение моделей
    • В рамках данной темы будут рассмотрены основные методы сохранения моделей в различных форматах h5, pkl, save_model. Промежуточное сохранение и callback.
Работа с предобученными моделями
    • В рамках данной темы будут рассмотрены основные вопросы, связанные с использование моделей машинного обучения и нейронных сетей от сторонних поставщиков, понятие сигнатура модели, подготовка данных и входная размерность.
Введение в рекомендательные системы. Коллаборативная фильтрация
    • В рамках данной темы будут рассмотрены области применения рекомендательных систем, основная концепция. Будет разобран метод коллаборативная фильтрация.
Content based фильтрация
    • В рамках данной темы будет рассмотрен метод рекомендательных систем, основанный на информационном следе, потребленном контенте. Будет рассмотрена проблема холодного старта в рекомендательных системах.
Similarity based
    • В рамках данной темы будут рассмотрен метод рекомендательной системы, основанный на схожести объектов.
Сингулярное (SVD) разложение матрицы. Решение проблемы холодного старта
    • В рамках данной темы будут рассмотрена рекомендательная система, основанная на сингулярном разложении матрицы (датасета), как способ решить проблему холодного старта.
Итоговая аттестация
    • Тестирование

Требования к подготовке

Среднее профессиональное или высшее образование. Знание основ статистики и языка программирования Python. 

Связанные курсы

Расписание

Даты проведения
Время проведения курса
Дни недели
Формат обучения
11 дек
11 янв
10:00 - 10:00

Задать свой вопрос
+7 495 182-83-85
director@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00
+7 495 182-83-85
director@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00