Junior data scientist: младший специалист по анализу больших данных

Анализ данных и искусственный интеллект

Центр дополнительного образования МГТУ им. Н.Э. Баумана в целях выполнения программы стратегического академического лидерства «Приоритет-2030» разработал курс по направлению анализа данных: «Junior data scientist: младший специалист по анализу больших данных».

В настоящее время работа в сфере Big Data (больших данных) невозможна без искусственного интеллекта, а именно без нейронных сетей. Развитие этого направления приведет к тому, что к 2030 году среднестатистический человек будет взаимодействовать с устройствами, соединенными с сетями, более 5000 раз в день. Соответственно необходимы специалисты, которые будут создавать алгоритмы обработки данных для подачи их в модель нейронной сети, подбирать ее модель и архитектуру, использовать механизмы для решения реальных задач и многое другое. Курс подойдет специалистам, которые обладают базовыми знаниями в анализе больших данных и хотят изучать эту область углубленно, а также планирует профессиональный рост до позиции middle data scientist.

Продолжительность курса составляет 47 академических часов. Занятия включают в себя лекционные материалы, решение практико-ориентированных кейсов, домашние задания и итоговое тестирование. Преподаватели – не только ведущие ученые – практики, но и специалисты в области больших данных (Big Data) и науке о данных (Data science).

Для успешного освоения курса нашим слушателям предоставляются уникальные опции:

  • оперативная поддержка куратора по всем вопросам обучения в чате Telegram, где слушатель может задать вопросы как во время обучения, так и в неограниченный период времени после завершения курса,

  • онлайн-консультация эксперта-преподавателя по пройденным темам и выполнению практических заданий.

По окончании курса слушатель получит удостоверение о повышении квалификации МГТУ им. Н.Э. Баумана.

Записаться на курс

Ближайший старт групп

03 апреля

Длительность курса

47 ак. часов

Форматы обучения

свободное обучение
Конкуренция на рынке труда?
Сейчас не хватает специалистов
9 000 компаний
сейчас ищут младшего специалиста по анализу данных
80 000 рублей
средняя зарплата специалиста в сфере аналитики данных

Курс подойдет

Начинающим аналитикам

Вы сможете углубить свои знания и получить навыки для повышения до уровня middle

Программистам

Вы научитесь строить и обучать нейронные сети для выполнения практических задач

Чему вы научитесь

выполнять обработку данных и препроцессинг для подачи их в модель нейронной сети

подбирать модель или архитектуру нейронной сети, обучить ее для использования в практических задачах

решать задачи классификации и регрессии с применением нейронных сетей

Программа курса

14 тематических
модулей
47 академических
часов
47 аудиторных
часов
Введение в нейронные сети. Обзор библиотеки tensorflow.keras
  • В рамках данной темы будут рассмотрены термины и определения, библиотеки tensorflow.keras, основной функционал. Методы написания нейронных сетей. Разбор основных разделов библиотеки. Области решаемых задач.
Активационные функции
  • В рамках данной темы будут рассмотрены основные активационные функции, применяемые в нейронных сетях: linear, relu, elu, sigmoid, softmax, tang, лучшие практики применения.
Полносвязные нейронные сети. Dense слои
  • В данной теме будут рассмотрены полносвязные нейронные сети Dense слои (перцептрон). Области решаемых задач, основные особенности архитектуры.
Свёрточные нейронные сети. Conv слои
  • В рамках данной темы будут рассмотрены свёрточные нейронные сети Conv слои. Особенности архитектуры свёрточной нейронной сети. Области решаемых задач, принимаемые форматы данных на входе.
Метрики, минимизация ошибки. Градиентный спуск. Борьба с переобучением
  • В рамках данной темы будут рассмотрены основные термины и определения метрик потерь в нейронных сетях, градиентный спуск и его практическое применение, также будут рассмотрены ошибки binary-cross entropy, categorical cross entropy, расстояние кульбака-лейблера. Будет рассмотрено понятие «переобучение», случаи переобучения и методы предотвращения переобучения – случайный выброс нейронов (dropout), нормализация (batch normalization).
Построение архитектуры нейронной сети для задач бинарной и множественной классификации
  • Собрать и обучить простую нейронную сеть, решить задачу множественной классификации. Проверить точность сети, сделать визуализацию процесса обучения.
Анализ аудиосигналов. Особенности препроцессинга и архитектуры нейронной сети
  • В рамках данной темы будут рассмотрены основные принципы при проведении препроцессинга аудиосигналов и их параметризации, пересечение нуля, мел-кепстральные, частота цветности, а также оптимальные архитектуры для работы с аудиосигналами, обзор библиотеки librosa.
Сохранение моделей
  • В рамках данной темы будут рассмотрены основные методы сохранения моделей в различных форматах h5, pkl, save_model. Промежуточное сохранение и callback.
Работа с предобученными моделями
  • В рамках данной темы будут рассмотрены основные вопросы, связанные с использование моделей машинного обучения и нейронных сетей от сторонних поставщиков, понятие сигнатура модели, подготовка данных и входная размерность.
Введение в рекомендательные системы. Коллаборативная фильтрация
  • В рамках данной темы будут рассмотрены области применения рекомендательных систем, основная концепция. Будет разобран метод коллаборативная фильтрация.
Content based фильтрация
  • В рамках данной темы будет рассмотрен метод рекомендательных систем, основанный на информационном следе, потребленном контенте. Будет рассмотрена проблема холодного старта в рекомендательных системах.
Similarity based
  • В рамках данной темы будут рассмотрен метод рекомендательной системы, основанный на схожести объектов.
Сингулярное (SVD) разложение матрицы. Решение проблемы холодного старта
  • В рамках данной темы будут рассмотрена рекомендательная система, основанная на сингулярном разложении матрицы (датасета), как способ решить проблему холодного старта.
Итоговая аттестация
  • Тестирование.

Расписание

Даты проведения
Время проведения курса
Дни недели
Формат обучения
Стоимость
03 апр
04 мая
10:00 - 10:00
свободный график
свободное обучение
26 180 руб

Преподаватели курса

Преподавательский состав Центра дополнительного образования МГТУ им. Н.Э. Баумана состоит из профессионалов лучшего технического ВУЗа России с многолетним опытом работы в ведущих отраслевых компаниях. Многие из наших специалистов имеют ученые степени и звания.

Наши преподаватели искренне любят свое дело: структурированно и последовательно излагают материал, доступно объясняют верные решения сложных профессиональных задач и разбирают только реальный опыт крупнейших российских и зарубежных компаний. Так, после окончания обучения слушатели Центра дополнительного образования МГТУ им. Н.Э. Баумана могут сразу же применять свои знания и навыки на практике.

Резюме «Младший специалист по анализу данных»

Знания и навыки

  • Сбор данных из различных источников

  • Представление полученных результатов в доступной и наглядной форме

  • Оценка качества данных и проведение их очистки и проверки

  • Работа с неструктурированными данными и их структурирование

Заработная плата от:
80 000 руб.
Желаемая должность:
Специалист по анализу данных

Документы об окончании

Задать свой вопрос
+7 (495) 182-83-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00
+7 (495) 182-83-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00