Middle data scientist: продвинутый специалист по анализу больших данных

Анализ данных и искусственный интеллект

Центр дополнительного образования МГТУ им. Н.Э. Баумана в целях выполнения программы стратегического академического лидерства «Приоритет-2030» разработал курс по направлению анализа данных: «Middle data scientist: продвинутый специалист по анализу больших данных».

Глобальная сеть больших данных к 2030 году вырастет до 55 раз, а разработанные алгоритмы позволят чаще и более гибко анализировать данные во многих отраслях и во многих ситуациях. Поэтому для специалиста по данным важнейшим качеством будет являться умение видеть логические связи в системе собранной информации, и на основе количественного анализа разрабатывать эффективные бизнес-решения. Для формирования этих навыков разработан данный курс. По окончании которого слушатели будут разбираться в архитектуре нейронных сетей, в том числе предобученных, решать задачи с их помощью, оптимизировать вычислительные мощности и многое другое. Курс подойдет специалистам, которые обладают базовыми знаниями в анализе больших данных и хотят изучать эту область углубленно.

Продолжительность курса составляет 67 академических часов. Занятия включают в себя лекционные материалы, решение практико-ориентированных кейсов, домашние задания, по итогам курса необходимо будет создать свой проект по созданию веб-приложения и защитить его. Преподаватели – не только ведущие ученые – практики, но и специалисты в области больших данных (Big Data) и науке о данных (Data science).

Для успешного освоения курса нашим слушателям предоставляются уникальные опции:

  • оперативная поддержка куратора по всем вопросам обучения в чате Telegram, где слушатель может задать вопросы как во время обучения, так и в неограниченный период времени после завершения курса,

  • онлайн-консультация эксперта-преподавателя по пройденным темам и выполнению практических заданий.

По окончании курса слушатель получит удостоверение о повышении квалификации МГТУ им. Н.Э. Баумана.

Записаться на курс

Ближайший старт групп

22 апреля

Длительность курса

67 ак. часов

Форматы обучения

свободное обучение
Конкуренция на рынке труда?
Сейчас не хватает специалистов
8 000 компаний
сейчас ищут продвинутого специалиста по анализу данных
150 000 рублей
средняя зарплата специалиста в сфере анализа данных

Курс подойдет

Программистам

Вы углубите свои знания архитектуры нейронных сетей и обработки больших массивов данных

Аналитикам

Вы изучите основные подходы к разметке и подготовке обучающей выборки при создании нейронных сетей

Чему вы научитесь

решать задачи компьютерного зрения

решать задачи обработки естественного языка

создавать продвинутые архитектуры нейронных сетей на низком уровне

визуализировать архитектуру нейронных сетей на уровне графов

Программа курса

13 тематических
модулей
67 академических
часов
67 аудиторных
часов
Рекуррентные нейронные сети. LSTM слои
  • Свёрточные нейронные сети.
Tensorflow, построение нейронных сетей на уровне графов
  • Библиотека tensorflow, понятия графов и построение нейронных сетей с применением графов.
  • Практические занятия: Загрузить датасет (кейс – классификация одежды), подготовить датасет, выполнить исследование и отбор признаков. Собрать и обучить простую нейронную сеть с применением библиотеки tensorflow.
Построение архитектуры нейронной сети для задач object detection
  • Библиотека pytorch, для создания нейронных сетей. Особенности построение нейронных сетей, как отдельных классов.
  • Практические занятия: Загрузить датасет (кейс – классификация одежды), подготовить датасет, выполнить исследование и отбор признаков. Собрать и обучить простую нейронную сеть с применением библиотеки pytorch.
Построение архитектуры нейронной сети для задач object detection
  • Основные подходы к созданию архитектур нейронных сетей, для распознаваний образов, классификации изображений. Подход по детекции объекта в кадре, с применением bounding box.
  • Практические занятия: Загрузить датасет (кейс – обнаружение самолётов), подготовить датасет, выполнить исследование и отбор признаков. Собрать и обучить нейронную сеть для object detection.
Построение архитектуры нейронной сети для задач segmentation
  • Подход к созданию архитектур нейронных сетей, для решения задач segmentation, оптимальные метрики и принцип оптимизации сетей.
  • Практические занятия: Загрузить датасет, подготовить датасет (датасет содержит размещенные изображения для обучения автопилота в автомобилях), выполнить исследование и отбор признаков. Собрать и обучить нейронную сеть для segmentation автопилота.
Задачи NLP. Препроцессинга текстовых неструктурированных данных
  • Ключевые задачи при работе с текстами, препроцессинг текстовых данных, преобразование слов в индексы и в вектора, для решения задач NLP с применением нейронных сетей. Области решаемых задач.
  • Практические занятия: Загрузить датасет (датасет содержит реферативные данные научных публикаций) подготовить датасет, выполнить препроцессинга текстовых данных.
Построение архитектуры нейронной сети для классификации текстов
  • Основные архитектуры нейронных сетей, для задач классификации текстовых данных, оптимальные метрики и активационные функции. Данные, которые подаются на вход нейронной сети и ошибки, которые минимизируются.
  • Практические занятия: Загрузить датасет (датасет содержит отзывы о автомобилях и отелях. Выбрать любую отрасль и выполнить классификацию по тональности), подготовить датасет, выполнить препроцессинга текстовых данных. Собрать и обучить нейронную сеть для классификации текстовых данных, сделать визуализацию процесса обучения, написать выводы, предложить методы оптимизации и улучшения нейронной сети.
Чат-боты и генерация текста. Особенности построения архитектуры нейронной сети
  • Основные этапы создания чат-бота, генерирующего естественную речь из скрытого многомерного пространства, оптимальные архитектуры, сложности в создании человекоподобного чат-бота.
  • Практические занятия: Загрузить датасет (датасет содержит диалоги в формате вопрос-ответ, для обучения чат-бота), подготовить датасет, выполнить препроцессинга текстовых данных, использовать архитектуру нейронной сети, подать на вход разное количество обучающей выборки в формате вопрос - ответ, сделать визуализацию обучения нейронной сети, написать выводы, предложить методы оптимизации нейронной сети.
Сегментация текстовых данных
  • Подходы к разметке и подготовке обучающей выборки, при создании архитектур нейронных сетей, для задач сегментации текстовых данных.
  • Практическая работа: Загрузить датасет (датасет содержит 1000 размеченных договоров), подготовить датасет, выполнить препроцессинга текстовых данных, использовать архитектуру нейронной сети, подать на вход разное количество сегментируемых классов, сделать визуализацию обучения нейронной сети, написать выводы, предложить методы оптимизации нейронной сети.
Контроль версионности моделей с tesorflow serving
  • Вопросы контроля версионности моделей, с применением docker образа tensorflow-serving, и вызов необходимых версий по средствам API.
  • Практические занятия: Загрузить датасет, обучить модель, сохранить в формате save_model. Обучить вторую модель, также сохранить её. Написать программу, которая будет проверять на входе цветное изображение или нет, и отправлять на распознавание в соответствующую версию.
Развёртывание облачной инфраструктуры. Обзор облачных платформ Google Cloud Platform, AWS, Sbercloud
  • Обзор основных поставщиков облачных решений, как иностранные, так и отечественные. Особенности тарификации и развертывания облачной инфраструктуры.
  • Практические занятия: Развернуть простое облако на платформе GCP с одной виртуальной машиной и одним хранилищем SSD. Сделать скриншоты рабочего instance.
Flask приложение. Выведение моделей в production
  • Описание pipline, выведения модели машинного обучения в продуктив. Создание сервисов на базе фреймворка flask. Будут разобраны основные этапы, etl процессы и взаимодействие.
  • Практические занятия: Выведение моделей в продуктив.
Итоговая аттестация
  • Тестирование.

Расписание

Даты проведения
Время проведения курса
Дни недели
Формат обучения
Стоимость
22 апр
22 мая
10:00 - 10:00
свободный график
свободное обучение
68 000 руб

Преподаватели курса

Преподавательский состав Центра дополнительного образования МГТУ им. Н.Э. Баумана состоит из профессионалов лучшего технического ВУЗа России с многолетним опытом работы в ведущих отраслевых компаниях. Многие из наших специалистов имеют ученые степени и звания.

Наши преподаватели искренне любят свое дело: структурированно и последовательно излагают материал, доступно объясняют верные решения сложных профессиональных задач и разбирают только реальный опыт крупнейших российских и зарубежных компаний. Так, после окончания обучения слушатели Центра дополнительного образования МГТУ им. Н.Э. Баумана могут сразу же применять свои знания и навыки на практике.

Резюме «Продвинутый специалист по анализу данных»

Знания и навыки

  • Сбор и анализ данных

  • Выявление закономерностей и поиск причин аномалий в данных

  • Участие в разработке новой функциональности с точки зрения аналитики

  • Предоставление структурированной информации для команды

  • Принятие решений на основе собранных данных

Заработная плата от:
150 000 руб.
Желаемая должность:
Специалист по анализу данных

Документы об окончании

Задать свой вопрос
+7 (495) 182-83-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00
+7 (495) 182-83-85
do@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00