Middle data scientist: продвинутый специалист по анализу больших данных

Аналитика и Data Science
Приоритет - 2030

Образовательный центр МГТУ им. Н.Э. Баумана в целях выполнения программы стратегического академического лидерства «Приоритет-2030» разработал курс по направлению анализа данных: «Middle data scientist: продвинутый специалист по анализу больших данных».

Глобальная сеть больших данных к 2030 году вырастет до 55 раз, а разработанные алгоритмы позволят чаще и более гибко анализировать данные во многих отраслях и во многих ситуациях. Поэтому для специалиста по данным важнейшим качеством будет являться умение видеть логические связи в системе собранной информации, и на основе количественного анализа разрабатывать эффективные бизнес-решения. Для формирования этих навыков разработан данный курс. По окончании которого слушатели будут разбираться в архитектуре нейронных сетей, в том числе предобученных, решать задачи с их помощью, оптимизировать вычислительные мощности и многое другое. Курс подойдет специалистам, которые обладают базовыми знаниями в анализе больших данных и хотят изучать эту область углубленно.

Продолжительность курса составляет 67 академических часов. Занятия включают в себя лекционные материалы, решение практикоориентированных кейсов, домашние задания, по итогам курса необходимо будет создать свой проект по созданию веб-приложения и защитить его. Преподаватели – не только ведущие ученые – практики, но и специалисты в области больших данных (Big Data) и науке о данных (Data science).

По окончании курса слушатель получит удостоверение о повышении квалификации установленного образца.

Записаться на курс

Ближайший старт групп

11 декабря

Длительность курса

67 ак. часов

Стоимость курса

19 500 руб.

Форматы обучения

онлайн

Курс подойдет

Программистам

Вы углубите свои знания архитектуры нейронных сетей и обработки больших массивов данных

Аналитикам

Вы изучите основные подходы к разметке и подготовке обучающей выборки при создании нейронных сетей

Чему вы научитесь

Решать задачи компьютерного зрения

Решать задачи обработки естественного языка

Создавать продвинутые архитектуры нейронных сетей на низком уровне

Визуализировать архитектуру нейронных сетей на уровне графов

Программа курса
В этом курсе вас ожидает
13 тематических
модулей
67 академических
часов
В этом курсе вас ожидает
13 тематических
модулей
67 академических
часов
Рекуррентные нейронные сети. LSTM слои
    • Свёрточные нейронные сети
Tensorflow, построение нейронных сетей на уровне графов
    • Библиотека tensorflow, понятия графов и построение нейронных сетей с применением графов.
    • Практические занятия: Загрузить датасет (кейс – классификация одежды), подготовить датасет, выполнить исследование и отбор признаков. Собрать и обучить простую нейронную сеть с применением библиотеки tensorflow.
Построение архитектуры нейронной сети для задач object detection
    • Библиотека pytorch, для создания нейронных сетей. Особенности построение нейронных сетей, как отдельных классов.
    • Практические занятия: Загрузить датасет (кейс – классификация одежды), подготовить датасет, выполнить исследование и отбор признаков. Собрать и обучить простую нейронную сеть с применением библиотеки pytorch.
Построение архитектуры нейронной сети для задач object detection
    • Основные подходы к созданию архитектур нейронных сетей, для распознаваний образов, классификации изображений. Подход по детекции объекта в кадре, с применением bounding box.
    • Практические занятия: Загрузить датасет (кейс – обнаружение самолётов), подготовить датасет, выполнить исследование и отбор признаков. Собрать и обучить нейронную сеть для object detection.
Построение архитектуры нейронной сети для задач segmentation
    • Подход к созданию архитектур нейронных сетей, для решения задач segmentation, оптимальные метрики и принцип оптимизации сетей.
    • Практические занятия: Загрузить датасет, подготовить датасет (датасет содержит размещенные изображения для обучения автопилота в автомобилях), выполнить исследование и отбор признаков. Собрать и обучить нейронную сеть для segmentation автопилота.
Задачи NLP. Препроцессинга текстовых неструктурированных данных
    • Ключевые задачи при работе с текстами, препроцессинг текстовых данных, преобразование слов в индексы и в вектора, для решения задач NLP с применением нейронных сетей. Области решаемых задач.
    • Практические занятия: Загрузить датасет (датасет содержит реферативные данные научных публикаций) подготовить датасет, выполнить препроцессинга текстовых данных.
Построение архитектуры нейронной сети для классификации текстов
    • Основные архитектуры нейронных сетей, для задач классификации текстовых данных, оптимальные метрики и активационные функции. Данные, которые подаются на вход нейронной сети и ошибки, которые минимизируются.
    • Практические занятия: Загрузить датасет (датасет содержит отзывы о автомобилях и отелях. Выбрать любую отрасль и выполнить классификацию по тональности), подготовить датасет, выполнить препроцессинга текстовых данных. Собрать и обучить нейронную сеть для классификации текстовых данных, сделать визуализацию процесса обучения, написать выводы, предложить методы оптимизации и улучшения нейронной сети.
Чат-боты и генерация текста. Особенности построения архитектуры нейронной сети
    • Основные этапы создания чат-бота, генерирующего естественную речь из скрытого многомерного пространства, оптимальные архитектуры, сложности в создании человекоподобного чат-бота.
    • Практические занятия: Загрузить датасет (датасет содержит диалоги в формате вопрос-ответ, для обучения чат-бота), подготовить датасет, выполнить препроцессинга текстовых данных, использовать архитектуру нейронной сети, подать на вход разное количество обучающей выборки в формате вопрос - ответ, сделать визуализацию обучения нейронной сети, написать выводы, предложить методы оптимизации нейронной сети.
Сегментация текстовых данных
    • Подходы к разметке и подготовке обучающей выборки, при создании архитектур нейронных сетей, для задач сегментации текстовых данных.
    • Практическая работа: Загрузить датасет (датасет содержит 1000 размеченных договоров), подготовить датасет, выполнить препроцессинга текстовых данных, использовать архитектуру нейронной сети, подать на вход разное количество сегментируемых классов, сделать визуализацию обучения нейронной сети, написать выводы, предложить методы оптимизации нейронной сети.
Контроль версионности моделей с tesorflow serving
    • Вопросы контроля версионности моделей, с применением docker образа tensorflow-serving, и вызов необходимых версий по средствам API.
    • Практические занятия: Загрузить датасет, обучить модель, сохранить в формате save_model. Обучить вторую модель, также сохранить её. Написать программу, которая будет проверять на входе цветное изображение или нет, и отправлять на распознавание в соответствующую версию.
Развёртывание облачной инфраструктуры. Обзор облачных платформ Google Cloud Platform, AWS, Sbercloud
    • Обзор основных поставщиков облачных решений, как иностранные, так и отечественные. Особенности тарификации и развертывания облачной инфраструктуры.
    • Практические занятия: Развернуть простое облако на платформе GCP с одной виртуальной машиной и одним хранилищем SSD. Сделать скриншоты рабочего instance.
Flask приложение. Выведение моделей в production
    • Описание pipline, выведения модели машинного обучения в продуктив. Создание сервисов на базе фреймворка flask. Будут разобраны основные этапы, etl процессы и взаимодействие.
    • Практические занятия: Выведение моделей в продуктив.
Итоговая аттестация
    • Тестирование

Требования к подготовке

Среднее профессиональное или высшее образование. Базовые знания в области анализа больших данных, знание языка программирования Python.

Связанные курсы

Расписание

Даты проведения
Время проведения курса
Дни недели
Формат обучения
11 дек
11 янв
10:00 - 10:00

Задать свой вопрос
+7 495 182-83-85
director@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00
+7 495 182-83-85
director@bmstu.ru Мы работаем ежедневно с 9:00 до 21:00