Ближайшая дата курса: узнать дату

Следующая дата курса:

Программа профессиональной переподготовки Data Science

Чему научитесь:  По результатам обучения, слушатель курса сможет комплексно применять полученные знания для решения прикладных задач с применением data science инструментов, а именно сможет: сформировать простой запрос в базе данных с использованием SQL, сделать описательный анализ Big Data и визуализацию, ставить и решать задачи машинного обучения, подобрать модель машинного обучения или архитектуру нейронной сети, натренировать и использовать в реальных задачах, создать комплексное приложение, с обработкой входных данных, подачей в модель и получением результата.

Кол-во часов – 262.

Выпускной документ: диплом о профессиональной переподготовке.

Введение в Big data. Знакомство с основными понятиями. Статистика.

Введение в предмет

Какие бывают и точники данных, характеристики, корреляция. Типы структурированности данных

Введение в статистику. Типы распределений данных. Проверка гипотез, матрицы ошибок

Структуры данных.

Техническое задание и требование к проекту Big data, data science.

11 ак.ч.

Базы данных, их типы и моделирование. Взаимодействие пользователей с данными.

Системы хранения данных. Базы данных.

Реляционные базы данных и их моделирование.

PGAdmin

SQL, синтаксис обращения к базам данных. Простые и сложные запросы

14 ак.ч.

Языки программирования, среды исполнения и основные операционные системы, которые используются в задачах Big Data

Введение в Python, среды исполнения (IDE). Типы данных в Python.

Базовые конструкции и структуры.

Циклы и условия. Функции и классы

Библиотеки Numpy, Scipy для научных вычислений.

Библиотека Pandas, как стандарт исследования данных

Визуализация в Python и срезы данных. Библиотеки Matplotlib, seaborn, plotly.

Работа с командной строкой.  Linux, Windows.

28 ак.ч.

Основной pipeline машинного обучения и dataflow. Облачные платформы

Pipeline машинного обучения. Особенности архитектурных решений.

Sklearn – основная ML библиотека

Обучение на размеченных и неразмеченных данных.

Ленивые вычисления.

10 ак.ч.

Парсинг данных, подготовка выборки, препроцессинг и балансировка данных

Ключевые задачи в подготовке датасетов и их важность.

Нормализация и стандартизация

Поиск аномалий и выбросов. Методы обработки и визуализации.

Разбалансированные датасеты и методы балансировки

Доверительные интервалы.

Обработка категориальных признаков. LabelEncoder, One Hot encoding

16 ак.ч.

Обучение без учителя. Работа с размерностью и структурой данных.

Проблема снижения размерности данных. Метод главных компонент (Principal Component Analysis).

Алгоритмы кластеризации. Метод k-means, c-means, hierarchical clustering. Выбор алгоритма кластеризации.

11 ак.ч.

Теория вероятности и вероятностные классификаторы

Полная и условная вероятность, теорема Байеса

Байесовский вероятностный классификатор

6 ак.ч.

Классификация. Оценка качества алгоритма.

Задача классификации. Матрица ошибок (Confusion -matrix). Точность классификации. Модель анализа ROC-AUC.

Методы классификации. Метод ближайших соседей k-NN. Метод опорных векторов (SVM)

11 ак.ч.

Ансамбли и повышение точности алгоритмов.

Ансамбли решателей. Решающие деревья (Decision tree). Случайный лес (Random forest).

Ансамбли алгоритмов. Bagging, boosting, stacking. Основы составления сеток обучения.

13 ак.ч.

Регрессия

Линейная регрессия. Логистическая регрессия.

Метод наименьших квадратов. Средняя квадратичная ошибка, средняя абсолютная ошибка.

Авторегрессия ARIMA.

10 ак.ч.

Нейронные сети

Введение в искусственные нейронные сети. Биологическая модель нейрона. Активационные функции

Полносвязные нейронные сети. Методы обучения нейронных сетей. Борьба с переобучением.

Нейронные сети Кохонена

Сверточные нейронные сети

16 ак.ч.

Рекомендательные системы

Введение. Коллаборативная и Content-based фильтрация.

Сингулярное (SVD) разложение матрицы. Достоинства и недостатки

7 ак.ч.

Разработка компьютерных программ: написание программного кода и решение практических задач с применением нейронных сетей

Решение практического кейса: «Разработка приложения на языке программирования Python для решения задачи компьютерного зрения с использованием нейронных сетей»

37 ак.ч.

Создание приложений, интеграция в ИТ ландшафт

Портирование и сохранение моделей

Работа с предобученными моделями

Flask приложение. Выведение моделей в production

Контроль версионности моделей с tensorflow sesrving

Облачная платформа Kaggle для решения data science задач

24 ак.ч.

262 ак.ч.

Стоимость обучения: 120 000 р.

Даты

Время

Цена

Место занятий

Преподаватель

Соколов Григорий Владимирович

 

Образование
Пермский государственный технический университет. Механико-технологический факультет. Композиционные материалы.

Дополнительное образование
1. Пермский государственный финансово – экономический колледж при правительстве РФ. Финансист.
2. Университет искусственного интеллекта. Data scientist & Engineer

Опыт работы более 10 лет

  • Решение сложных инжиниринговых задач в области финансов, производства и ИТ.
  • Создание IT-систем с применением методов искусственного интеллекта при МГТУ им. Н.Э. Баумана.
  • Разработка и внедрение систем для Министерства обороны, ФНС, Госархива РФ, ФСО.
  • Автором программно-технического комплекса “BAUM AI” для хранения больших данных, обучения и использования моделей искусственного интеллекта без необходимости кодирования – по принципу drag-n-drop.

Бухтояров Владимир Викторович

 

Образование
Сибирский государственный аэрокосмический университет имени академика М.Ф. Решетнева, 2008 г. Бакалавр техники и технологии по направлению системный анализ.
Сибирский государственный аэрокосмический университет имени академика М.Ф. Решетнева, 2010 г. Магистр техники и технологии по направлению системный анализ

Учёная степень: Кандидат технических наук
Учёное звание: Доцент

Опыт работы более 10 лет

  • Лауреат премии Президента РФ в рамках проекта по поддержке талантливой молодежи, 2009 г.
  • Лауреат краевой именной стипендии за достижения в области технических наук, 2009 г.
  • Лауреат Премии главы г. Красноярска за достижения в научной деятельности, 2010 г.
  • Лауреат премии банка МФК за достижения в области развития информационных технологий, 2014 г.
  • Благодарственное письмо Министерства промышленности, энергетики и торговли Красноярского края за большой вклад в развитие нефтегазового комплекса и добросовестный тру, 2015.

Тынченко Вадим Сергеевич

 

Образование
СибГАУ, 2006. Бакалавр техники и технологии по направлению «Системный анализ и управление»

СибГАУ, 2008. Магистр техники и технологии по направлению «Системный анализ и управление»

Учёная степень: Кандидат технических наук
Учёное звание: Доцент

Опыт работы более 10 лет

  • Премия главы администрации Ленинского района г. Красноярска «За достижения в научно-учебной деятельности». Администрация Ленинского района г. Красноярска, 2008
  • Премия главы города Красноярска молодым талантам. Администрация г. Красноярска, 2010

Кукарцев Владислав Викторович

 

к.т.н., доцент, доцент МГТУ им. Н.Э. Баумана

Панфилов Илья Александрович

 

к.т.н., доцент, доцент МГТУ им. Н.Э. Баумана

Пересунько Евгения Олеговна

 

разработчик систем компьютерного зрения ООО «ИСС Арт»

Пересунько Павел Викторович

 

Старший преподаватель МГТУ им. Н.Э. Баумана

После успешного прохождения образовательных программ, предлагаемых МГТУ им. Н. Э Баумана, вы получите один из следующих документов:

серт

Сертификат (на русском языке с дублированием информации на английском языке) установленного образца, в котором будут указаны полное наименование программы и количество часов обучения.

удо

Удостоверение о повышении квалификации (на русском языке), в котором будут указаны полное наименование программы и количество часов обучения.

* Удостоверение о повышении квалификации выдается слушателям, успешно завершившим обучение по образовательным программам повышения квалификации. Тип выбранной Вами образовательной программы Вы можете уточнить у менеджеров.

+ Программа курса

Введение в Big data. Знакомство с основными понятиями. Статистика.

Введение в предмет

Какие бывают и точники данных, характеристики, корреляция. Типы структурированности данных

Введение в статистику. Типы распределений данных. Проверка гипотез, матрицы ошибок

Структуры данных.

Техническое задание и требование к проекту Big data, data science.

11 ак.ч.

Базы данных, их типы и моделирование. Взаимодействие пользователей с данными.

Системы хранения данных. Базы данных.

Реляционные базы данных и их моделирование.

PGAdmin

SQL, синтаксис обращения к базам данных. Простые и сложные запросы

14 ак.ч.

Языки программирования, среды исполнения и основные операционные системы, которые используются в задачах Big Data

Введение в Python, среды исполнения (IDE). Типы данных в Python.

Базовые конструкции и структуры.

Циклы и условия. Функции и классы

Библиотеки Numpy, Scipy для научных вычислений.

Библиотека Pandas, как стандарт исследования данных

Визуализация в Python и срезы данных. Библиотеки Matplotlib, seaborn, plotly.

Работа с командной строкой.  Linux, Windows.

28 ак.ч.

Основной pipeline машинного обучения и dataflow. Облачные платформы

Pipeline машинного обучения. Особенности архитектурных решений.

Sklearn – основная ML библиотека

Обучение на размеченных и неразмеченных данных.

Ленивые вычисления.

10 ак.ч.

Парсинг данных, подготовка выборки, препроцессинг и балансировка данных

Ключевые задачи в подготовке датасетов и их важность.

Нормализация и стандартизация

Поиск аномалий и выбросов. Методы обработки и визуализации.

Разбалансированные датасеты и методы балансировки

Доверительные интервалы.

Обработка категориальных признаков. LabelEncoder, One Hot encoding

16 ак.ч.

Обучение без учителя. Работа с размерностью и структурой данных.

Проблема снижения размерности данных. Метод главных компонент (Principal Component Analysis).

Алгоритмы кластеризации. Метод k-means, c-means, hierarchical clustering. Выбор алгоритма кластеризации.

11 ак.ч.

Теория вероятности и вероятностные классификаторы

Полная и условная вероятность, теорема Байеса

Байесовский вероятностный классификатор

6 ак.ч.

Классификация. Оценка качества алгоритма.

Задача классификации. Матрица ошибок (Confusion -matrix). Точность классификации. Модель анализа ROC-AUC.

Методы классификации. Метод ближайших соседей k-NN. Метод опорных векторов (SVM)

11 ак.ч.

Ансамбли и повышение точности алгоритмов.

Ансамбли решателей. Решающие деревья (Decision tree). Случайный лес (Random forest).

Ансамбли алгоритмов. Bagging, boosting, stacking. Основы составления сеток обучения.

13 ак.ч.

Регрессия

Линейная регрессия. Логистическая регрессия.

Метод наименьших квадратов. Средняя квадратичная ошибка, средняя абсолютная ошибка.

Авторегрессия ARIMA.

10 ак.ч.

Нейронные сети

Введение в искусственные нейронные сети. Биологическая модель нейрона. Активационные функции

Полносвязные нейронные сети. Методы обучения нейронных сетей. Борьба с переобучением.

Нейронные сети Кохонена

Сверточные нейронные сети

16 ак.ч.

Рекомендательные системы

Введение. Коллаборативная и Content-based фильтрация.

Сингулярное (SVD) разложение матрицы. Достоинства и недостатки

7 ак.ч.

Разработка компьютерных программ: написание программного кода и решение практических задач с применением нейронных сетей

Решение практического кейса: «Разработка приложения на языке программирования Python для решения задачи компьютерного зрения с использованием нейронных сетей»

37 ак.ч.

Создание приложений, интеграция в ИТ ландшафт

Портирование и сохранение моделей

Работа с предобученными моделями

Flask приложение. Выведение моделей в production

Контроль версионности моделей с tensorflow sesrving

Облачная платформа Kaggle для решения data science задач

24 ак.ч.

262 ак.ч.

Стоимость обучения: 120 000 р.

+ Расписание

Даты

Время

Цена

Место занятий

Преподаватель

+ Преподаватели

Соколов Григорий Владимирович

 

Образование
Пермский государственный технический университет. Механико-технологический факультет. Композиционные материалы.

Дополнительное образование
1. Пермский государственный финансово – экономический колледж при правительстве РФ. Финансист.
2. Университет искусственного интеллекта. Data scientist & Engineer

Опыт работы более 10 лет

  • Решение сложных инжиниринговых задач в области финансов, производства и ИТ.
  • Создание IT-систем с применением методов искусственного интеллекта при МГТУ им. Н.Э. Баумана.
  • Разработка и внедрение систем для Министерства обороны, ФНС, Госархива РФ, ФСО.
  • Автором программно-технического комплекса “BAUM AI” для хранения больших данных, обучения и использования моделей искусственного интеллекта без необходимости кодирования – по принципу drag-n-drop.

Бухтояров Владимир Викторович

 

Образование
Сибирский государственный аэрокосмический университет имени академика М.Ф. Решетнева, 2008 г. Бакалавр техники и технологии по направлению системный анализ.
Сибирский государственный аэрокосмический университет имени академика М.Ф. Решетнева, 2010 г. Магистр техники и технологии по направлению системный анализ

Учёная степень: Кандидат технических наук
Учёное звание: Доцент

Опыт работы более 10 лет

  • Лауреат премии Президента РФ в рамках проекта по поддержке талантливой молодежи, 2009 г.
  • Лауреат краевой именной стипендии за достижения в области технических наук, 2009 г.
  • Лауреат Премии главы г. Красноярска за достижения в научной деятельности, 2010 г.
  • Лауреат премии банка МФК за достижения в области развития информационных технологий, 2014 г.
  • Благодарственное письмо Министерства промышленности, энергетики и торговли Красноярского края за большой вклад в развитие нефтегазового комплекса и добросовестный тру, 2015.

Тынченко Вадим Сергеевич

 

Образование
СибГАУ, 2006. Бакалавр техники и технологии по направлению «Системный анализ и управление»

СибГАУ, 2008. Магистр техники и технологии по направлению «Системный анализ и управление»

Учёная степень: Кандидат технических наук
Учёное звание: Доцент

Опыт работы более 10 лет

  • Премия главы администрации Ленинского района г. Красноярска «За достижения в научно-учебной деятельности». Администрация Ленинского района г. Красноярска, 2008
  • Премия главы города Красноярска молодым талантам. Администрация г. Красноярска, 2010

Кукарцев Владислав Викторович

 

к.т.н., доцент, доцент МГТУ им. Н.Э. Баумана

Панфилов Илья Александрович

 

к.т.н., доцент, доцент МГТУ им. Н.Э. Баумана

Пересунько Евгения Олеговна

 

разработчик систем компьютерного зрения ООО «ИСС Арт»

Пересунько Павел Викторович

 

Старший преподаватель МГТУ им. Н.Э. Баумана

+ Документы об окончании

После успешного прохождения образовательных программ, предлагаемых МГТУ им. Н. Э Баумана, вы получите один из следующих документов:

серт

Сертификат (на русском языке с дублированием информации на английском языке) установленного образца, в котором будут указаны полное наименование программы и количество часов обучения.

удо

Удостоверение о повышении квалификации (на русском языке), в котором будут указаны полное наименование программы и количество часов обучения.

* Удостоверение о повышении квалификации выдается слушателям, успешно завершившим обучение по образовательным программам повышения квалификации. Тип выбранной Вами образовательной программы Вы можете уточнить у менеджеров.

+ Отзывы