Ближайшая дата курса: 15.12.2021

Следующая дата курса:

Junior machine learning engineer: инженер машинного обучения

Образовательный центр МГТУ им. Н.Э. Баумана в целях выполнения программы стратегического академического лидерства «Приоритет-2030» разработал бесплатный курс по направлению анализа данных: «Junior machine learning engineer: инженер машинного обучения».

К 2030 году более 30% данных будут критически важными и это только для повседневной жизни. Особое внимание сейчас обращено не только на хранение данных, но и их обработку, в том числе с использованием алгоритмов машинного обучения. Для того, чтобы разбираться в массивах больших данных недостаточно обладать навыками программирования на Python и знать основы языка SQL. Эти базовые навыки необходимо дополнить умением грамотно составлять описательный анализ, разбираться в алгоритмах машинного обучения и ориентироваться в преимуществах и недостатках алгоритмов машинного обучения. Данный курс охватывает все эти вопросы и научит подбирать модель машинного обучения, обучать и использовать в дальнейшей работе, анализируя результат. Курс подойдет специалистам, которые обладают базовыми знаниями в анализе больших данных и хотят изучать эту область углубленно.

Продолжительность курса составляет 51 академический час. Занятия включают в себя лекционные материалы, решение практикоориентированных кейсов, домашние задания и итоговое тестирование. Преподаватели – не только ведущие ученые – практики, но и специалисты в области больших данных (Big Data) и науке о данных (Data science).

По окончании курса слушатель получит удостоверение о повышении квалификации установленного образца.

По окончанию курса слушатель будет уметь:

  • выполнять препроцессинг данных, с использованием математических приёмов
  • ставить и решать элементарные задачи машинного обучения. Прогнозировать значения, определять категории объектов, делать кластеризацию и оценку вероятности.
  • подобрать модель машинного обучения,
  • обучить и использовать модели
  • снимать метрики качества модели

Во время обучения Вы узнаете:

1. Обзор библиотеки sklearn
2. Метод главных компонент PCA. Метод t-SNE для линейно разделимой выборки.
3. Кластеризация. Метод k-means, c -means
4. Иерархическая кластеризация – hierarchical clustering. Алгоритм кластеризации DBSCAN.
5. Ключевые задачи в подготовке датасетов и их важность
6. Разбалансированные датасеты и методы балансировки
7. Библиотека Beautifulsoup. Парсинг данных из html страниц.
8. Обработка категориальных признаков. LabelEncoder, One Hot encoding
9. Полная и условная вероятность, теорема Байеса
10. Байесовский вероятностный классификатор
11. Метрики классификации. Матрица ошибок (Confusion -matrix) Precision, recall, f1. ROC-AUC.
12. Кросс-валидация. Особенности применения.
13. Метод ближайших соседей k-NN. Метрики подсчета расстояния. Плюсы и минусы алгоритма.
14. Метод опорных векторов (SVM). Линейно разделимые и неразделимые выборки, методы обработки. Плюсы и минусы алгоритма.
15. Линейная регрессия. Логистическая регрессия.
16. Метод наименьших квадратов. Средняя квадратичная ошибка, средняя абсолютная ошибка.
17. Решающие деревья (Decision tree)
18. Случайный лес (Random forest)
19. Ансамбли алгоритмов. Bagging, boosting, stacking.

Продолжительность обучения по программе 52 ак.ч., в том числе 25 ак.ч. самостоятельной работы.

52 ак.ч.

52 ак.ч.

Стоимость обучения: бесплатно

Даты

Время

Цена

Место занятий

Преподаватель

Дёминов Марк Маратович

Образование
Физический факультет МГУ, кафедра теоретической физики.

Дополнительное образование
1. Независимый Московский Университет (в настоящее время «Центр непрерывного математического образования»), высший колледж математической физики.
2. Ряд бизнес-тренингов проектного управления и руководства компании Nordic Training International
3. Курсы школы анализа данных Яндекса (искусственные нейронные сети и пр.)

Опыт работы более 16 лет

  • Участие в разработке архитектуры СППР для платформенных решений в области выявления факторов, влияющих на здоровье и качество жизни (персональная предикативная аналитика, «персональный коуч») для проекта Health Heuristics.
  • Формирование пакетов документов грантовых заявок для НТИ (Хелснет). Сопровождение прохождения защит проекта на научном совете НТИ и МРГ.
    Модуль системы поддержки принятия решений по данным телеметрии о прогнозах выхода из строя узлов и агрегатов транспортного средства (заказчик – «АСК-Навигация»). Автоматическое определение по данным вибрационных и иных датчиков статуса износа узлов и деталей – штатная работа, повышенный износ, предкритическое состояние.
  • Tellme Store (постановка задачи парсинга 80 млн. профилей и 450 млн. постов пользователей соц.сетей; разработка методик оценки влияния блогеров в указанной теме на требуемую целевую аудиторию, экспресс-оценка «скоринга» блогера, аналогичная klout score)
  • Разработка и внедрение online-системы учета и сопровождения сервисного обслуживания изделий для представительство BAXI (Италия) в Pоссии (450+ сервисных центров, учет профилей более 1,3 млн реализованных и сопровождаемых изделий.)

После успешного прохождения образовательных программ, предлагаемых МГТУ им. Н. Э Баумана, вы получите один из следующих документов:

серт

Сертификат (на русском языке с дублированием информации на английском языке) установленного образца, в котором будут указаны полное наименование программы и количество часов обучения.

удо

Удостоверение о повышении квалификации (на русском языке), в котором будут указаны полное наименование программы и количество часов обучения.

* Удостоверение о повышении квалификации выдается слушателям, успешно завершившим обучение по образовательным программам повышения квалификации. Тип выбранной Вами образовательной программы Вы можете уточнить у менеджеров.

+ Программа курса

Во время обучения Вы узнаете:

1. Обзор библиотеки sklearn
2. Метод главных компонент PCA. Метод t-SNE для линейно разделимой выборки.
3. Кластеризация. Метод k-means, c -means
4. Иерархическая кластеризация – hierarchical clustering. Алгоритм кластеризации DBSCAN.
5. Ключевые задачи в подготовке датасетов и их важность
6. Разбалансированные датасеты и методы балансировки
7. Библиотека Beautifulsoup. Парсинг данных из html страниц.
8. Обработка категориальных признаков. LabelEncoder, One Hot encoding
9. Полная и условная вероятность, теорема Байеса
10. Байесовский вероятностный классификатор
11. Метрики классификации. Матрица ошибок (Confusion -matrix) Precision, recall, f1. ROC-AUC.
12. Кросс-валидация. Особенности применения.
13. Метод ближайших соседей k-NN. Метрики подсчета расстояния. Плюсы и минусы алгоритма.
14. Метод опорных векторов (SVM). Линейно разделимые и неразделимые выборки, методы обработки. Плюсы и минусы алгоритма.
15. Линейная регрессия. Логистическая регрессия.
16. Метод наименьших квадратов. Средняя квадратичная ошибка, средняя абсолютная ошибка.
17. Решающие деревья (Decision tree)
18. Случайный лес (Random forest)
19. Ансамбли алгоритмов. Bagging, boosting, stacking.

Продолжительность обучения по программе 52 ак.ч., в том числе 25 ак.ч. самостоятельной работы.

52 ак.ч.

52 ак.ч.

Стоимость обучения: бесплатно

+ Расписание

Даты

Время

Цена

Место занятий

Преподаватель

+ Преподаватели

Дёминов Марк Маратович

Образование
Физический факультет МГУ, кафедра теоретической физики.

Дополнительное образование
1. Независимый Московский Университет (в настоящее время «Центр непрерывного математического образования»), высший колледж математической физики.
2. Ряд бизнес-тренингов проектного управления и руководства компании Nordic Training International
3. Курсы школы анализа данных Яндекса (искусственные нейронные сети и пр.)

Опыт работы более 16 лет

  • Участие в разработке архитектуры СППР для платформенных решений в области выявления факторов, влияющих на здоровье и качество жизни (персональная предикативная аналитика, «персональный коуч») для проекта Health Heuristics.
  • Формирование пакетов документов грантовых заявок для НТИ (Хелснет). Сопровождение прохождения защит проекта на научном совете НТИ и МРГ.
    Модуль системы поддержки принятия решений по данным телеметрии о прогнозах выхода из строя узлов и агрегатов транспортного средства (заказчик – «АСК-Навигация»). Автоматическое определение по данным вибрационных и иных датчиков статуса износа узлов и деталей – штатная работа, повышенный износ, предкритическое состояние.
  • Tellme Store (постановка задачи парсинга 80 млн. профилей и 450 млн. постов пользователей соц.сетей; разработка методик оценки влияния блогеров в указанной теме на требуемую целевую аудиторию, экспресс-оценка «скоринга» блогера, аналогичная klout score)
  • Разработка и внедрение online-системы учета и сопровождения сервисного обслуживания изделий для представительство BAXI (Италия) в Pоссии (450+ сервисных центров, учет профилей более 1,3 млн реализованных и сопровождаемых изделий.)
+ Документы об окончании

После успешного прохождения образовательных программ, предлагаемых МГТУ им. Н. Э Баумана, вы получите один из следующих документов:

серт

Сертификат (на русском языке с дублированием информации на английском языке) установленного образца, в котором будут указаны полное наименование программы и количество часов обучения.

удо

Удостоверение о повышении квалификации (на русском языке), в котором будут указаны полное наименование программы и количество часов обучения.

* Удостоверение о повышении квалификации выдается слушателям, успешно завершившим обучение по образовательным программам повышения квалификации. Тип выбранной Вами образовательной программы Вы можете уточнить у менеджеров.

+ Отзывы