Data Science. Уровень 2: Машинное обучение
Машинное обучение (machine learning) — один из основным методов для дата-сайентиста, специалиста по работе с большими данными. Основная идея машинного обучения — на основе методов математической статистики и оптимизации создать самообучающийся алгоритм, который будет находить связи и закономерности в больших массивах неструктурированных данных.
На втором уровне подготовки дата сайентистов в Образовательном центре МГТУ им. Н.Э. Баумана Вы научитесь:
- Основам работы машинного обучения
- Использовать метод ближайших соседенй (kNN)
- Работать Основным метрикам в задачах бинарной классификации
- Подготавливать и нормализовать данные для последующей обработки
- Работать с атрибутами методом опорных векторов SVM
- Работать с методами регрессивного и кластерного анализов
- Разрабатывать рекомендательные системы
Для успешного усвоения курса требуется знания по курсу “Data Science. Уровень 1: Основные технологии. Python для анализа данных” или аналогичная подготовка.
Продолжить обучение можно на курсе “Data Science. Уровень 3: Нейронные сети”
Во время обучения Вы узнаете:
Введение в машинное обучение
- Понятие «машинное обучение».
- Обоснованность использования.
- Подразделы машинного обучения.
- Обучение с учителем, обучение без учителя, обучение с подкреплением.
1,5 ак.ч.
Метод ближайших соседей (kNN)
- Описание метода kNN.
- Область решаемых задач.
- Метрики качества.
- Разбор кода с примером реализации алгоритма.
3,5 ак.ч.
Метрики и их практическое применение
- Что такое метрики.
- Метрики в задачах бинарной классификации.
- Разбор основных метрик качества для различных типов задач.
4,5 ак.ч.
Подготовка и нормализация данных. Уменьшение размерности данных – Метод главных компонент
- Этапы подготовки данных.
- Понятие нормализация.
- Почему данные нужно нормализовывать.
- Уменьшение размерности – методы PCA, t-SNE.
- Разбор кода с примерами реализации метода главных компонент.
2,5 ак.ч.
Выбор атрибутов при решении задачи. Метод опорных векторов SVM
- Выбор атрибутов для анализа.
- Метод SVM, предсказание вероятности принадлежности классу.
- Суть алгоритма, линейно разделимые и неразделимые выборки.
- Плюсы и минусы алгоритма. Разбор кода с реализацией алгоритма SVM.
2,5 ак.ч.
Регрессия (прогнозирование конкретного значения)
- Задача регрессии.
- Линейная регрессия, логистическая регрессия.
- Регрессии: разбор кода с реализацией алгоритма.
4,5 ак.ч.
Decision trees, random forest
- Решающие деревья и случайный лес.
- Суть алгоритмов. Плюсы и минусы.
- Decision trees, random forest: разбор кода с реализацией алгоритма.
4,5 ак.ч.
Разбалансированные датасеты и методы их балансировки
- Понятие разбалансировки.
- Причины возникновения.
- Методы балансировки датасетов.
- Разбор кода – работа с разбалансированным датасетом.
1,5 ак.ч.
Bagging, boosting, stacking – алгоритмы повышения точности
- Цели и задачи повышения точности.
- Bagging, boosting, stacking.
- Разбор кода с реализацией алгоритмов.
3,5 ак.ч.
Кластеризация, метод k-mean. Полная и условная вероятность, теорема Байеса
- Понятие кластеризация.
- Алгоритм k-mean, c-mean.
- Полная и условная вероятность, теорема Байеса.
- Алгоритм k-mean, c-mean: разбор кода с алгоритмами кластеризации и байесовскими классификаторами.
4,5 ак.ч.
Рекомендательные системы. Персонализированные и неперсонализированные, проблема холодного старта
- Что такое рекомендательная система.
- Типы рекомендательных систем.
- Области применения.
- Понятие холодного старта.
- Рекомендательная система: разбор кода с рекомендательными системами.
5 ак.ч.
Внедрение моделей в production
- Сохранение моделей машинного обучения.
- Библиотека Flask для веб-приложений.
- Библиотека git для контроля версионности.
- Пошаговый алгоритм действий по выведению модели в Production.
- Учебный хостинг heroku.com.
5 ак.ч.
Построение модели и внедрение в Production
- Создание веб приложения – анализ сердечно-сосудистых заболеваний.
- Обучение модели и выведение в Production.
5 ак.ч.
48 ак.ч.
Стоимость обучения: 34 250 р.
Даты
Время
Цена
Место занятий
Преподаватель
09-08
март апр
2021
18:30 – 21:40
вечерняя
вт чт
14 490 руб.
м. Бауманская
МГТУ им. Баумана
Соколов Григорий Владимирович
Образование
Пермский государственный технический университет. Механико-технологический факультет. Композиционные материалы.
Дополнительное образование
1. Пермский государственный финансово – экономический колледж при правительстве РФ. Финансист.
2. Университет искусственного интеллекта. Data scientist & Engineer
Опыт работы более 10 лет
- Решение сложных инжиниринговых задач в области финансов, производства и ИТ.
- Создание IT-систем с применением методов искусственного интеллекта при МГТУ им. Н.Э. Баумана.
- Разработка и внедрение систем для Министерства обороны, ФНС, Госархива РФ, ФСО.
- Автором программно-технического комплекса “BAUM AI” для хранения больших данных, обучения и использования моделей искусственного интеллекта без необходимости кодирования – по принципу drag-n-drop.
После успешного прохождения образовательных программ, предлагаемых МГТУ им. Н. Э Баумана, вы получите один из следующих документов:
Сертификат (на русском языке с дублированием информации на английском языке) установленного образца, в котором будут указаны полное наименование программы и количество часов обучения.
Удостоверение о повышении квалификации (на русском языке), в котором будут указаны полное наименование программы и количество часов обучения.
* Удостоверение о повышении квалификации выдается слушателям, успешно завершившим обучение по образовательным программам повышения квалификации. Тип выбранной Вами образовательной программы Вы можете уточнить у менеджеров.
- + Программа курса
-
Во время обучения Вы узнаете:
Введение в машинное обучение
- Понятие «машинное обучение».
- Обоснованность использования.
- Подразделы машинного обучения.
- Обучение с учителем, обучение без учителя, обучение с подкреплением.
1,5 ак.ч.
Метод ближайших соседей (kNN)
- Описание метода kNN.
- Область решаемых задач.
- Метрики качества.
- Разбор кода с примером реализации алгоритма.
3,5 ак.ч.
Метрики и их практическое применение
- Что такое метрики.
- Метрики в задачах бинарной классификации.
- Разбор основных метрик качества для различных типов задач.
4,5 ак.ч.
Подготовка и нормализация данных. Уменьшение размерности данных – Метод главных компонент
- Этапы подготовки данных.
- Понятие нормализация.
- Почему данные нужно нормализовывать.
- Уменьшение размерности – методы PCA, t-SNE.
- Разбор кода с примерами реализации метода главных компонент.
2,5 ак.ч.
Выбор атрибутов при решении задачи. Метод опорных векторов SVM
- Выбор атрибутов для анализа.
- Метод SVM, предсказание вероятности принадлежности классу.
- Суть алгоритма, линейно разделимые и неразделимые выборки.
- Плюсы и минусы алгоритма. Разбор кода с реализацией алгоритма SVM.
2,5 ак.ч.
Регрессия (прогнозирование конкретного значения)
- Задача регрессии.
- Линейная регрессия, логистическая регрессия.
- Регрессии: разбор кода с реализацией алгоритма.
4,5 ак.ч.
Decision trees, random forest
- Решающие деревья и случайный лес.
- Суть алгоритмов. Плюсы и минусы.
- Decision trees, random forest: разбор кода с реализацией алгоритма.
4,5 ак.ч.
Разбалансированные датасеты и методы их балансировки
- Понятие разбалансировки.
- Причины возникновения.
- Методы балансировки датасетов.
- Разбор кода – работа с разбалансированным датасетом.
1,5 ак.ч.
Bagging, boosting, stacking – алгоритмы повышения точности
- Цели и задачи повышения точности.
- Bagging, boosting, stacking.
- Разбор кода с реализацией алгоритмов.
3,5 ак.ч.
Кластеризация, метод k-mean. Полная и условная вероятность, теорема Байеса
- Понятие кластеризация.
- Алгоритм k-mean, c-mean.
- Полная и условная вероятность, теорема Байеса.
- Алгоритм k-mean, c-mean: разбор кода с алгоритмами кластеризации и байесовскими классификаторами.
4,5 ак.ч.
Рекомендательные системы. Персонализированные и неперсонализированные, проблема холодного старта
- Что такое рекомендательная система.
- Типы рекомендательных систем.
- Области применения.
- Понятие холодного старта.
- Рекомендательная система: разбор кода с рекомендательными системами.
5 ак.ч.
Внедрение моделей в production
- Сохранение моделей машинного обучения.
- Библиотека Flask для веб-приложений.
- Библиотека git для контроля версионности.
- Пошаговый алгоритм действий по выведению модели в Production.
- Учебный хостинг heroku.com.
5 ак.ч.
Построение модели и внедрение в Production
- Создание веб приложения – анализ сердечно-сосудистых заболеваний.
- Обучение модели и выведение в Production.
5 ак.ч.
48 ак.ч.
Стоимость обучения: 34 250 р.
- + Расписание
-
Даты
Время
Цена
Место занятий
Преподаватель
09-08
март апр
2021
18:30 – 21:40
вечерняя
вт чт
14 490 руб.
м. Бауманская
МГТУ им. Баумана - + Преподаватели
-
Соколов Григорий Владимирович
Образование
Пермский государственный технический университет. Механико-технологический факультет. Композиционные материалы.Дополнительное образование
1. Пермский государственный финансово – экономический колледж при правительстве РФ. Финансист.
2. Университет искусственного интеллекта. Data scientist & EngineerОпыт работы более 10 лет
- Решение сложных инжиниринговых задач в области финансов, производства и ИТ.
- Создание IT-систем с применением методов искусственного интеллекта при МГТУ им. Н.Э. Баумана.
- Разработка и внедрение систем для Министерства обороны, ФНС, Госархива РФ, ФСО.
- Автором программно-технического комплекса “BAUM AI” для хранения больших данных, обучения и использования моделей искусственного интеллекта без необходимости кодирования – по принципу drag-n-drop.
- + Документы об окончании
-
После успешного прохождения образовательных программ, предлагаемых МГТУ им. Н. Э Баумана, вы получите один из следующих документов:
Сертификат (на русском языке с дублированием информации на английском языке) установленного образца, в котором будут указаны полное наименование программы и количество часов обучения.
Удостоверение о повышении квалификации (на русском языке), в котором будут указаны полное наименование программы и количество часов обучения.
* Удостоверение о повышении квалификации выдается слушателям, успешно завершившим обучение по образовательным программам повышения квалификации. Тип выбранной Вами образовательной программы Вы можете уточнить у менеджеров.
- + Отзывы
-