Закрыто

Машинное обучение без учителя на Python: полный курс [Udemy] [Центр digital-профессий ITtensive]

Тема в разделе "Курсы по программированию", создана пользователем Топикстартер, 19 апр 2021.

Цена: 999р.-90%
Взнос: 94р.
100%

Основной список: 42 участников

Статус обсуждения:
Комментирование ограничено.
  1. 19 апр 2021
    #1
    Топикстартер
    Топикстартер ЧКЧлен клуба
    Машинное обучение без учителя на Python: полный курс
    Выигрываем хакатоны по выделению факторов (PCA, ICA, NMF, MDS, t-SNE) и кластеризации (К-средних, DBSCAN, OPTICS, SOM)

    Описание
    Мы разберем 2 задачи с хакатонов 2020 года:

    1. По выделению факторов, в наибольшей степени влияющих на продолжительность жизни в России, с точки зрения фундаментальных и прикладных подходов к понижению размерности данных. В заключении построим ансамбль моделей для предсказания продолжительности жизни, базируясь на выделенных факторах.

    2. По прогнозу срока экспозиции объявлений с хакатона Яндекс.Недвижимости - решим ее с помощью методов кластеризации и поиска аномалий.

    Курс разбит на 7 частей. В первой части мы последовательно пройдем все этапы работы с данными: от видов задач и их постановки до работы с моделями машинного обучения для минимизации предсказательной ошибки. Дополнительно рассмотрим фундаментальные основы построения моделей машинного обучения, базовые метрики и наиболее простые модели - линейную регрессии, решающие деревья и случайный лес. А также ансамбли машинного обучения.

    Во второй части на практике разберем:
    • Очистку и предобработку данных - ETL

    • Линейную регрессию для экстраполяции данных

    • Линейную регрессию с регуляризацией для выделения факторов

    • Информационные критерии понижения размерности
    В заключении создадим ансамбль стекинга из простых моделей понижения размерности.

    Третья часть посвящена матричным методам:
    • Метод главных компонент (PCA)

    • Сингулярное разложение (SVD)

    • Анализ независимых компонент (ICA)

    • Положительно-определенные матрицы (NMF)
    Уточним решение задачи обучения без учителя через матричные методы.

    В четвертой части рассмотрим нелинейные подходы:
    • Многомерное шкалирование (MDS).

    • t-SNE

    • UMAP

    • LargeVis
    Стабилизируем ансамбль понижения размерности и используем его для предсказания продолжительности жизни в России, основываясь на наиболее важных макроэкономических показателях.

    Пятая часть посвящена базовым моделям кластеризации:
    • Изучите внешние и внутренние метрики кластеризации.

    • Разберете модели К-средних и FOREL и потренируетесь в их применении.

    • Рассмотрите принципы работы агломеративной кластеризации и используете ее на практике.

    • Узнаете про расстояние Махаланобиса и работу GMM.
    В качестве задания соберем простую модель кластеризации исходных данных.

    В шестой части перейдем к продвинутой кластеризации:
    • Погрузитесь в различия моделей DBSCAN, HDBSCAN и OPTICS.

    • Разберете особенности модели распространения близости.

    • Посмотрите на расширяющийся нейронный газ.

    • Запустите и обучите самоорганизующиеся карты Кохонена (SOM).

    • Столкнетесь с матрицей Кирхгофа и спектральной кластеризацией.
    И соберем ансамбль из несколько моделей кластеризации.

    В завершении:
    • Изучите поиск аномалий и метрику pAUC.

    • Используете тест Смирнова-Граббса на практике.

    • Потренируетесь в эллипсоидальной аппроксимации.

    • Разберете разницу между LOF и ABOD.

    • Обучите и используете модель COPOD.

    • Вырастите как iForest, как и расширенный лес изоляции.
    В финале соберем свое решение задачи Хакатона 2020 года.

    Для кого этот курс:
    • Аналитики Python, изучающие машинное обучение
    • Программисты больших данных
    • Исследователи больших данных

    Скрытая ссылка
     
    Последнее редактирование модератором: 19 апр 2021
  2. Последние события

    1. skladchik.com
      Складчина закрыта.
      2 мар 2022
    2. skladchik.com
      Складчина доступна.
      29 апр 2021
    3. skladchik.com
      Взнос составляет 47р.
      29 апр 2021
    4. skladchik.com
      Складчина активна.
      29 апр 2021

    Последние важные события

    1. skladchik.com
      Складчина закрыта.
      2 мар 2022
    2. skladchik.com
      Складчина доступна.
      29 апр 2021
    3. skladchik.com
      Взнос составляет 47р.
      29 апр 2021
    4. skladchik.com
      Складчина активна.
      29 апр 2021
Статус обсуждения:
Комментирование ограничено.