Доступно

Основы теории создания хранилищ данных (DWH) [Аналитика плюс]

Тема в разделе "Курсы по программированию", создана пользователем Топикстартер, 17 фев 2022.

Цена: 6000р.-95%
Взнос: 274р.
100%

Основной список: 52 участников

Резервный список: 3 участников

Статус обсуждения:
Комментирование ограничено.
  1. 17 фев 2022
    #1
    Топикстартер
    Топикстартер ЧКЧлен клуба

    Складчина: Основы теории создания хранилищ данных (DWH) [Аналитика плюс]

    В навыки, требующиеся от эксперта по управлению данными, входит умение смоделировать и организовать хранилище данных. С точки зрения теории существуют правила построения, упрощающие дальнейшую работу (развитие и эксплуатацию) хранилища, — это так называемые нормальные формы.

    Начало практикума будет посвящено разбору всех известных в настоящее время нормальных форм, в виде пошаговой нормализации исходной таблицы от первой к шестой форме.

    Далее, будут рассмотрены существующие в настоящее время методологии построения хранилищ, от классических (Кимбалл и Инмон) до «современных (Data Vault и Anchor Modeling). В качестве практики будут построены модели хранилища для небольшого интернет-магазина, по каждой из методологий.

    Для кого подойдет видео-курс «Основы теории создания хранилищ данных (DWH)»
    Уровень сложности – средний.

    Наш видео-курс подойдет для специалистов, желающих научиться проектировать хранилища данных (DWH). В начале курса будет разобрана концепция нормальных форм, с примерами, а затем будут рассмотрены существующие в настоящее время методологии построения хранилищ, от классических (Кимбалл и Инмон) до «современных (Data Vault и Anchor Modeling). В качестве практики будут построены модели хранилища для небольшого интернет-магазина, по каждой из методологий.



    Программа видео-курса


    Урок 1. Введение: базовые понятия и требования к ХД (доступно БСЕПЛАТНО в режиме ДЕМО на платформе онлайн-обучения Академия Аналитики)

    — Введение о курсе, содержание курса: теория и практика
    — Традиционная архитектура хранилищ данных (ХД)
    — Требования к ХД
    — Базовая структура ХД: понятия «сырых» данных, метаданных и агрегатов
    — ХД с промежуточной областью
    — ХД с промежуточной областью и витринами данных

    Урок 2. Методологии построения ХД, нормальные формы (доступно БСЕПЛАТНО в режиме ДЕМО на платформе онлайн-обучения Академия Аналитики)

    — «Классические» подходы к созданию хранилищ: Ральфа Кимбалла и Билла Инмона
    — Современные подходы: Data Vault и Anchor Modelling
    — Загрузка данных в ХД: ETL и ELT
    — Нормализация СУБД: нормальные формы
    — Основные термины нормализации: атрибут и домен атрибута, кортеж, отношение, проекция, аномалии и их виды, суперключ и потенциальный ключ, функциональная зависимость
    — Сводная таблица существующих нормальных форм

    Урок 3. Нормальные формы, подробности (доступно БСЕПЛАТНО в режиме ДЕМО на платформе онлайн-обучения Академия Аналитики)

    — Пример пошаговой нормализации таблицы
    — Первая нормальная форма (1НФ), пример и действия по приведению исходной таблицы к 1НФ
    — Вторая нормальная форма (2НФ), пример приведения таблицы из 1НФ во 2НФ
    — Третья нормальная форма (3НФ), пример приведения таблицы из 2НФ в 3НФ
    — Нормальная форма Бойса-Кодда (НФБК), как частный случай 3НФ
    — Четвертая нормальная форма (4НФ), примеры
    — Пятая нормальная форма (5НФ), примеры
    — Шестая нормальная форма (6НФ), примеры

    Урок 4. «Классические» методологии построения ХД – Кимбалла и Инмона

    — Две «классические» методологии построения ХД – Ральфа Кимбалла и Билла Инмона, и отличия между ними
    — Звезды Ральфа Кимбалла: 4 основных шага в разработке хранилища
    — Подход Кимбалла: преимущества и недостатки
    — Хранилище 3НФ Билла Инмона, реализация концепции CIF (корпоративной информационной фабрики)
    — Основные термины, специфичные для хранилищ 3НФ Билла Инмона
    — Подход Инмона: преимущества и недостатки

    Урок 5. Практика по методологии Кимбалла

    — Практика на примере ХД интернет-магазина
    — Исходные данные для ХД
    — Практика по Кимбаллу: 2 витрины данных – Платежи и Заказы
    — Создание промежуточной области, обзор модели данных
    — Обзор исходных данных в mySQL
    — Запуск скрипта по созданию объектов промежуточной области, в схеме stage
    — Обсуждение ETL-скрипта по переносу данных из mySQL в Vertica

    Урок 6. Практика по методологии Инмона

    — Запуск ETL-скрипта для варианта ХД по Кимбаллу
    — Анализ результатов, проверка, что в stage данные появились
    — Обсуждение, что конкретно в данном случае объектами ХД могут быть не таблицы, а представления (view)
    — Запуск скрипта создания представлений в схеме stardwh, анализ результатов
    — Обсуждение ETL
    — Начало практики по Инмону, обзор ETL для варианта по Инмону, обсуждение инкрементальной загрузки и дополнительных сложностей
    — Запуск скрипта для создания целевых объектов-«приёмников данных» (до запуска ETL)
    — Создание представлений (view) из таблиц, с целью выдачи конечным потребителям доступа к данным, в том виде, в котором им удобно будет воспользоваться
    — Сравнение подходов Кимбалла и Инмона

    Урок 7. Теория «современности»: детали по методологиям Data Vault и Anchor Modeling

    — Краткое напоминание о принципах подходов Data Vault и Anchor Modeling
    — Data Vault 2.0: основные понятия, — хаб, спутник (сателлит), ссылка
    — Алгоритм создания модели хранилища по методологии Data Vault
    — Разбор правил, которых следует придерживаться при моделировании
    — Преимущества и недостатки подхода Data Vault
    — Anchor Modeling (якорное моделирование): основные понятия, — якорь, атрибут, связь и узел
    — Преимущества и недостатки якорного моделирования

    Урок 8. Практика по Data Vault

    — Обзор исходных данных для практики (напоминание)
    — Практика – Data Vault
    — Обзор SQL-скриптов, решающих практическую задачу
    — Анализ скрипта по созданию представлений (view) промежуточной модели данных, состоящей из хабов, связей и спутников
    — Анализ скрипта по созданию «звезды», опирающейся на ранее созданные объекты: от таблиц данных к бизнес-объектам

    Урок 9. Практика по Anchor Modeling

    — О редакторе якорного моделирования
    — Алгоритм действий
    — Установка якорей, создание связей между якорями, добавление атрибутов
    — Генерация кода для создания объектов БД, реализующего модель
    — Просмотр ER-диаграммы модели
    — Редактирование якорной модели
    — Загрузка данных в созданную модель
    — О нюансах ETL-инструментов для якорной модели
    — Подведение итогов практикума
     
  2. Последние события

    1. skladchik.com
      Складчина доступна.
      1 мар 2022
    2. PatrickBateman
      PatrickBateman участвует.
      28 фев 2022
    3. Veciaz
      Veciaz участвует.
      28 фев 2022
    4. 07pia05
      07pia05 участвует.
      28 фев 2022

    Последние важные события

    1. skladchik.com
      Складчина доступна.
      1 мар 2022
    2. skladchik.com
      Взнос составляет 137р.
      28 фев 2022
    3. skladchik.com
      Складчина активна.
      28 фев 2022
    4. skladchik.com
      Сбор взносов начинается 27.02.2022.
      24 фев 2022
  3. Обсуждение
  4. 17 фев 2022
    #2
    influte
    influte ЧКЧлен клуба
    Продажник:
    Скрытая ссылка
     
Статус обсуждения:
Комментирование ограничено.