Доступно

Симулятор «SQL для анализа данных» [Simulative]

Тема в разделе "Курсы по программированию", создана пользователем Топикстартер, 19 май 2022.

Цена: 12000р.-95%
Взнос: 484р.
100%

Основной список: 56 участников

Резервный список: 70 участников

Статус обсуждения:
Комментирование ограничено.
  1. 19 май 2022
    #1
    Топикстартер
    Топикстартер ЧКЧлен клуба

    Складчина: Симулятор «SQL для анализа данных» [Simulative]

    Это не курс. Это симулятор работы аналитика данных в реальной компании с элементами обучения. Вы будете считать retention и LTV, писать многоэтажные CTE и делать другие полезные для бизнеса штуки с помощью SQL.

    Цели симулятора

    1. Обучить не элементарным «SQL-запросам», а полезным фишкам, экосистеме и продакшен-левел коду
    2. Научить писать запросы, нужные бизнесу. Вы не будете изучать котиков — вы будете считать LTV, делать сложные агрегации и ad-hoc
    3. Погрузить в среду. Вы будете работать с профессиональными инструментами — PostgreSQL, DBeaver, MySQL, Power BI и шедулерами
    Чем предстоит заниматься
    • Писать многочисленные ad-hoc SQL запросы: сбор и валидация email-адресов, расчет статистик пользовательской активности и многое другое
    • Собирать когорты, анализировать retention, LTV, CR и другие продуктовые метрики с помощью high-level SQL-запросов
    • Автоматизировать импорт/экспорт данных на Windows/Linux сервере с помощью SQL + Python + psycopg2 + cron
    Программа обучения
    Симулятор состоит из 13 глав.

    Каждая глава — это теория + практические задачи + отработка навыков на бизнесовых кейсах.

    Вы будете анализировать пользовательский опыт платформы IT Resume, работать с продакшен-левел инструментами и решать реальные кейсы с интересным сюжетом.

    1. Вы познакомитесь с базами данных, поймете отличие БД от СУБД, обсудите важность нормализации на конкретных кейсах и прочие «основы основ».

      В конце - тест для проверки знаний.

    2. Вы научитесь подключаться к удаленной базе 4 разными способами, разберете типы данных и поймете отличие DCL от DML.

      Для закрепления знаний - тест.

    3. В этой главе вы научитесь писать базовые SQL-запросы — но далеко не самые простые. Также вы освоите функции обработки текста, даты, времени, кастинга, крутые функции COALESCE/NULLIF, логические операторы, CASE и многое другое. Сортировка, горизонтальная фильтрация, поиск по шаблону, регулярки — все это в этой главе.

      Для закрепления — домашнее задание.

      Хоть вы только начали путь, вы уже будете решать реальные продуктовые задачи. Например:
      1. Соберете и подготовите базу для email-рассылок
      2. Посмотрите на пользователей в разрезе дат и погрузитесь в обработку даты-времени
      3. Произведете валидацию номеров телефонов
      4. Расклассифицируете задачи на платформе по группам в зависимости от определенного признака
    4. В этой главе мы расскажем про основные продуктовые метрики, которые пригодятся вам абсолютно в любом проекте — будь то мобильное приложение или офлайн-магазин. Например, в следующих главах вы воспользуетесь этими знаниями для аналитики платформы.

      Для отработки и закрепления результатов — тест + расчётные задания.

    5. Вы научитесь группировать таблицу по определенным признакам и использовать агрегатные функции: от простейших AVG и MIN до экзотических mode WITHIN GROUP.

      Для отработки навыков — домашнее задание.

      После этого вы снова отработаете полученные знания на реальных кейсах. Например:
      1. Оцените распределение активности пользователей по часам/дням
      2. Сколько в среднем пользователь делает попыток для решения 1 задачи? А сколько людей решают задачи с первой попытки? А каково значение моды?
      3. Оцените MAU/WAU/DAU
      4. Посчитаете эффективность реферальной программы
      5. Посмотрите на то, как пользователи платформы тратят и копят CodeCoins
    6. Только умея LEFT/RIGHT/FULL/SELF/CROSS/INNER JOIN, мы можем получить действительно что-то полезное и осмысленное. Именно эти конструкции вы и освоите в данной главе.

      Для закрепления — домашнее задание.

      После этого вы продолжите анализировать user experience платформы. Например:
      1. Посмотрите, кто не только решает задачи, но и участвует в других активностях
      2. Однозначно скажете – от какой компании сколько пользователей пришло и как они себя вели
      3. Оцените распределение решенных задач и тестов по тегам и категориям
    7. Редко решение задачи можно уложить в один короткий запрос. В этой главе вы научитесь писать сложные вложенные подзапросы и выносить все это аккуратно в CTE. А еще обсудим код-стайл и смежные вопросы.

      Для закрепления — традиционная домашка.

      После этого закрепите все на практике. Например:
      1. Посчитаете RETENTION/CR и подумаем над тем, как удержать пользователей
      2. Углубитесь в то, как пользователи решают задачи и проведете глубокое исследование
      3. Соберете всю статистику о пользователях в одном месте, чтобы показать ее рекрутерам
    8. Разберетесь, в чем мощь window functions, причем здесь вообще окна и как избежать фатальных ошибок при использовании UNBOUNDED FOLLOWING/CURRENT ROW. Также научитесь считать накопительный итог и не только - используя агрегатные функции, как оконные.

      Для отработки — полноценное домашнее задание.

      Затем вы снова вернетесь к работе над аналитикой платформы. Например:
      1. Снова рассмотрите вопрос retention и LTV, но под новым соусом
      2. Оцените динамику активностей, найдете участки спада и роста
      3. Посчитаете текущий баланс накопительным итогом по всем пользователям и найдете аномалии
    9. В этой главе вы сами запроектируете базу для нового проекта, построите ее схему со связями и напишите все DDL-скрипты для создания. А в конце — развернете ее и в облаке, и на локальной машине! А чтобы базу можно было потестить — наполните ее фейковыми данными (так частенько делают в продакшене) с помощью специальных сервисов.

      Будете использовать: draw.io, DBeaver, MySQL + Workbench, сервисы-фейкеры.

    10. В этой главе вы научитесь работать с psycopg2, mysql.connector, узнаете про шаблон проектирования Singleton, научитесь регистрировать собственные типы данных, работать с базой через Python, разберете ошибки типа Authentication plugin ′caching_sha2_password′ cannot be loaded и многое другое.

      Для отработки — полноценное домашнее задание.

      В результате вы получите:
      1. несколько готовых классов для подключения к основным СУБД, которые вы можете использовать потом на работе
      2. написанные Python-скрипты для экспорта-импорта данных из базы
      3. проект по выгрузке данных из базы и дальнейшей обработке в Pandas
    11. В этой главе вы научитесь автоматизировать типовые задачи: например, бэкапы и инсерты. Делать это будем с помощью cron, шедулера и Python-скриптов. На закуску — Airflow.

      На выходе вы будете иметь скрипты и инструкции для автоматизации задач с помощью cron, а также готовый проект с Python-кодом для ежедневного инсерта данных в БД.

    12. SQL тесно связан с аналитикой и датавизом. В этой главе вы будете подключать базу к Power BI и Redash, чтобы строить ad-hoc отчеты и дашборды. Затронем тему подключения по ssh, построения дашбордов и поиска полезных инсайтов.

      В результате этой главы вы решите реальное тестовое задание в крупную Edtech компанию на позицию аналитика.

    13. В конце — небольшая ретроспектива всех ваших наработок, а также наши советы относительно тестовых заданий, best practices и дальнейшего развития. Полезные материалы, ссылки и непрошенные советы — то, что нужно в конце такого обучения.

      Но на самом деле, это не конец, а только начало интересного пути :)
    Продажник:
    Скрытая ссылка
     
    5 пользователям это понравилось.
  2. Последние события

    1. androkotey
      androkotey оставил отзыв "Отлично".
      26 окт 2022
    2. Zen1th
      Zen1th оставил отзыв "Ужасно".
      1 окт 2022
    3. skladchik.com
      Складчина доступна.
      24 сен 2022
    4. GalinN
      GalinN участвует.
      18 сен 2022

    Последние важные события

    1. skladchik.com
      Складчина доступна.
      24 сен 2022
    2. skladchik.com
      Взнос составляет 242р.
      27 май 2022
    3. skladchik.com
      Складчина активна.
      27 май 2022
    4. skladchik.com
      Сбор взносов начинается 27.05.2022.
      25 май 2022
  3. Отзывы участников

    3/5,
    • 5/5,
      Работой организатора доволен
      Лучший курс по SQL из тех, что проходил. Но явно лучше не с нуля, иначе будет сложновато без обратной связи от преподов.
      26 окт 2022
    • 1/5,
      Работой организатора недоволен
      Курс плохо структурирован, практичной пользы максимум 10%. Позиционируют себя как симулятор, хотя от симулятора лишь банальные имейлы от коллег. Реальных продуктовых задач - минимум.
      1 окт 2022
      5 пользователям это понравилось.
  4. Обсуждение
  5. 23 май 2022
    #2
    kolovorat
    kolovorat ЧКЧлен клуба
    И как собираетесь доступ к тренажеру, всем участникам предоставить?
     
    1 человеку нравится это.
  6. 23 май 2022
    #3
    influte
    influte ЧКЧлен клуба
    Во-первых орга здесь нет еще, во-вторых никак доступ к тренажеру не предоставишь, так же как в складчинах Яндекс Практикума - все материалы без тренажера.
     
  7. 25 май 2022
    #4
    kolovorat
    kolovorat ЧКЧлен клуба
    Какие материалы?
    В заголовке складчины же написано - Это не курс. Это симулятор работы аналитика данных в реальной компании с элементами обучения. Вы будете считать retention и LTV, писать многоэтажные CTE и делать другие полезные для бизнеса штуки с помощью SQL.
     
  8. 25 май 2022
    #5
    Организатор
    Организатор ОргОрганизатор
    Это текст с продажника, как минимум скрипты, видео, задания и текстовые материалы еще плюс возможно база, где можно тренироваться. хз, что там будет, для этого складчик и нужен.
     
  9. 12 июн 2022
    #6
    petroivan
    petroivan ЧКЧлен клуба
    хоть с небольшим опозданием, но оплатил. Просьба выдать материал.
    Спасибо
     
  10. 22 июн 2022
    #7
    ivano92
    ivano92 ЧКЧлен клуба
    Подскажите, пожалуйста, когда по складчине будет дальше развитие, а то вроде нужную сумму собрали?. Как я понимаю нет организатора?
     
  11. 22 июн 2022
    #8
    ZibukaZavr
    ZibukaZavr ЧКЧлен клуба
    Не может быть...
     
  12. 22 июн 2022
    #9
    Zen1th
    Zen1th ЧКЧлен клуба
    орг есть. все должно быть предоставлено. наберитесь терпения
     
  13. 22 июн 2022
    #10
    ivano92
    ivano92 ЧКЧлен клуба
    Обозначте, пожалуйста, приблизительно сколько дней ждать.
     
  14. 23 июн 2022
    #11
    mozus
    mozus ЧКЧлен клуба
    Еще один симулятор по SQL вышел от достойного автора Скрытая ссылка
     
  15. 11 июл 2022
    #12
    qwest
    qwest ЧКЧлен клуба
    Подскажите, когда планируется выдача доступа? Спасибо
     
    3 пользователям это понравилось.
  16. 20 июл 2022
    #13
    elsabedor
    elsabedor ЧКЧлен клуба
    На сайте указано, что время прохождения симулятора около полутора месяца. Уже около 40 дней прошло с момента открытия складчины, так что вероятно недели две придется еще подождать.
     
  17. 21 июл 2022
    #14
    Alex820202
    Alex820202 ДолжникДолжник
    Блин, читайте правила клуба - запрещено обсуждать ход складчины. Уж члены клуба, это должны знать...
     
  18. 4 сен 2022
    #15
    Zen1th
    Zen1th ЧКЧлен клуба
    ОРГ ты бы мог дать какую то обратную связь?
     
    3 пользователям это понравилось.
  19. 4 сен 2022
    #16
    Организатор
    Организатор ОргОрганизатор
    смысл таких вопросов? Всё будет как только курс закончится)
     
    1 человеку нравится это.
Статус обсуждения:
Комментирование ограничено.