Доступно

Онлайн-конференция Data Science [Datastart]

Тема в разделе "Курсы по программированию", создана пользователем Топикстартер, 4 окт 2020.

Цена: 790р.-78%
Взнос: 166р.
100%

Основной список: 18 участников

Резервный список: 4 участников

Статус обсуждения:
Комментирование ограничено.
  1. 4 окт 2020
    #1
    Топикстартер
    Топикстартер ЧКЧлен клуба
    Онлайн-конференция Data Science [Datastart]

    2020-10-04_192039.jpg


    1. Фрактальность функции потерь, эффект двойного спуска и степенные законы в глубинном обучении - фрагменты одной мозаики.

    Дмитрий Ветров Профессор-исследователь НИУ ВШЭ (Факультет компьютерных наук), глава Лаборатории машинного обучения, SAIC MOSCOW.

    За последние годы в глубинных нейронных сетях был обнаружен ряд необычных эффектов (двойной спуск, связность мод, "минные поля" в рельефе функции потерь, и др.), показавших, что сообщество плохо понимает, что происходит в процессе обучения нейронных сетей. В ходе доклада мы попробуем увязать ряд эффектов в единую гипотезу и обсудим результаты экспериментов, которые косвенно ее подтверждают.

    2. Инфраструктура извлечения факторов в проде

    Михаил Трофимов ML Engineer в Praxis Pioneering

    Часто при разработке продукта возникает несколько команд, реализующих ML в проде. У каждой стоит задача подсчета факторов, сбора сэмплов, обучения моделей, выкатка моделей в прод, доставка факторов в прод, синхронизация оффлайна и онлайна. Зачастую, каждая команда решает эти задачи независимо, что приводит в конечном итоге к замедлению разработки. В своем докладе я расскажу, как общая инфрастуктура факторов може ускорить разработку, зачем это вообще надо и какие проблемы возникают при ее построении.

    3. «Питонись на отличненько»

    Михаил СвешниковML Architect в Zyfra

    Питон известен своим низким порогом входа и на нем действительно очень просто писать код. Однако это не значит, что на нем просто писать ХОРОШИЙ код. Я расскажу, что же это за зверь такой – хороший код на питоне, а так же покажу полезные приемы, которые помогут вам проще и быстрее писать на питоне и вообще поднимут ваше питон кунг-фу на новый уровень. Доклад будет интересен и тем, кто только собирается учить питон, и тем кто уже в познании питона настолько преисполнился, будто бы уже 100 триллионов миллиардов лет пишет код на триллионах и триллионах таких же языков.

    4. Новинки CatBoost: поддержка эмбеддингов, обучение на SPARK и это еще не всё!

    Станислав Кириллов Руководитель группы ML систем Яндекса

    Как многим известно, градиентный бустинг на решающих деревьях остается SoTA на задачах, представимых в виде таблиц с признаками разной природы. До недавних пор CatBoost поддерживал 3 типа значений в колонках таких таблиц - вещественные признаки, категориальные и тексты.
    Сегодня мы хотим презентовать возможность обучения на эмбеддингах объектов - вещественных векторах, показывающих положение объекта в каком-то семантическом пространстве.
    Например, классическими примером эмбеддингов для текстов является word2vec, более новым - эмбеддинги трансформеров (BERT, GPT, etc). Мы расскажем о том, как именно CatBoost работает с такими векторами и как их использование может повысить качество ваших моделей.
    Вторая важная новость, о которой мы расскажем - поддержка обучения на SPARK кластерах. Мы покажем, как реализована поддержка SPARK и как ей воспользоваться.
    Ну и, конечно, это еще не все классные новости - еще мы расскажем о новых ускорениях и улучшениях, которые произошли с CatBoost за последние полгода.

    5. Инструменты визуализиации в NLP: от графов знаний до BERT

    Валентин Малых Senior Research Scientist в Noah’s Ark Lab

    Кажется, что нет более далекой области от визуализации, чем обработка текстов. Но на самом деле визуализации и тут могут во многом помочь. Я расскажу про работу с графами знаний, а также про то, какие можно получить знания изучая паттерны внимания модели BERT

    6. “Классическое” машинное обучение на табличных данных

    Александр Фонарев Основатель компании Rubbles, data scientist, Ph.D. в области data science, лектор

    В последние годы прикладное машинное обучение всё больше разделяется на два основных блока. Первый и наиболее хайповый — deep learning для обработки изображений, текста, звука и т. п. Второй, более старый, но не менее важный для бизнеса — “классический” ml для задач со табличными (структурированными) данными, использующийся для предсказания временных рядов, построения рекомендательных систем, предсказания поломок оборудования и многих других задач. В докладе мы погрузимся во второй блок: обсудим алгоритмы работы со структурированными данным, типизацию задач в этой области, практические кейсы, особенности индустрии сегодня и её развитие завтра.

    7. Эмбеддинги графов без учителя

    Антон Цицулин Аспирант университета Бонна, студент-исследователь в Google

    В последние годы всё больше ML пайплайнов строится на эмбеддингах – вещественных векторах довольно малой размерности, отражающие семантические свойства объектов. Мы довольно хорошо научились извлекать их из текстов, картинок, звука, но для графов доступных коробочных решений пока нет. Графы – хитрый вид данных, который возникает, когда нам даны только связи разных объектов между собой. Например, дружба или подписки в соцсетях, покупки товаров и другие действия пользователей – лишь одни из примеров отношений, которые удобно моделировать графами. Я расскажу, как получать эмбеддинги для графов, про графовые нейросети и то, как их обучать без учителя.

    8. Что такое "быстрый код"?

    Николай Марков Principal Architect в компании Aligned Research Group

    Какие именно особенности железа и кода заставляют его выполняться быстрее и эффективнее решать задачу? Стоит ли овчинка выделки? В докладе мы поговорим о том, как именно достигается высокая скорость выполнения кода, поковыряем распределенные вычисления, JIT, железки и векторизацию.


    9. Как устроен умный робот, улучшающий колл-центры Яндекс

    Татьяна Савельева Head of unstructured data analysis в Yandex.Taxi

    В своем докладе расскажу про наш продукт для автоматизации и улучшения коллцентров. Как автоматизировать 80% первой линии поддержки так, чтобы робот был неотличим от человека, как понять какой текст лучше присылать пользователю, как раздавать промокодыс большей пользой для клиента и многое другое.

    10. Почему бизнес не хочет внедрять современные технологии?

    Евгений Лимаренко CIO группа компаний Gulliver&Co

    Знакомая ситуация: приходишь в компанию или к коллегам в Коммерческий департамент, рассказываешь о крутом решении которую с парнями придумал и даже собрал MVP, а они смотрят, киваю головой и отказываются? Я расскажу вам, почему так происходит, как мыслят сотрудники бизнес подразделений и что нужно сделать, а что делать не надо, чтобы они хотели с вами работать.

    11. Open Source In the Wild

    Максим Кочуров Инженер-исследователь в NTechLab

    Все из нас (ну точно многие) пользуются библиотеками Numpy, Pandas, sklearn и так далее. Мир опен сорса очень огромен, там просиходят большие (и неочень) события, свои местечковые конференции, принимаются решения, которые влияют на нашу разработку.
    Однако знакомы с этой "кухней" далеко не все. Стандарты разработки многих продуктов обычно высоки. Кажется, что попасть в опен сорс сложно или почти невозможно. Не понятно с чего начать. Куда писать? Куда коммитить и как это делать? А вообще, зачем оно вообще нужно, вливаться в этот опен сорс, это же работа за бесплатно?
    Другие проблемы, которые уже несколько уровнем выше, возникают и куда более серьезны для развития проекта. Как взаимодействовать с пользователями? Как развивать комьюнити? Как добиваться узнаваемости и расширять пользовательскую базу?
    Проблемы взаимодействия с другими проектами тоже не остаются в стороне. Это бывают отношения пользователь-проект или проект-проект. В каждом из случаев есть нюансы. Как повлиять на развитие проекта? Как добавить недостающую фичу? Как поправить багу в любимой библиотеке? И самое главное, почему все так долго, и можно ли побыстрее?
    В опен сорс я попал со студенческой скамьи на наивном энтузиазме, но это продолжает переворачивать жизнь по сей день. Я постараюсь ответить на перечисленные вопросы опираясь на свой опыт, ретроспективные выводы спустя несколько лет участия в нескольких крупных проектах.

    12. Сколько стоит неэффективный Data Science или чему учить команду DS?

    Михаил Рожков Creator Machine Learning REPA

    Применение Data Science (DS) в бизнесе обычно связывают с тем value, которое смогут принести модели после их внедрение в процесс или продукт. При этом часто упускают из виду, что работа DS команды это сложный процесс, который требует значительных ресурсов и компетенций команды. В докладе обсудим, как можно оценить эффект от внедрения инструментов автоматизации и инженерных практик в Data Science. Доклад поможет компаниям найти точки роста DS команд и приоритезировать программы обучения и развития.

    13. Рабочий Вариант: как большие данные меняют мир массового найма

    Алексей Романов Expert Data Scientist в BigData МТС

    Искусственный интеллект в массовом найме — очень модная тема, и бизнес плотоядно облизывается, глядя на перспективы анализа больших данных в этой области.
    Однако с точки зрения Data Science работа в HR очень специфична: люди не тексты и не картинки, они капризны и часто непредсказуемы.
    В своём докладе я дам общий обзор комплекса DS-задач, которые возникают в области массового найма, и разберу более пристально наиболее каверзные из них

    14. Метрики в DS-проектах

    Алексей Могильников ML Lead в Сбербанке, Chief Methodologist в LeanDS

    Прикладное машинное обучение должно нести ценность бизнесу. В момент разработки модели не ясно как можно оценить потенциальную пользу модели и выбрать ожидаемые значения метрик на кросс-валидации или отложенной выборке такие, чтобы разработка модели имела смысл и ценность её была ощутима. В докладе будет показан подход к решению этой задачи и будет продемонстрировано как можно рассчитывать ценность, которую модель приносит бизнесу.

    Тариф - Онлайн трансляция + видеозаписи двух потоков
    Онлайн-участие
    Видеозаписи двух потоков конференции
    Презентации всех спикеров конференции
    Бонус: видеозаписи Конференции от 30/06/2020 в подарок

    Цена - 790 руб

    Продажник
     
    Последнее редактирование модератором: 12 окт 2023
  2. Последние события

    1. skladchik.com
      Складчина доступна.
      24 окт 2020
    2. Кадрушка
      Кадрушка участвует.
      23 окт 2020
    3. sungridmail
      sungridmail участвует.
      21 окт 2020
    4. Mtv Gru
      Mtv Gru участвует.
      20 окт 2020

    Последние важные события

    1. skladchik.com
      Складчина доступна.
      24 окт 2020
    2. skladchik.com
      Взнос составляет 83р.
      20 окт 2020
    3. skladchik.com
      Складчина активна.
      20 окт 2020
    4. skladchik.com
      Сбор взносов начинается 20.10.2020.
      17 окт 2020
  3. Обсуждение
  4. 17 окт 2020
    #2
    ZtaZ55
    ZtaZ55 ЧКЧлен клуба
    Цена указана, как за запись одного потока, а описание выдачи, как за запись с двух потоков. По итогу приобретается технический и бизнес потоки или же только технический?
     
  5. 17 окт 2020
    #3
    Организатор
    Организатор ОргОрганизатор
    будет два потока, в описании же все указано
     
    1 человеку нравится это.
  6. 17 окт 2020
    #4
    ZtaZ55
    ZtaZ55 ЧКЧлен клуба
    Решил уточнить, так как стоимость на продажнике за два потока 990, а 790 за один, вот и затесались сомнения. Спасибо за ответ!
     
  7. 17 окт 2020
    #5
    Организатор
    Организатор ОргОрганизатор
    цена со временем может меняться, поэтому всегда надо писать тариф и давать нормальное описание на что конкретно собираемся, тогда и вопросов не будет
     
Статус обсуждения:
Комментирование ограничено.