Загрузка Мероприятия

« Все Мероприятия

Конференция Merge в Иннополисе

13 ноября 08:00 14 ноября 17:00 MSK

Data Lake против Data Warehouse или как посчитать то, о чем забыли написать в ТЗ…

Основные тезисы

  • При работе с данными есть два подхода их сбора, хранения и обработки — Data Lake и  Data Warehouse, то есть, сырые данные и структурированные.
  • Традиционно используют Data Warehouse и схему ETL (Extract – Transform – Load) однако жесткая структура таких данных и является тем ярмом, которая полностью лишает гибкости нашу систему аналитики.
  • Использование Data Lake и сбор сырых, необработанных данных открывает совершенно новые горизонты, но цена этого – повышенные требования  к мощности хранилищ.
  • Наша компания на протяжении последнего времени сосредоточитесь на использовании Data Lake и мы научились решать очень нетривиальные задачи.
  • Несколько практических примеров на базе сырых необработанных данных Google Analytics 4 будут продемонстрированы в докладе.

Добавить комментарий