В проекте настроили сбор данных из внешних источников:- Рекламные площадки (Google Ads, Twitter Ads, Facebook Marketing, Tik-tok Marketing, Snapchat Marketing, Mailchimp)
- Приложения (Google Play, App Store)
- Сервисы по аналитике (Google Analytics, Google Search Console)
- Рекламные платформыEmail-маркетинговые сервисы
Интеграция внешних источников реализована через open-source коннекторы Airbyte, что обеспечивает масштабируемость и гибкость при подключении новых стримов данных. На данном этапе происходят первые шаги нашей методологии, а именно нормализация и инкрементальная догрузка данных. После чего уже собранные данные мы объединили по стримам в источники, а источники комбинируем в общие таблички, на основе которых генерируем хэши и производим графовую дедубликацию. Оркестрация ETL-процессов реализована в Apache Airflow, что позволяет задавать расписания, отслеживать сбои и контролировать актуальность данных.
На этапе обработки используется DataForm — инструмент, схожий с dbt, который позволяет описывать бизнес-логику в виде модульных SQL-моделей. Здесь формируются витрины метрик, агрегируются данные по кампаниям и продуктам, строятся модели атрибуции. Важный элемент — графовая дедупликация: идентификаторы пользователей из разных источников (email, phone, client_id) объединяются в master ID, что позволяет строить полноценные цепочки поведения клиента на всех этапах воронки.
Финальный слой — визуализация и доступ к данным — реализован в Google Looker Studio иTableau. Это обеспечивает возможность как быстрой отчётности, так и продвинутого анализа. Пользовательская роль и доступы к витринам настраиваются детально — система поддерживает разграничение прав на уровне проектов, источников и отдельных чартов. Вся архитектура легко масштабируется и адаптируется под требования локальной инфраструктуры или международной облачной среды.
Сложности: Каждый отдел в QIC использовал разные решения, написанные вручную или унаследованные из старых проектов. Это приводило к конфликтам между методологиями расчета метрик, создавая нестабильную и трудно масштабируемую инфраструктуру. Необходимость поддерживать множество разрозненных решений увеличивала нагрузку на команду и повышала вероятность сбоев в производственной среде. Именно для этого была внедрена централизованная ETL-платформа на базе Airbyte, что позволило команде QIC отказаться от индивидуальных решений под каждый источник. Благодаря этому унифицировался процесс подключения и обновления данных.
Кто и как сейчас работает с платформой в QICОсновными пользователями платформы являются команды аналитики и интернет-маркетинга. Маркетологи получают доступ к наглядным дашбордам, где могут отслеживать эффективность рекламных кампаний по ключевым метрикам и оперативно сопоставлять рекламные активности с достигнутыми результатами.
Также системой активно пользуются контент-менеджеры и project-менеджеры. Они анализируют, какие именно кампании и каналы лучше всего помогают достигать бизнес-целей. Руководители команд теперь могут самостоятельно находить нужную информацию в отчетах, без необходимости запрашивать аналитику вручную. Это ускоряет принятие решений и снижает нагрузку на аналитический отдел.
Разработчики поддерживают техническую часть системы: настраивают загрузки, пишут SQL-модели, управляют хранилищем и механизмами идентификации пользователей. Топ-менеджмент и продакт-менеджеры используют агрегированные дашборды для отслеживания бизнес-результатов и принятия решений без участия аналитиков. Система с гибкой ролевой моделью стала единым инструментом для всех команд, обеспечивая своевременный доступ к релевантным данным.
Результаты: