ClickHouse позволяет выполнять быстрые аналитические запросы к данным, а также проводить агрегацию и фильтрацию результатов. Он хорошо подходит для анализа больших объемов данных, таких как журналы действий пользователей, логи серверов, данные мониторинга и т. д.
Система поддерживает SQL-подобный язык запросов, что делает его удобным для работы тех, кто знаком с SQL. Кроме того, ClickHouse имеет открытый исходный код, что позволяет пользователям настраивать и расширять его под свои нужды.
Преимущества:
- Скорость обработки больших объемов данных.
- Оптимизация для аналитических запросов.
- Горизонтальное масштабирование (увеличение производительности путем добавления новых узлов кластера).
- Эффективное использование ресурсов.
- Открытый исходный код.
Построение системы аналитики
Источник — например, Амо CRM, 1С, Яндекс.Директ.
Аккаунт — идентификатор, позволяющий различать разные кабинеты одного источника (Главный аккаунт Директ, HR-аккаунт Директа).
Стрим — одна таблица выгрузки из одного источника (статистика по кампаниям, статистика по объявлениям).
Шаблон — идентичный набор полей при выгрузке.
Пайплайн — набор данных с одинаковыми правилами накопления данных (полная перезапись/загрузка по датам/загрузка по периодам) и сходным набором полей.
Линк — набор данных с одинаковым правилом расчета бизнес-ключа (VisitID, дата + ID кабинета + ID кампании, Дата и время + номер телефона).