-
Notifications
You must be signed in to change notification settings - Fork 94
Description
Добрый день!
Для датасетов, основанных на таблицах Clickhouse нужна возможность устанавливать настройку FINAL
Реализовываться должно либо в виде FROM table FINAL либо SETTINGS final = 1;
Использование таблиц с движками Replacing, Collapcing, теперь и Coalescing растет, чему, в том числе, способствует улучшение работы FINAL.
Трансфер Яндекса создает таблицы с такими движками, в том числе трансфер Метрики.
Там где ранее сразу видели дублирование, в том числе не проходящее со временем, и боролись с ним группировками и argMax-ами, все чаще полагаются на FINAL и Девопсы не заморачиваются созданием представлений для аналитиков.
Плюс, представления накладывают ограничения на работу проекций (они попросту часто перестают использоваться при обработке запроса).
Аналитик, создавший датасет на такой таблице получает данные с дублированием и ничего с этим поделать не может (чаще не замечает). Но это очень заметно на движке Coalescing, например.
Можно, конечно, делать датасет на основе запроса SELECT * FROM table FINAL. Но это плохой стиль для широких таблиц Clickhouse, может ухудшать план выполнения и доступен не всем.
С Уважением,
Сергей