Skip to content

FINAL при работе с Clickhouse #361

@handgunman

Description

@handgunman

Добрый день!

Для датасетов, основанных на таблицах Clickhouse нужна возможность устанавливать настройку FINAL
Реализовываться должно либо в виде FROM table FINAL либо SETTINGS final = 1;

Использование таблиц с движками Replacing, Collapcing, теперь и Coalescing растет, чему, в том числе, способствует улучшение работы FINAL.
Трансфер Яндекса создает таблицы с такими движками, в том числе трансфер Метрики.

Там где ранее сразу видели дублирование, в том числе не проходящее со временем, и боролись с ним группировками и argMax-ами, все чаще полагаются на FINAL и Девопсы не заморачиваются созданием представлений для аналитиков.

Плюс, представления накладывают ограничения на работу проекций (они попросту часто перестают использоваться при обработке запроса).

Аналитик, создавший датасет на такой таблице получает данные с дублированием и ничего с этим поделать не может (чаще не замечает). Но это очень заметно на движке Coalescing, например.

Можно, конечно, делать датасет на основе запроса SELECT * FROM table FINAL. Но это плохой стиль для широких таблиц Clickhouse, может ухудшать план выполнения и доступен не всем.

С Уважением,
Сергей

Metadata

Metadata

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions