deltaLakeCluster Табличная Функция
Это расширение для табличной функции deltaLake.
Позволяет обрабатывать файлы из таблиц Delta Lake в Amazon S3 параллельно с нескольких узлов в указанном кластере. На инициаторе создается соединение со всеми узлами кластера и динамически распределяются файлы. На рабочем узле он запрашивает у инициатора следующую задачу для обработки и выполняет её. Это повторяется, пока все задачи не будут завершены.
Синтаксис
deltaLakeS3Cluster является псевдонимом для deltaLakeCluster, оба предназначены для S3.
Аргументы
-
cluster_name— Название кластера, которое используется для построения набора адресов и параметров соединения с удаленными и локальными серверами. -
Описание всех других аргументов совпадает с описанием аргументов в эквивалентной табличной функции deltaLake.
Возвращаемое значение
Таблица с указанной структурой для чтения данных из кластера в указанной таблице Delta Lake в S3.
Виртуальные колонки
_path— Путь к файлу. Тип:LowCardinality(String)._file— Название файла. Тип:LowCardinality(String)._size— Размер файла в байтах. Тип:Nullable(UInt64). Если размер файла неизвестен, значение равноNULL._time— Время последнего изменения файла. Тип:Nullable(DateTime). Если время неизвестно, значение равноNULL._etag— Etag файла. Тип:LowCardinality(String). Если etag неизвестен, значение равноNULL.