Манипуляции с колонками
Набор запросов, позволяющий изменять структуру таблицы.
Синтаксис:
В запросе укажите список из одного или нескольких разделенных запятыми действий. Каждое действие — это операция с колонкой.
Поддерживаются следующие действия:
- ADD COLUMN — Добавляет новую колонку в таблицу.
- DROP COLUMN — Удаляет колонку.
- RENAME COLUMN — Переименовывает существующую колонку.
- CLEAR COLUMN — Сбрасывает значения колонки.
- COMMENT COLUMN — Добавляет текстовый комментарий к колонке.
- MODIFY COLUMN — Изменяет тип колонки, значение по умолчанию, TTL и настройки колонки.
- MODIFY COLUMN REMOVE — Удаляет одно из свойств колонки.
- MODIFY COLUMN MODIFY SETTING - Изменяет настройки колонки.
- MODIFY COLUMN RESET SETTING - Сбрасывает настройки колонки.
- MATERIALIZE COLUMN — Материализует колонку в частях, где колонка отсутствует.
Эти действия описаны подробно ниже.
ADD COLUMN
Добавляет новую колонку в таблицу с указанным name, type, codec и default_expr (см. раздел Default expressions).
Если включено условие IF NOT EXISTS, запрос не вернет ошибку, если колонка уже существует. Если вы укажете AFTER name_after (имя другой колонки), колонка добавляется после указанной в списке колонок таблицы. Если вы хотите добавить колонку в начало таблицы, используйте условие FIRST. В противном случае колонка добавляется в конец таблицы. Для цепочки действий name_after может быть именем колонки, добавленной в одном из предыдущих действий.
Добавление колонки просто изменяет структуру таблицы, не выполняя никаких действий с данными. Данные не появляются на диске после ALTER. Если данных не хватает для колонки при чтении из таблицы, они заполняются значениями по умолчанию (выполняя выражение по умолчанию, если оно есть, или используя нули или пустые строки). Колонка появляется на диске после слияния частей данных (см. MergeTree).
Этот подход позволяет быстро выполнить запрос ALTER, не увеличивая объем старых данных.
Пример:
DROP COLUMN
Удаляет колонку с именем name. Если указано условие IF EXISTS, запрос не вернет ошибку, если колонка не существует.
Удаляет данные из файловой системы. Поскольку это удаляет целые файлы, запрос выполняется почти мгновенно.
Вы не можете удалить колонку, если она ссылается на материализованное представление. В противном случае это приведет к ошибке.
Пример:
RENAME COLUMN
Переименовывает колонку name в new_name. Если указано условие IF EXISTS, запрос не вернет ошибку, если колонка не существует. Поскольку переименование не связано с основными данными, запрос выполняется почти мгновенно.
ПРИМЕЧАНИЕ: Колонки, указанные в ключевом выражении таблицы (либо с ORDER BY, либо с PRIMARY KEY), не могут быть переименованы. Попытка изменить эти колонки приведет к ошибке SQL Error [524].
Пример:
CLEAR COLUMN
Сбрасывает все данные в колонке для указанной партиции. Подробнее о задании имени партиции читайте в разделе How to set the partition expression.
Если указано условие IF EXISTS, запрос не вернет ошибку, если колонка не существует.
Пример:
COMMENT COLUMN
Добавляет комментарий к колонке. Если указано условие IF EXISTS, запрос не вернет ошибку, если колонка не существует.
Каждая колонка может иметь один комментарий. Если комментарий уже существует для колонки, новый комментарий заменяет предыдущий.
Комментарии хранятся в колонке comment_expression, возвращаемой запросом DESCRIBE TABLE.
Пример:
MODIFY COLUMN
Этот запрос изменяет свойства колонки name:
-
Тип
-
Выражение по умолчанию
-
Кодек сжатия
-
TTL
-
Настройки на уровне колонки
Для примеров изменения кодеков сжатия колонок смотрите Column Compression Codecs.
Для примеров изменения TTL колонок смотрите Column TTL.
Для примеров изменения настроек на уровне колонок смотрите Column-level Settings.
Если указано условие IF EXISTS, запрос не вернет ошибку, если колонка не существует.
При изменении типа значения конвертируются так, как если бы функции toType были применены к ним. Если изменяется только выражение по умолчанию, запрос не выполняет ничего сложного и завершается почти мгновенно.
Пример:
Изменение типа колонки является единственным сложным действием – это изменяет содержимое файлов с данными. Для больших таблиц это может занять много времени.
Запрос также может изменить порядок колонок, используя условие FIRST | AFTER, смотрите описание ADD COLUMN, но тип колонки обязателен в этом случае.
Пример:
Запрос ALTER является атомарным. Для таблиц MergeTree он также выполняется без блокировок.
Запрос ALTER для изменения колонок реплицируется. Инструкции сохраняются в ZooKeeper, а затем каждая реплика применяет их. Все запросы ALTER выполняются в одном и том же порядке. Запрос ждет завершения соответствующих действий на других репликах. Тем не менее, запрос на изменение колонок в реплицированной таблице может быть прерван, и все действия будут выполнены асинхронно.
Пожалуйста, будьте осторожны при изменении Nullable колонки на Non-Nullable. Убедитесь, что она не содержит NULL значений, иначе это вызовет проблемы при чтении из нее. В этом случае обходным путем будет остановить мутацию и вернуть колонку обратно к типу Nullable.
MODIFY COLUMN REMOVE
Удаляет одно из свойств колонки: DEFAULT, ALIAS, MATERIALIZED, CODEC, COMMENT, TTL, SETTINGS.
Синтаксис:
Пример
Удалить TTL:
Смотрите также
MODIFY COLUMN MODIFY SETTING
Изменяет настройку колонки.
Синтаксис:
Пример
Изменить max_compress_block_size колонки на 1MB:
MODIFY COLUMN RESET SETTING
Сбрасывает настройку колонки, также удаляет декларацию настройки в выражении колонки запроса CREATE таблицы.
Синтаксис:
Пример
Сбросить настройку колонки max_compress_block_size на значение по умолчанию:
MATERIALIZE COLUMN
Материализует колонку с выражением значения DEFAULT или MATERIALIZED. При добавлении материализованной колонки с помощью ALTER TABLE table_name ADD COLUMN column_name MATERIALIZED существующие строки без материализованных значений автоматически не заполняются. Оператор MATERIALIZE COLUMN может быть использован для перезаписи существующих данных в колонке после того, как выражение DEFAULT или MATERIALIZED было добавлено или обновлено (что обновляет только метаданные, но не изменяет существующие данные). Обратите внимание, что материализация колонки в ключе сортировки является недопустимой операцией, так как это может нарушить порядок сортировки. Реализовано как мутация.
Для колонок с новым или обновленным выражением значения MATERIALIZED все существующие строки перезаписываются.
Для колонок с новым или обновленным выражением значения DEFAULT поведение зависит от версии ClickHouse:
- В ClickHouse < v24.2 все существующие строки перезаписываются.
- ClickHouse >= v24.2 различает, было ли значение строки в колонке с выражением значения
DEFAULTявно задано при вставке или нет, т.е. было ли оно рассчитано из выражения значенияDEFAULT. Если значение было явно задано, ClickHouse сохраняет его как есть. Если значение было рассчитано, ClickHouse изменяет его на новое или обновленное выражение значенияMATERIALIZED.
Синтаксис:
- Если вы укажете PARTITION, колонка будет материализована только с указанной партицией.
Пример
Смотрите также
Ограничения
Запрос ALTER позволяет вам создавать и удалять отдельные элементы (колонки) в вложенных структурах данных, но не целые вложенные структуры данных. Для добавления вложенной структуры данных вы можете добавлять колонки с именем, например name.nested_name, и типом Array(T). Вложенная структура данных эквивалентна нескольким колонкам массивов с именем, имеющим одинаковый префикс до точки.
Нет поддержки для удаления колонок в первичном ключе или ключе выборки (колонки, которые используются в выражении ENGINE). Изменение типа для колонок, которые включены в первичный ключ, возможно только в том случае, если это изменение не приводит к изменению данных (например, разрешается добавлять значения в Enum или изменять тип с DateTime на UInt32).
Если запрос ALTER недостаточен для внесения необходимых изменений в таблицу, вы можете создать новую таблицу, скопировать в нее данные с помощью запроса INSERT SELECT, затем переключить таблицы с помощью запроса RENAME и удалить старую таблицу.
Запрос ALTER блокирует все чтения и записи для таблицы. Другими словами, если в это время выполняется длительный SELECT, запрос ALTER будет ждать его завершения. В то же время все новые запросы к той же таблице будут ждать, пока выполняется этот ALTER.
Для таблиц, которые не хранят данные сами по себе (таких как Merge и Distributed), ALTER просто изменяет структуру таблицы и не изменяет структуру подчиненных таблиц. Например, при выполнении ALTER для таблицы Distributed вам также потребуется выполнить ALTER для таблиц на всех удаленных серверах.