В этом разделе мы рассмотрим поддержку озер данных в ClickHouse. ClickHouse поддерживает многие из самых популярных форматов таблиц и каталогов данных, включая Iceberg, Delta Lake, Hudi, AWS Glue, REST Catalog, Unity Catalog и Microsoft OneLake.
Открытые форматы таблиц
Iceberg
См. функцию iceberg, которая поддерживает чтение из Amazon S3 и S3-совместимых сервисов, HDFS, Azure и локальных файловых систем. icebergCluster — это распределённый вариант функции iceberg.
Delta Lake
См. описание функции deltaLake, поддерживающей чтение из Amazon S3 и S3‑совместимых сервисов, Azure и локальных файловых систем. deltaLakeCluster — это распределённый вариант функции deltaLake.
Hudi
См. hudi, которая поддерживает чтение из Amazon S3 и S3-совместимых сервисов. hudiCluster — это распределённый вариант функции hudi.
Каталоги данных
AWS Glue
AWS Glue Data Catalog можно использовать с таблицами Iceberg. Вы можете использовать его с движком таблицы iceberg или с движком базы данных DataLakeCatalog.
Iceberg REST Catalog
REST-каталог Iceberg можно использовать с таблицами Iceberg. Вы можете использовать его с табличным движком iceberg или с движком базы данных DataLakeCatalog.
Unity Catalog
Unity Catalog можно использовать как с таблицами Delta Lake, так и с таблицами Iceberg. Вы можете использовать его с движками таблиц iceberg или deltaLake, а также с движком базы данных DataLakeCatalog.
Microsoft OneLake
Microsoft OneLake совместим как с таблицами Delta Lake, так и с таблицами Iceberg. Его можно использовать с движком базы данных DataLakeCatalog.