34.1. Архитектура #

34.1.1. Экспорт и импорт данных
34.1.2. Каталог файлов и автоматизация процессов

Postgres Pro традиционно используется для транзакционных (OLTP) нагрузок и определяет архитектурные решения в отношении размещения данных и используемых алгоритмов обработки. OLTP-нагрузки имеют следующие характеристики:

Учитывая эти характеристики, оптимальным подходом является хранение и обработка данных в формате строк.

Аналитические (OLAP) нагрузки имеют значительные отличия:

Учитывая существующие различия, специализированные системы управления OLAP-нагрузками имеют значительное преимущество, связанное с их архитектурой:

34.1.1. Экспорт и импорт данных #

Работа расширения pgpro_duckdb состоит из двух частей:

  • Экспорт данных и ETL-процессы

  • Импорт данных и выполнение аналитических запросов

Расширение pgpro_duckdb позволяет экспортировать данные и выстраивать ETL-процессы, используя в качестве источника таблицы Postgres Pro. Это расширение также можно использовать для обработки файлов из внешних систем. Промежуточные данные можно хранить во временных таблицах в столбцовом формате duckdb. Все необходимые изменения выполняются с помощью SQL-запросов в рамках стандартного сеанса Postgres Pro.

34.1.2. Каталог файлов и автоматизация процессов #

Важными составляющими аналитической системы являются автоматизация ETL-процессов и поддержка каталога аналитических таблиц.

Текущая версия Postgres Pro Enterprise не поддерживает автоматическую настройку периодического выполнения ETL-процесса и реализацию каталога. Чтобы вручную настроить периодические задачи, используйте расширение pgpro_scheduler.