23.10.2024

2 +1

Administracja

Linux

Serwery Wirtualne

PostgreSQL na VPS: Architektura, Dostrajanie Wydajności i Przewodnik Wdrożeniowy

PostgreSQL to zaawansowany, otwartoźródłowy obiektowo-relacyjny system zarządzania bazami danych (ORDBMS), który obsługuje zapytania SQL i JSON, transakcje zgodne z ACID oraz rozszerzalne typy danych. Wdrożony na Wirtualnym Serwerze Prywatnym, zyskuje dedykowane zasoby obliczeniowe, pełny dostęp do konfiguracji na poziomie jądra systemu oraz izolację sieciową — możliwości, których hosting współdzielony fundamentalnie nie może zapewnić.

W przypadku obciążeń produkcyjnych ta kombinacja ma natychmiastowe znaczenie: błędnie skonfigurowana wartość shared_buffers na hostingu współdzielonym jest nie do naprawienia, niekontrolowane zapytanie na instancji sąsiada może zagłodzić Twoje I/O, a bez dostępu root nie możesz instalować rozszerzeń takich jak PostGIS czy pg_partman. VPS eliminuje wszystkie trzy ograniczenia jednocześnie.

Dlaczego PostgreSQL przewyższa inne otwartoźródłowe opcje RDBMS

Zanim przejdziemy do analizy zalet specyficznych dla VPS, warto zrozumieć, co sprawia, że PostgreSQL jest preferowanym silnikiem zamiast MySQL/MariaDB dla złożonych obciążeń.

Funkcja	PostgreSQL	MySQL 8.x	MariaDB 10.x
Zgodność z ACID	Pełna, w tym DDL	Pełna	Pełna
Indeksowanie JSON/JSONB	Natywny JSONB z indeksami GIN	JSON (bez przechowywania binarnego)	JSON (bez przechowywania binarnego)
Obsługa danych geoprzestrzennych	PostGIS (standard branżowy)	Ograniczone typy przestrzenne	Ograniczone typy przestrzenne
Wyszukiwanie pełnotekstowe	Wbudowane, konfigurowalne	Podstawowy indeks FULLTEXT	Podstawowy indeks FULLTEXT
Partycjonowanie tabel	Deklaratywne, zakresowe/listowe/hashowe	Partycjonowanie obsługiwane	Partycjonowanie obsługiwane
Równoległe wykonywanie zapytań	Tak (konfigurowalne wątki robocze)	Ograniczone	Ograniczone
Niestandardowe typy danych	Tak (CREATE TYPE)	Nie	Nie
Procedury składowane (PL/pgSQL)	Pełny język proceduralny	Podstawowy	Podstawowy
Dziennik zapisu z wyprzedzeniem (WAL)	Konfigurowalny, replikacja strumieniowa	Dziennik binarny	Dziennik binarny
Model współbieżności	MVCC (bez blokad odczytu)	MVCC	MVCC
Replikacja logiczna	Tak (publikacja/subskrypcja)	Tak	Tak
Opakowania danych zewnętrznych	Tak (postgres_fdw itp.)	Nie	Nie

Model wielowersyjnej kontroli współbieżności (MVCC) PostgreSQL zasługuje na szczególną uwagę: czytelnicy nigdy nie blokują piszących, a piszący nigdy nie blokują czytających. Jest to architektonicznie lepsze rozwiązanie dla mieszanych obciążeń OLTP/OLAP, gdzie długo działające zapytania analityczne w innym przypadku blokowałyby tabele transakcyjne.

Efektywność kosztowa: Alokacja zasobów bez nadmiernego provisioningu

Plan Hostingu VPS zapewnia gwarantowane rdzenie CPU, RAM i pamięć masową NVMe SSD za ułamek kosztu sprzętu bare-metal. Logika ekonomiczna jest prosta: wymagania pamięciowe PostgreSQL skalują się wraz z max_connections i work_mem, a nie z surowym rozmiarem serwera. Prawidłowo dostrojony VPS z 4 GB RAM obsługujący 50 jednoczesnych połączeń przewyższy instancję z 8 GB RAM z domyślnymi ustawieniami i 200 bezczynnych połączeń zużywających pamięć współdzieloną.

Praktyczna strategia efektywności kosztowej polega na rozpoczęciu od VPS średniej klasy, profilowaniu rzeczywistych metryk pg_stat_activity i pg_stat_bgwriter po dwóch tygodniach obciążenia produkcyjnego, a następnie pionowym skalowaniu. To podejście oparte na danych zapobiega powszechnemu błędowi nadmiernego provisioningu przy uruchomieniu.

Często pomijany czynnik kosztowy: demon autovacuum PostgreSQL wymaga zapasu CPU. Na hostingu współdzielonym autovacuum jest często ograniczany przez dostawcę, powodując rozrost tabel i pogorszenie planów zapytań w czasie. Na VPS kontrolujesz autovacuum_vacuum_cost_delay i autovacuum_max_workers bezpośrednio.

Pełny dostęp root i kontrola środowiska

W przeciwieństwie do zarządzanych usług bazodanowych lub Hostingu Współdzielonego, VPS daje nieograniczony dostęp do warstwy systemu operacyjnego. Nie jest to jedynie wygoda — jest to twarde wymaganie dla kilku możliwości PostgreSQL.

Co umożliwia dostęp root, a co blokują środowiska współdzielone:

Instalowanie rozszerzeń PostgreSQL (CREATE EXTENSION postgis, CREATE EXTENSION pg_trgm, CREATE EXTENSION timescaledb)
Modyfikowanie parametrów jądra bezpośrednio wpływających na wydajność PostgreSQL (vm.overcommit_memory, vm.swappiness, huge_pages)
Konfigurowanie pg_hba.conf z niestandardowymi metodami uwierzytelniania (SCRAM-SHA-256, LDAP, uwierzytelnianie oparte na certyfikatach)
Uruchamianie pg_upgrade dla migracji głównych wersji bez interwencji dostawcy
Montowanie dedykowanych woluminów przestrzeni tabel na oddzielnych urządzeniach blokowych dla separacji I/O między indeksami a plikami sterty

Krytyczne dostrajanie jądra dla PostgreSQL na Linux:

# Disable transparent huge pages (causes latency spikes in PostgreSQL)
echo never > /sys/kernel/mm/transparent_hugepage/enabled

# Set vm.overcommit_memory to allow PostgreSQL shared memory allocation
sysctl -w vm.overcommit_memory=2
sysctl -w vm.overcommit_ratio=80

# Reduce swappiness to prevent paging PostgreSQL shared buffers
sysctl -w vm.swappiness=1

# Persist these settings
echo "vm.overcommit_memory=2" >> /etc/sysctl.conf
echo "vm.overcommit_ratio=80" >> /etc/sysctl.conf
echo "vm.swappiness=1" >> /etc/sysctl.conf

Te ustawienia są niewidoczne dla zarządzanych usług bazodanowych na poziomie aplikacji i są często główną przyczyną niewyjaśnionego pogorszenia wydajności w instancjach PostgreSQL hostowanych w chmurze.

Dostrajanie wydajności: Parametry postgresql.conf, które naprawdę mają znaczenie

Domyślne parametry instalacji PostgreSQL są celowo konserwatywne — są zaprojektowane do działania na maszynie z 256 MB RAM z początku lat 2000. Na nowoczesnym VPS z 4–16 GB RAM i pamięcią masową NVMe, domyślne ustawienia pozostawiają większość możliwości sprzętowych niewykorzystaną.

Konfiguracja pamięci

# postgresql.conf — tuned for a 8 GB RAM VPS, OLTP workload

# Set to 25% of total RAM
shared_buffers = 2GB

# Estimate of OS cache available to PostgreSQL (typically 50-75% of RAM)
effective_cache_size = 6GB

# Per-sort/hash operation memory (multiply by max_connections for worst case)
work_mem = 32MB

# For VACUUM, CREATE INDEX, ALTER TABLE operations
maintenance_work_mem = 512MB

# Enable huge pages if kernel supports it
huge_pages = try

Pułapka work_mem: Ustawienie work_mem = 256MB z max_connections = 100 oznacza, że PostgreSQL mógłby teoretycznie przydzielić 25,6 GB RAM wyłącznie na operacje sortowania — znacznie przekraczając pamięć fizyczną i wywołując zabicia OOM. Zawsze obliczaj work_mem jako: (available_RAM - shared_buffers) / (max_connections * 2).

Konfiguracja pamięci masowej i WAL

# For NVMe SSD storage — set to 1 for spinning disks, 200 for NVMe
random_page_cost = 1.1
effective_io_concurrency = 200

# WAL configuration for durability vs. performance tradeoff
wal_buffers = 64MB
checkpoint_completion_target = 0.9
checkpoint_timeout = 10min

# For write-heavy workloads, consider asynchronous commit
# (risk: last ~1 transaction lost on crash, not data corruption)
synchronous_commit = on  # Keep 'on' for financial data

Zarządzanie połączeniami

# Avoid setting this above what your application actually needs
max_connections = 100

# Use PgBouncer in transaction pooling mode for high-concurrency apps
# A VPS allows you to install and configure PgBouncer locally

PgBouncer nie jest opcjonalny dla aplikacji z więcej niż 50 jednoczesnymi użytkownikami. Każdy proces backendu PostgreSQL zużywa około 5–10 MB RAM. Przy 200 połączeniach to 1–2 GB zużyte przez bezczynne procesy. PgBouncer w trybie puli transakcji multipleksuje setki połączeń aplikacji na małą pulę rzeczywistych backendów PostgreSQL.

# Install PgBouncer on Debian/Ubuntu
apt install pgbouncer

# Minimal pgbouncer.ini configuration
cat /etc/pgbouncer/pgbouncer.ini

[databases]
mydb = host=127.0.0.1 port=5432 dbname=mydb

[pgbouncer]
listen_port = 6432
listen_addr = 127.0.0.1
auth_type = scram-sha-256
auth_file = /etc/pgbouncer/userlist.txt
pool_mode = transaction
max_client_conn = 1000
default_pool_size = 20

Wzmacnianie bezpieczeństwa: Poza domyślną instalacją

Świeża instalacja PostgreSQL na VPS ma kilka luk bezpieczeństwa, które należy zamknąć przed udostępnieniem instancji w sieci.

Izolacja na poziomie sieci

PostgreSQL nigdy nie powinien nasłuchiwać na publicznym IP, chyba że jest to absolutnie konieczne. Powiąż go z localhost i używaj tunelowania SSH lub VPN do zdalnej administracji.

# In postgresql.conf
listen_addresses = 'localhost'

# For replication or application servers on a private network only
# listen_addresses = '127.0.0.1,10.0.0.1'

Skonfiguruj pg_hba.conf aby wymusić uwierzytelnianie SCRAM-SHA-256 (domyślny md5 jest kryptograficznie słaby):

# /etc/postgresql/16/main/pg_hba.conf
# TYPE  DATABASE        USER            ADDRESS                 METHOD
local   all             postgres                                peer
local   all             all                                     scram-sha-256
host    all             all             127.0.0.1/32            scram-sha-256
host    all             all             ::1/128                 scram-sha-256
# Reject all other connections by default (no catch-all line)

Szyfrowanie SSL/TLS dla połączeń zdalnych

Jeśli Twój serwer aplikacji łączy się z PostgreSQL przez sieć, szyfrowanie połączenia jest obowiązkowe. Połącz to z Certyfikatem SSL dla warstwy aplikacji i skonfiguruj własny stos TLS PostgreSQL:

# Generate a self-signed certificate for internal use
openssl req -new -x509 -days 365 -nodes 
  -out /etc/postgresql/16/main/server.crt 
  -keyout /etc/postgresql/16/main/server.key

chmod 600 /etc/postgresql/16/main/server.key
chown postgres:postgres /etc/postgresql/16/main/server.{crt,key}

# postgresql.conf
ssl = on
ssl_cert_file = 'server.crt'
ssl_key_file = 'server.key'
ssl_min_protocol_version = 'TLSv1.2'

Kontrola dostępu oparta na rolach

Zasada najmniejszych uprawnień stosuje się ściśle do ról bazodanowych:

-- Create an application role with minimal permissions
CREATE ROLE app_user WITH LOGIN PASSWORD 'strong_password_here';
GRANT CONNECT ON DATABASE mydb TO app_user;
GRANT USAGE ON SCHEMA public TO app_user;
GRANT SELECT, INSERT, UPDATE, DELETE ON ALL TABLES IN SCHEMA public TO app_user;

-- Create a read-only analytics role
CREATE ROLE analytics_reader WITH LOGIN PASSWORD 'another_strong_password';
GRANT CONNECT ON DATABASE mydb TO analytics_reader;
GRANT USAGE ON SCHEMA public TO analytics_reader;
GRANT SELECT ON ALL TABLES IN SCHEMA public TO analytics_reader;

-- Never use the superuser 'postgres' role for application connections

Reguły zapory sieciowej

# Allow PostgreSQL only from specific application server IP
ufw allow from 10.0.0.5 to any port 5432
ufw deny 5432

# Verify
ufw status verbose

Architektura kopii zapasowych i odzyskiwania

PostgreSQL zapewnia dwa fundamentalnie różne mechanizmy tworzenia kopii zapasowych, każdy dostosowany do różnych celów odzyskiwania.

Metoda kopii zapasowej	Narzędzie	Typ odzyskiwania	RPO	RTO	Przypadek użycia
Kopia logiczna	`pg_dump` / `pg_dumpall`	Przywracanie na poziomie obiektów	Godziny	Średni	Migracje schematów, selektywne przywracanie tabel
Kopia fizyczna	`pg_basebackup`	Pełne przywracanie klastra	Minuty (z WAL)	Szybki	Odzyskiwanie po awarii, tworzenie serwera standby
Ciągłe archiwizowanie	Archiwizacja WAL + `pg_basebackup`	Odzyskiwanie do punktu w czasie	Sekundy	Zależy od wolumenu WAL	Wymóg zerowej utraty danych
Migawka	Migawka dostawcy VPS	Pełne przywracanie serwera	W momencie wykonania migawki	Szybki	Zabezpieczenie przed uaktualnieniem

Kopia logiczna z kompresją:

# Dump a single database in custom format (supports parallel restore)
pg_dump -U postgres -Fc -Z 9 mydb > /backup/mydb_$(date +%Y%m%d).dump

# Restore
pg_restore -U postgres -d mydb_restored /backup/mydb_20240115.dump

# Dump all databases including roles and tablespaces
pg_dumpall -U postgres | gzip > /backup/full_cluster_$(date +%Y%m%d).sql.gz

Kopia fizyczna do odzyskiwania po awarii:

# Take a base backup (can run while PostgreSQL is live)
pg_basebackup -U replication_user -D /backup/base -Ft -z -Xs -P

# This creates base.tar.gz and pg_wal.tar.gz
# Combined with WAL archiving, enables point-in-time recovery

Automatyzacja z cron:

# /etc/cron.d/postgres-backup
0 2 * * * postgres pg_dump -Fc mydb > /backup/mydb_$(date +%Y%m%d_%H%M).dump
0 3 * * 0 postgres pg_dumpall | gzip > /backup/full_$(date +%Y%m%d).sql.gz

# Prune backups older than 30 days
0 4 * * * root find /backup/ -name "*.dump" -mtime +30 -delete

Skalowalność: Pionowa, pozioma i skalowanie odczytu

Skalowanie pionowe

Na VPS skalowanie pionowe (dodawanie CPU, RAM, pamięci masowej) jest zazwyczaj operacją na żywo lub wymaga jedynie krótkiego restartu. Po uaktualnieniu RAM zaktualizuj shared_buffers, effective_cache_size i work_mem proporcjonalnie. Po dodaniu rdzeni CPU zwiększ max_parallel_workers_per_gather i max_parallel_maintenance_workers.

# After upgrading from 4 to 8 CPU cores
max_parallel_workers_per_gather = 4
max_parallel_maintenance_workers = 2
max_parallel_workers = 8

Replikacja strumieniowa dla skalowania odczytu

Wbudowana replikacja strumieniowa PostgreSQL tworzy gorący serwer standby, który może obsługiwać zapytania odczytu, odciążając obciążenia analityczne z serwera głównego:

# On primary: create replication user
psql -U postgres -c "CREATE ROLE replicator WITH REPLICATION LOGIN PASSWORD 'rep_password';"

# In pg_hba.conf on primary
# host replication replicator 10.0.0.2/32 scram-sha-256

# In postgresql.conf on primary
# wal_level = replica
# max_wal_senders = 3
# wal_keep_size = 1GB

# On standby: initialize from primary
pg_basebackup -h 10.0.0.1 -U replicator -D /var/lib/postgresql/16/main 
  -P -Xs -R

# The -R flag creates standby.signal and populates primary_conninfo automatically

Replikacja logiczna dla selektywnej replikacji

Replikacja logiczna umożliwia replikowanie określonych tabel do innej instancji PostgreSQL, co jest przydatne w potokach hurtowni danych:

-- On publisher
CREATE PUBLICATION analytics_pub FOR TABLE orders, customers, products;

-- On subscriber
CREATE SUBSCRIPTION analytics_sub
  CONNECTION 'host=10.0.0.1 dbname=mydb user=replicator password=rep_password'
  PUBLICATION analytics_pub;

Dla aplikacji wymagających Serwera Dedykowanego dla głównej bazy danych z replikami VPS obsługującymi ruch odczytu, ta architektura zapewnia zarówno wydajność, jak i efektywność kosztową.

Zaawansowane funkcje PostgreSQL warte włączenia

JSONB dla hybrydowych obciążeń relacyjnych/dokumentowych

-- Create a table with JSONB column
CREATE TABLE events (
  id BIGSERIAL PRIMARY KEY,
  occurred_at TIMESTAMPTZ NOT NULL DEFAULT NOW(),
  payload JSONB NOT NULL
);

-- Create a GIN index for fast JSONB queries
CREATE INDEX idx_events_payload ON events USING GIN (payload);

-- Query nested JSON efficiently
SELECT * FROM events
WHERE payload @> '{"type": "purchase", "currency": "USD"}';

-- Extract and index a specific JSON key
CREATE INDEX idx_events_user_id ON events ((payload->>'user_id'));

Partycjonowanie tabel dla dużych zbiorów danych

-- Range partitioning by month (ideal for time-series data)
CREATE TABLE measurements (
  id BIGSERIAL,
  recorded_at TIMESTAMPTZ NOT NULL,
  sensor_id INT,
  value NUMERIC
) PARTITION BY RANGE (recorded_at);

CREATE TABLE measurements_2024_01
  PARTITION OF measurements
  FOR VALUES FROM ('2024-01-01') TO ('2024-02-01');

CREATE TABLE measurements_2024_02
  PARTITION OF measurements
  FOR VALUES FROM ('2024-02-01') TO ('2024-03-01');

-- PostgreSQL automatically routes inserts and prunes partitions in queries

PostGIS dla aplikacji geoprzestrzennych

# Install PostGIS extension
apt install postgresql-16-postgis-3

# Enable in database
psql -U postgres -d mydb -c "CREATE EXTENSION postgis;"

-- Store and query geographic coordinates
CREATE TABLE locations (
  id SERIAL PRIMARY KEY,
  name TEXT,
  geom GEOMETRY(Point, 4326)
);

-- Find all locations within 10km of a point
SELECT name, ST_Distance(geom::geography, ST_MakePoint(-73.935242, 40.730610)::geography) AS distance_m
FROM locations
WHERE ST_DWithin(geom::geography, ST_MakePoint(-73.935242, 40.730610)::geography, 10000)
ORDER BY distance_m;

Monitorowanie: Stos obserwowalności dla produkcyjnego PostgreSQL

Reaktywne rozwiązywanie problemów jest niewystarczające dla produkcyjnych baz danych. Proaktywny stos obserwowalności wykrywa degradację zanim stanie się awarią.

Wbudowane widoki statystyk PostgreSQL

-- Identify slow queries (requires pg_stat_statements extension)
CREATE EXTENSION pg_stat_statements;

SELECT query, calls, total_exec_time / calls AS avg_ms,
       rows / calls AS avg_rows
FROM pg_stat_statements
ORDER BY avg_ms DESC
LIMIT 20;

-- Check for table bloat and vacuum status
SELECT schemaname, relname, n_dead_tup, last_autovacuum, last_autoanalyze
FROM pg_stat_user_tables
ORDER BY n_dead_tup DESC;

-- Monitor replication lag
SELECT client_addr, state, sent_lsn, write_lsn, flush_lsn, replay_lsn,
       (sent_lsn - replay_lsn) AS replication_lag_bytes
FROM pg_stat_replication;

-- Find long-running queries
SELECT pid, now() - pg_stat_activity.query_start AS duration, query, state
FROM pg_stat_activity
WHERE (now() - pg_stat_activity.query_start) > interval '5 minutes';

Stos Prometheus + postgres_exporter

# Install postgres_exporter
wget https://github.com/prometheus-community/postgres_exporter/releases/download/v0.15.0/postgres_exporter-0.15.0.linux-amd64.tar.gz
tar xzf postgres_exporter-0.15.0.linux-amd64.tar.gz
mv postgres_exporter-0.15.0.linux-amd64/postgres_exporter /usr/local/bin/

# Create a monitoring role in PostgreSQL
psql -U postgres -c "CREATE ROLE postgres_exporter WITH LOGIN PASSWORD 'monitor_pass';"
psql -U postgres -c "GRANT pg_monitor TO postgres_exporter;"

# Run the exporter
export DATA_SOURCE_NAME="postgresql://postgres_exporter:monitor_pass@localhost:5432/postgres?sslmode=disable"
postgres_exporter --web.listen-address=":9187"

Połącz postgres_exporter z dashboardem Grafana (ID dashboardu 9628 z grafana.com obejmuje wszystkie krytyczne metryki PostgreSQL) i skonfiguruj alerty dla: opóźnienia replikacji przekraczającego 30 sekund, zbliżającego się przepełnienia ID transakcji, wskaźnika trafień w pamięć podręczną spadającego poniżej 95% oraz liczby martwych krotek przekraczającej 10% żywych krotek.

Macierz przypadków użycia: Dopasowanie konfiguracji PostgreSQL do obciążenia

Obciążenie	Kluczowe parametry	Rozszerzenia	Strategia skalowania
OLTP (e-commerce, SaaS)	Niski `work_mem`, PgBouncer, `synchronous_commit=on`	`pg_stat_statements`, `pgcrypto`	Pionowe + repliki odczytu
Analityka / OLAP	Wysoki `work_mem`, równoległe wątki robocze, `synchronous_commit=off`	`pg_partman`, `tablefunc`	Partycjonowanie + kolumnowe przechowywanie danych
Szeregi czasowe IoT	Partycjonowanie według czasu, dostrajanie `autovacuum`	TimescaleDB, `pg_partman`	Przycinanie partycji + kompresja
Geoprzestrzenne / GIS	Indeksy przestrzenne, `effective_io_concurrency`	PostGIS, `pg_routing`	Serwer dedykowany dla dużych zbiorów danych
Backend API (JSON)	Indeksy GIN na JSONB, `work_mem` dla agregacji	`pg_trgm`, `uuid-ossp`	Repliki odczytu dla API z dużą liczbą żądań GET
Wyszukiwanie pełnotekstowe	Kolumny `tsvector`, indeksy GIN	`pg_trgm`, `unaccent`	Skanowania tylko indeksów, indeksy częściowe

Dla zespołów budujących backendy API lub aplikacje webowe, połączenie PostgreSQL z VPS z cPanel zapewnia zarządzany panel sterowania wraz z pełną elastycznością bazy danych. Dla zespołów infrastrukturalnych preferujących zarządzanie przez CLI, Panele Sterowania VPS oferuje szerszy wybór opcji paneli.

Praktyczna lista kontrolna przed wdrożeniem PostgreSQL na VPS

Dobór sprzętu:

Oblicz shared_buffers jako 25% całkowitego RAM
Zweryfikuj pamięć masową NVMe SSD — zapisy WAL PostgreSQL są wrażliwe na opóźnienia
Przydziel co najmniej 2 dedykowane rdzenie CPU dla obciążeń produkcyjnych

Podstawowe zabezpieczenia:

Powiąż listen_addresses tylko z prywatnym adresem/localhost
Zastąp md5 przez scram-sha-256 w pg_hba.conf
Włącz SSL z minimalnie TLS 1.2 dla wszystkich połączeń zdalnych
Twórz role specyficzne dla aplikacji — nigdy nie używaj superużytkownika postgres w kodzie aplikacji
Skonfiguruj ufw lub iptables aby zezwalać tylko na znane źródłowe adresy IP na porcie 5432

Podstawowa wydajność:

Wyłącz transparentne duże strony na poziomie systemu operacyjnego
Ustaw vm.swappiness=1 aby zapobiec stronicowaniu buforów współdzielonych
Zainstaluj i skonfiguruj PgBouncer, jeśli liczba połączeń przekracza 50
Włącz pg_stat_statements od pierwszego dnia — retrospektywne profilowanie zapytań jest niemożliwe

Kopie zapasowe i odzyskiwanie:

Automatyzuj pg_dump z cron, testuj przywracanie co miesiąc
Wdróż archiwizację WAL, jeśli wymagania RPO są poniżej 1 godziny
Łącz kopie zapasowe na poziomie aplikacji z migawkami dostawcy VPS dla warstwowej ochrony

Obserwowalność:

Wdróż postgres_exporter + Prometheus + Grafana przed uruchomieniem produkcyjnym
Ustaw alerty dla opóźnienia replikacji, wieku ID transakcji i wskaźnika trafień w pamięć podręczną
Przeglądaj pg_stat_bgwriter co tydzień, aby wykryć presję na punkty kontrolne

FAQ

Którą wersję PostgreSQL powinienem zainstalować na nowym VPS?

Zawsze instaluj najnowsze stabilne wydanie główne (PostgreSQL 16 na rok 2024) z oficjalnego repozytorium PGDG, a nie wersję dołączoną do dystrybucji Linux. Pakiety dystrybucyjne są często 1–2 główne wersje za i nie otrzymują backportów funkcji z upstream. Użyj apt.postgresql.org lub yum.postgresql.org do instalacji.

Ile RAM faktycznie potrzebuje VPS z PostgreSQL?

Dla małej aplikacji produkcyjnej z mniej niż 50 jednoczesnymi połączeniami i zbiorem danych poniżej 50 GB, 4 GB RAM to praktyczne minimum. Ustaw shared_buffers = 1GB, work_mem = 16MB i użyj PgBouncer. Dla zbiorów danych przekraczających dostępny RAM, skup się na pokryciu indeksami i optymalizacji planów zapytań przed dodawaniem sprzętu — brakujący indeks na tabeli 100 GB nie zostanie rozwiązany przez dodanie RAM.

Czy bezpieczne jest uruchamianie PostgreSQL i aplikacji na tym samym VPS?

Tak, dla małych i średnich obciążeń. Ryzykiem jest rywalizacja o zasoby: skok pamięci w aplikacji może wywołać zabicia OOM, które zakończą działanie PostgreSQL. Złagodź to, ustawiając oom_score_adj PostgreSQL na wartość ujemną (zmniejszając prawdopodobieństwo jego zabicia) i używając cgroups do ograniczenia pułapu pamięci aplikacji.

Jaka jest różnica między pg_dump a pg_basebackup?

pg_dump tworzy logiczną kopię zapasową pojedynczej bazy danych — eksportuje instrukcje SQL lub niestandardowy format binarny, który można przywrócić selektywnie (poszczególne tabele, schematy). pg_basebackup kopiuje cały katalog danych PostgreSQL na poziomie binarnym, tworząc pełną kopię zapasową klastra odpowiednią do odzyskiwania po awarii i inicjalizacji serwera standby. Używaj obu: pg_dump do szczegółowych przywróceń, pg_basebackup do scenariuszy pełnego odzyskiwania.

Jak bezpiecznie uaktualnić PostgreSQL do nowej głównej wersji na VPS?

Użyj pg_upgrade z flagą --check najpierw, aby zweryfikować zgodność bez wprowadzania zmian. Wykonaj pełną kopię pg_basebackup przed kontynuowaniem. Samo uaktualnienie jest wykonywane w trybie offline (PostgreSQL musi być zatrzymany). Dla uaktualnień głównych wersji bez przestojów użyj replikacji logicznej: skonfiguruj nową instancję PostgreSQL 16 jako logicznego subskrybenta głównego PostgreSQL 15, poczekaj aż dogoni, a następnie wykonaj skoordynowane przełączenie z minimalnym przestojem.

Zaoszczędź 15% na wszystkich usługach hostingowych