مسئولیتها
نگهداشت و بهبود زیرساخت Docker Swarm: استقرار سرویسها، rolling update، health checks، secrets/configs.
پایگاهداده: تنظیمات Postgres 17، پشتیبانگیری/بازگردانی، بهینهسازی کانکشنها (PgBouncer)، مانیتورینگ مصرف.
CI/CD: نگهداشت GitHub Actions و GHCR، رفع خطاهای build/push، بهبود سرعت pipeline و کش.
شبکه و امنیت: Nginx Proxy Manager/Traefik، گواهی TLS، فایروال، hardening نودها، مدیریت secrets و rotation کلیدها.
مشاهدهپذیری: راهاندازی/نگهداشت لاگها و متریکها (Prometheus/Grafana، Loki یا معادل)، آلارمهای عملیاتی.
هزینه و کارایی: تیونینگ برای بار چت (latency پایین، مصرف بهینه منابع)، بهینهسازی هزینه Hetzner/S3-compatible.
پشتیبانی تولید: پاسخگویی به رخدادها، RCA مستند، پیشنهاد اقدامهای پیشگیرانه.
همکاری با تیم بکاند/داده برای استقرار سرویسهای Python (Temporal workers, FastAPI) و Laravel.
مهارتهای ضروری
تسلط عملی به Docker و Docker Swarm (یا آمادگی اثباتشده برای تسلط سریع).
Linux (Ubuntu) administration، شبکه (overlay/ingress)، volumes، health checks.
Postgres (v14+ ترجیحاً 17): backup/restore، ایندکسگذاری پایه، مانیتورینگ و PgBouncer.
CI/CD با GitHub Actions، آشنایی با رجیستریهای کانتینر (GHCR).
وب و امنیت: reverse proxy، TLS/ACME، اصول hardening، مدیریت secrets.
مانیتورینگ و لاگ: Prometheus/Grafana و یکی از استکهای لاگ (Loki/ELK/…).
Git و مستندسازی دقیق.
مزیتهای رقابتی (ترجیحی)
تجربه با Hetzner Cloud، Object Storage سازگار با S3، و snapshot/backup استراتژیها.
آشنایی با Laravel deploy، Queue/Redis، WebSocket gateway.
تجربه با Temporal (namespace، workers، retry policy) یا سایر orchestratorها.
آشنایی با Python/FastAPI، و مفاهیم RAG/LLM برای دیپلوی سرویسهای AI.
ابزارهای IaC (Terraform/Ansible) و zero-downtime strategies.
آشنایی با Nginx Proxy Manager یا Traefik.