شرح شغل:
ما به دنبال یک مهندس DevOps ارشد هستیم که تجربه بالا در طراحی و پیادهسازی زیرساختهای مقیاسپذیر، ایمن و High Availability داشته باشد. فرد مناسب مسئول مدیریت محیطهای Containerized، Kubernetes و Cloud-Native است و باید قابلیت تضمین عملکرد سرویسها، مانیتورینگ و اتوماسیون CI/CD را داشته باشد.
مسئولیتها:
• طراحی و مدیریت Kubernetes Cluster برای سرویسهای میکروسرویس و AI/ML
• پیادهسازی CI/CD Pipelines برای توسعه و دیپلوی سریع و امن
• مدیریت Containerization با Docker و Deployment روی K8s
• طراحی و نگهداری سیستمهای Monitoring & Logging (Prometheus, Grafana, ELK/Loki)
• مدیریت Queue/Broker Systems (Kafka / RabbitMQ) و اطمینان از High Availability
• پیادهسازی و مدیریت Object Storage (S3/MinIO) برای ذخیره امن دادهها
• اطمینان از Security Best Practices: mTLS، Secrets Management، Access Control
• طراحی و اجرای Horizontal & Vertical Scaling برای سرویسها و GPU Workers
• هماهنگی با تیم Back-End و AI/ML برای بهینهسازی Workflow و Resource Utilization
مهارتها و تواناییها:
• تسلط کامل به Kubernetes, Docker, Helm
• تجربه در CI/CD Tools: GitHub Actions, GitLab CI, Jenkins
• تجربه با Monitoring & Logging: Prometheus, Grafana, ELK/Loki
• آشنایی با Object Storage و MinIO/S3
• توانایی مدیریت High Concurrency, Auto-Scaling, Load Balancing
• تجربه کار با Kafka / RabbitMQ و معماری Event-Driven
• آشنایی با GPU Workload Management و تسریع AI/ML Tasks
• تسلط به Security Best Practices و Secret Management (Vault / K8s Secrets)
• توانایی طراحی سیستمهای Resilient, Fault-Tolerant و Observability-Friendly
ویژگیهای فردی:
• توانایی حل مسائل پیچیده زیرساختی و بهینهسازی منابع
• مهارت همکاری با تیمهای Back-End و AI/ML
• توانایی مستندسازی دقیق و نگهداری زیرساختهای پایدار