ما به دنبال یک Senior DevOps Engineer با تجربهی عمیق در طراحی، پیادهسازی و بهینهسازی زیرساختهای Cloud-Native هستیم. فرد منتخب نقش کلیدی در توسعه و نگهداری پلتفرم زیرساخت، مانیتورینگ پیشرفته و بهبود پایداری سرویسها ایفا خواهد کرد. این موقعیت نیازمند مهارتهای قوی در Kubernetes، ELK Stack، Observability و Storage Systems است.
مسئولیتها شامل طراحی، پیادهسازی و نگهداری خوشههای Kubernetes در محیطهای Production، توسعه و مدیریت سیستمهای Monitoring & Observability با استفاده از ابزارهایی مانند Prometheus, Grafana, Alertmanager، راهاندازی و بهینهسازی ELK Stack (Elasticsearch, Logstash, Kibana) برای جمعآوری و تحلیل لاگها، مدیریت و بهینهسازی Storage Systems شامل Ceph, NFS, EBS, Longhorn یا راهکارهای مشابه، خودکارسازی فرآیندهای استقرار و CI/CD با GitLab CI, Jenkins, ArgoCD یا مشابه، بهینهسازی Performance سرویسها و رفع مشکلات زیرساختی، پیادهسازی امنیت در سطح زیرساخت (Security Hardening, Secrets Management, RBAC)، همکاری نزدیک با تیمهای توسعه برای بهبود قابلیت Observability و قابلاتکا بودن سرویسها و مستندسازی کامل فرآیندها و Best Practiceها میباشد.
مهارتها و شرایط لازم شامل حداقل 5 سال تجربه در حوزه DevOps / SRE، تسلط کامل بر Kubernetes در سطح Production، تجربهی عملی و پیشرفته در ELK Stack، آشنایی عمیق با Monitoring/Logging، شامل Prometheus، Grafana، Loki، Alertmanager، دانش قوی در سیستمهای Storage (Block, File, Object Storage) و مفاهیم IOPS, Throughput, Replication، تسلط بر Linux در سطح پیشرفته، تجربه با ابزارهای Infra-as-Code مانند Terraform، Ansible و آشنایی با Docker و مفاهیم Containerization میباشد. آشنایی با مفاهیم Cloud (AWS / GCP / Azure) یک مزیت محسوب میشود. توانایی Debugging و تروبلشوتینگ در محیطهای پیچیده نیز ضروری است.