مسئولیت ها
- طراحی و بازطراحی معماری سیستمهای داخلی عملیاتی
- انتخاب ابزارهای مناسب (Open Source first approach)
- مقایسه و ارزیابی data-driven بین solutionها
- پیادهسازی و customization ابزارها
- یکپارچهسازی سیستمها (integration layer)
- طراحی، بازطراحی و توسعه Monitoring & Observability stack
- پیادهسازی CI/CD و automation pipelines
- طراحی، بازطراحی و توسعه سیستمهای Incident Management
- ایجاد و بهبود ایزارها برای تیم NOC
- هدایت تیم DevOps و تعریف roadmap
- همکاری نزدیک با تیمها (NOC, Infra., Cloud)
مهارتها و شایستگیها:
فنی (Technical)
- تجربه عمیق در Linux و سیستمهای توزیعشده
- تجربه عمیق در Kubernetes
- تجربه عملی با Monitoring stack
Prometheus / Grafana
ELK / OpenSearch
Git-based workflows
Pipeline design
- تجربه با automation tools
Ansible / scripting
- آشنایی با Cloud ترجیحاً OpenStack
- تجربه در طراحی و بازطراحی سیستمهای scalable
بسیار مهم (Core Skills)
- توانایی مقایسه و انتخاب ابزارها Tool Evaluation
- درک trade-offها در طراحی
- تفکر سیستمی نه فقط ابزاری (system thinking vs. tool usage)
- Debugging در سطح سیستم
مزیت محسوب میشود:
- تجربه کار در Cloud Provider
- تجربه در designing internal platforms
- تجربه با Ceph / Networking
- تجربه در Incident systems
-
نرم(Soft Skills)
- توانایی تصمیمگیری در سطح معماری
- Ownership بالا
- توانایی توضیح تصمیمهای فنی
- منتورینگ تیم
- نگاه product-like به internal systems
انتظارات
- ساخت سیستم، نه فقط نصب ابزار
- کاهش manual work از طریق automation
- افزایش reliability در عملیات
- ایجاد visibility واقعی برای تیمها
- جلوگیری از گسترش ابزار (tooling sprawl) و ایجاد هرج و مرج (Chaos)
مناسب چه کسانی نیست:
- کسانی که فقط tool بلد هستند
- کسانی که تجربه production ندارند
- کسانی که نمیتوانند تصمیم معماری بگیرند
- کسانی که از ownership فرار میکنند