مسئولیتها (Responsibilities)
1. طراحی و پیادهسازی SD Storage
طراحی و استقرار Clusterهای SDS مانند: Ceph (cephadm, RBD, RGW, MDS, CRUSH Map), VMware vSAN, Dell/EMC ScaleIO/PowerFlex, MinIO, GlusterFS
طراحی معماری برای Block، File و Object Storage.
طراحی Storage برای محیطهای: Kubernetes (Rook-Ceph, CSI Drivers), OpenStack, VMware, Bare-Metal HCI
2. مدیریت ظرفیت، Performance و High Availability
طراحی Replication، Erasure Coding، Failure Domain و CRUSH Rules.
مانیتورینگ Latency، IOPS، Throughput و Backfill/Recovery.
انجام Benchmark (fio، cosbench).
Capacity Planning و Tiering.
3. مدیریت و نگهداری روزانه
پایش سلامت Cluster (ceph health, ceph orch, ceph insights).
مدیریت OSDها، NVMe، HDD/SSD Pools.
Rolling Upgrade و Patch Management.
مدیریت Failures (OSD down/out, PG stuck, degraded objects).
4. خودکارسازی و Infrastructure as Code
پیادهسازی اتوماسیون برای مدیریت Cluster با: Ansible, Terraform, cephadm orchestrator
طراحی GitOps برای مدیریت Configهای Ceph/K8s.
5. مانیتورینگ، Observability و Alerting
اتصال SDS به: Prometheus / Grafana, Zabbix Templates, ELK Stack
طراحی داشبوردهای Capacity و Performance.
6. امنیت (Security)
طراحی امنیتی برای OSD, MON, MGR, RGW.
TLS، certificate management، نقشها و keyringها.
Hardening برای Nodes، Network، Storage، و S3 Gateway.
7. Troubleshooting و Incident Handling
رفع مشکلات: PG inconsistency, Slow OSDs, unbalanced PGs, network latency, MDS/FS performance
تحلیل Logها و RCA کامل.
مهارتهای فنی
تسلط بر Ceph (cephadm, RBD, RGW, MDS).
آشنایی کامل با استوریج EMC, NetApp یا vSAN.
مسلط بر Linux (RHEL/Rocky/Ubuntu/Oracle Linux).
شبکه پیشرفته (LACP, MTU, VLAN, BGP/EVPN در ACI یا Fabric).
آشنایی با Kubernetes CSI و Rook-Ceph.
تجربه طراحی برای VMware, Hyper-V یا Proxmox.
تجربه با سختافزارهای Storage/Server: SSD/NVMe latency, HDD 16TB+, SAS HBA / RAID / NVMe-oF
مهارتهای نرم
توانایی کار تیمی با DevOps، DBA، Kubernetes و Network.
تحلیل سریع Incidentهای تولیدی.
مستندسازی حرفهای.
تجربههای ترجیحی
پیادهسازی Ceph در مقیاس بزرگ (20+ نود).
کار با Cisco ACI و طراحی HCI.
کار با Zabbix LLD برای Pool/PG/OSD discovery.
آشنایی با MinIO برای S3 و Object Storage.
تجربه در Migration از SAN به SDS.