ما در تیم مون به یک نیروی دقیق، منظم و همیشه بیدار نیاز داریم که بتونه سلامت سیستم ها، سرویس ها و شبکه هامون رو زیر نظر داشته باشه و در صورت بروز اختلال، سریع و درست واکنش نشون بده.
شرح وظایف:
مانیتورینگ دائمی سرویس ها، سرورها و وضعیت شبکه با ابزارهای تخصصی Zabbix, Grafana, Prometheus, UptimeRobot یا مشابه
ثبت، طبقه بندی و گزارش رخدادها و اختلال ها
هماهنگی با تیم فنی در صورت شناسایی خطا یا هشدار بحرانی
مشارکت در تعریف Alert و Threshold برای پایش دقیق تر
مستندسازی فرآیندهای مانیتورینگ و پاسخ به رخدادها
مهارت های مورد نیاز:
آشنایی با مفاهیم سرور، شبکه، پایگاه داده و معماری وب
تسلط به ابزارهای مانیتورینگ یکی یا چند مورد Zabbix, Prometheus, Grafana, UptimeRobot, ELK
توانایی تحلیل لاگ ها و گزارش گیری
دقت بالا، تمرکز و توانایی واکنش سریع به هشدارها
آشنایی با اسکریپت نویسی ساده bash یا python، مزیت محسوب می شود
تجربه کار در محیط لینوکس (مزیت مهم)
ویژگیهای شخصیتی:
صبور و خوشبرخورد با کاربران
پاسخگو، و منظم
علاقهمند به یادگیری فنی
پیگیر و دقیق در رفع مشکلات
اهل پیگیری و حل مسئله
منظم در ثبت و گزارشگیری و مستند سازی