پیش از مطالعه نیازمندی های نقش و موقعیت شغلی مهندس کلان داده در سلوک، موارد زیر را در نظر داشته باشید:آشنایی با ابزارهای تخصصی هر حیطه یک امتیاز مثبت محسوب می شود. داشتن تجربه کاری در هر یک از موقعیت های شغلی، امتیاز مثبت محسوب می شود.در سلوک، روی خروجی ها و نتیجه کار متمرکز هستیم. بنابراین ساعت کاری انعطاف پذیر است و در صورت نیاز امکان انجام کار به صورت ریموت وجود دارد.ترجیح ما، فعالیت افراد به صورت تمام وقت و حداقل یک ساله در تیم است، ولی مدل های دیگر همکاری هم امکان پذیر است.هدفایجاد پایپ لاین های داده با استفاده از ابزار متن باز، برای پردازش batch و بلادرنگ کلان داده، و تنظیم ابزارها برای کار کردن با کارایی مناسب و به صورت مقیاسپذیرفراهم کردن امکان یکپارچه سازی با منابع داده ای مختلفنیازمندیآشنایی با مفاهیم مهندسی داده، مدیریت انواع داده، و مدلسازی داده.آشنایی با کلان داده، ابزارها و تکنولوژی های مرتبط مانند: kafka, hdfs, Spark، hive، sqoop و …آشنایی با روش های طراحی و توسعه پایپ لاین های داده ( جمعآوری، EDA، تمیز کردن و آماده سازی داده) به صورت مقیاس پذیرآشنایی با ابزارهای مدیریت جریان های کاری و پایپ لاین ها مانند Apache AirFlowشناخت Database، Data Warehouse و Data Lake.آشنایی با اصول و مفاهیم پایگاه دادههای sql و nosqlاصول مدل سازی داده، و دانش کار کردن با داده ساخت یافته و غیر ساخت یافتهشناخت ابزار و روش های طراحی، توسعه، تست و بهینه سازی فرایندهای ETLآشنایی و تجربه کار کردن با ابزار تحلیل و مصورسازی داده مبتنی بر پایتون/Rشناخت ابزار BIآشنایی با پایتون (و ترجیحا اسکالا)، و گیتآشنایی با لینوکس