📊

رتبه ۲ از ۱۰رشد ۳۵% سالانه

دانشمند داده

Data Scientist

دانشمندان داده با ترکیب آمار، یادگیری ماشین و دانش کسب‌وکار، از داده‌های خام بینش‌های قابل اقدام استخراج می‌کنند. آن‌ها پل ارتباطی بین داده و تصمیم‌گیری استراتژیک هستند — از پیش‌بینی رفتار مشتری تا طراحی آزمایش‌های A/B و ساخت مدل‌های کاربردی برای محصولات داده‌محور.

Python/RSQLآمارVisualizationMachine Learning

مقدمه و تعریف شغل

دانشمند داده (Data Scientist) متخصصی است که با ترکیب آمار، یادگیری ماشین، برنامه‌نویسی و دانش کسب‌وکار، از داده‌های خام بینش قابل اقدام تولید می‌کند. کار او از پاک‌سازی داده شروع می‌شود و به طراحی آزمایش، ساخت مدل پیش‌بینی، و ارائه یافته‌ها به تصمیم‌گیران ختم می‌شود. برخلاف تصور رایج، دانشمند داده فقط مدل ML نمی‌سازد — بخش بزرگی از زمانش صرف فهم مسئله، تمیزسازی داده و ارتباط با ذینفعان می‌شود.

اصطلاح Data Scientist را DJ Patil و Jeff Hammerbacher در سال ۲۰۰۸ مطرح کردند و یک سال بعد Hal Varian از گوگل آن را «جذاب‌ترین شغل قرن بیست‌و‌یکم» نامید. در سال ۲۰۲۲ با ظهور ChatGPT بسیاری پیش‌بینی کردند که این شغل از بین می‌رود — اما واقعیت این شد که نقش در حال تحول است نه حذف. طبق گزارش Future of Jobs ۲۰۲۵ مجمع جهانی اقتصاد، Data Scientist هنوز در میان ۱۰ شغل پررشد جهان قرار دارد و بازار کار تا ۲۰۳۰ به رشد ۳۵٪ ادامه می‌دهد. تفاوت این است که DS مدرن با LLM ها به عنوان دستیار کار می‌کند، روی causal inference و طراحی آزمایش تمرکز دارد و در تصمیم‌گیری استراتژیک نقش پررنگ‌تری ایفا می‌کند.

چه چیزی می‌سازید؟

مثال‌های واقعی از خروجی کار یک دانشمند داده

🎯

مدل‌های پیش‌بینی رفتار مشتری

یک پلتفرم SaaS می‌خواهد بداند کدام کاربران در ۳۰ روز آینده اشتراک خود را لغو می‌کنند. شما یک مدل classification با XGBoost می‌سازید، Feature Engineering روی رفتار کاربر انجام می‌دهید و خروجی را به تیم Customer Success می‌دهید تا قبل از ترک، اقدام کنند.

🧪

آزمایش‌های A/B برای محصول

تیم محصول می‌خواهد بداند آیا تغییر رنگ دکمه خرید نرخ تبدیل را افزایش می‌دهد. شما power analysis می‌کنید، آزمایش را طراحی می‌کنید، نتایج را با آزمون آماری تحلیل می‌کنید و توصیه قابل اقدام ارائه می‌دهید — همراه با هشدار درباره چندبارگی آزمون.

📊

داشبوردهای استراتژیک برای مدیریت

CEO شرکت می‌خواهد هر صبح در ۳۰ ثانیه وضعیت کسب‌وکار را ببیند. شما یک داشبورد در Tableau می‌سازید که KPI های اصلی، روندها و alert های هوشمند را نمایش می‌دهد و با Snowflake به‌روزرسانی می‌شود.

🔬

تحلیل علیت برای تصمیم‌های استراتژیک

مدیر بازاریابی می‌گوید کمپین جدید درآمد را ۲۰٪ افزایش داد. شما با causal inference (مثل Difference-in-Differences یا Synthetic Control) بررسی می‌کنید آیا واقعاً علت کمپین بود یا فصل، رقبا و عوامل دیگر.

📑

گزارش‌های تحلیلی برای تصمیم‌سازی

بورد می‌خواهد بداند کدام بازار جدید را وارد شویم. شما داده‌های ۵ بازار را جمع‌آوری، segment ها را مدل می‌کنید، اندازه بازار را تخمین می‌زنید و یک گزارش ۲۰ صفحه‌ای با توصیه واضح می‌نویسید.

📈

پیش‌بینی تقاضا و موجودی

یک خرده‌فروش می‌خواهد بداند هر شعبه ماه آینده چقدر از هر محصول سفارش دهد. شما مدل Time Series (ARIMA یا Prophet) می‌سازید که فصلی بودن، تعطیلات و promotions را در نظر می‌گیرد.

تخصص‌های مختلف دانشمند داده

این شغل یک عنوان واحد نیست — مسیرهای تخصصی متعددی دارد

📱

دانشمند داده محصول

Product Data Scientist

تمرکز روی متریک‌های محصول، طراحی A/B testing، تحلیل رفتار کاربر و کمک به تصمیم‌گیری Product Manager. در شرکت‌های SaaS و فین‌تک پرتقاضا.

📣

دانشمند داده بازاریابی

Marketing Data Scientist

Attribution Modeling، LTV/CAC، segmentation مشتری و بهینه‌سازی کمپین. ترکیب داده تبلیغات (Meta، Google) با داده داخلی شرکت.

🏥

دانشمند داده حوزه سلامت

Healthcare Data Scientist

تحلیل داده بالینی، مدل‌های پیش‌بینی تشخیص و درمان، کار با تصاویر پزشکی. یکی از پردرآمدترین تخصص‌ها در ۲۰۲۵.

💰

دانشمند داده مالی و کوانت

Finance / Quant Data Scientist

مدل‌سازی ریسک، تشخیص تقلب، الگوریتم‌های معاملاتی. در سرمایه‌گذاری و بانکداری بسیار پرتقاضا و پردرآمد.

🧭

دانشمند تصمیم

Decision Scientist

تخصصی بر تبدیل داده به توصیه قابل اقدام برای مدیریت. تمرکز روی causal inference، behavioral economics و communication بیشتر از مدل‌سازی فنی.

تفاوت با شغل‌های مشابه

کجا این شغل تمام می‌شود و شغل دیگری شروع می‌شود؟

تحلیلگر دادهData Analyst

Data Analyst عمدتاً با داده‌های گذشته و گزارش‌های توصیفی کار می‌کند: «چه اتفاقی افتاد؟» Data Scientist علاوه بر تحلیل گذشته، مدل‌های پیش‌بینی و تجویزی می‌سازد: «چه اتفاقی خواهد افتاد و چه باید کرد؟» در مقیاس مهارت، DS معمولاً تسلط بیشتری بر آمار، ML و Python دارد، در حالی که Data Analyst عمیق‌تر در SQL و BI Tools است.

مهندس یادگیری ماشینML Engineer

Data Scientist مدل را در Notebook می‌سازد و توضیح می‌دهد چرا این مدل برای کسب‌وکار مفید است. ML Engineer همان مدل را تبدیل به سرویس قابل اعتماد در پروداکشن می‌کند که میلیون‌ها درخواست در ثانیه پاسخ می‌دهد. DS بیشتر روی «چه چیز ساخت» تمرکز دارد، MLE روی «چگونه در مقیاس اجرا کرد».

تحلیلگر هوش تجاریBI Analyst

BI Analyst عمدتاً داشبورد و گزارش با ابزارهایی مثل Tableau و Power BI می‌سازد و تمرکزش روی متریک‌های استاندارد کسب‌وکار است. Data Scientist معمولاً مسائل پیچیده‌تر، باز و اکتشافی را حل می‌کند که نیاز به مدل‌سازی آماری یا ML دارند. BI Analyst اطلاعات را نمایش می‌دهد، DS الگو کشف می‌کند.

مهندس دادهData Engineer

Data Engineer زیرساخت داده را می‌سازد: pipeline ها، data warehouse و سیستم‌های ETL. Data Scientist روی این زیرساخت کار می‌کند تا مدل و تحلیل بسازد. بدون Data Engineer، DS باید زمان زیادی را صرف جمع‌آوری و تمیزسازی داده کند. این دو نقش مکمل هستند، نه رقیب.

تأثیر در صنایع مختلف

دانشمند داده در همه صنایع مشغول به کار است — نه فقط شرکت‌های فناوری

🏦

بانکی و مالی

تشخیص تقلب در زمان واقعی، scoring اعتباری، الگوریتم‌های معاملاتی، پیش‌بینی نوسانات بازار

🛒

خرده‌فروشی و E-commerce

سیستم‌های توصیه محصول (Amazon)، پیش‌بینی تقاضا، بهینه‌سازی قیمت‌گذاری پویا، مدیریت موجودی

🏥

بهداشت و درمان

پیش‌بینی شیوع بیماری، شخصی‌سازی درمان، تحلیل کارایی داروها، optimization عملیات بیمارستان

🚚

حمل‌ونقل و لجستیک

بهینه‌سازی مسیر تحویل، قیمت‌گذاری پویا (Uber)، پیش‌بینی تأخیر پرواز، مدیریت ناوگان

🎬

رسانه و سرگرمی

موتور توصیه Netflix و Spotify، ساخت محتوا مبتنی بر داده، تحلیل engagement کاربر

📚

آموزش

مسیر یادگیری شخصی‌سازی‌شده، پیش‌بینی Drop-out، ارزیابی اثربخشی روش‌های آموزشی

🏭

صنعت و تولید

نگهداری پیش‌بینانه ماشین‌آلات، کنترل کیفیت با CV، بهینه‌سازی زنجیره تامین

🎮

بازی و گیمینگ

تحلیل player behavior، Game Balance، monetization، تشخیص cheating

تصورات غلط رایج

قبل از تصمیم‌گیری، این باورهای اشتباه را بشناسید

بیشتر وقت دانشمند داده صرف ساخت مدل‌های پیشرفته ML می‌شود

نظرسنجی‌های صنعتی نشان می‌دهند ۶۰ تا ۸۰ درصد زمان DS صرف جمع‌آوری، تمیزسازی و فهم داده می‌شود. ساخت مدل بخش کوچک و در عین حال جذاب کار است.

برای شروع باید دکترا داشته باشید

بسیاری از موفق‌ترین DS های دنیا (مثل Cassie Kozyrkov، Hilary Mason) سال‌ها بدون دکترا فعالیت کردند. شرکت‌های بزرگ مثل Airbnb و Spotify در سال‌های اخیر از الزام مدرک کاسته‌اند. آنچه مهم است: مهارت اثبات‌شده، پورتفولیو و مهارت ارتباطی.

هوش مصنوعی مولد جای دانشمند داده را خواهد گرفت

LLM ها کارهای روتین مثل نوشتن SQL ساده یا کد EDA را تسریع می‌کنند، اما طراحی آزمایش، تفسیر علیت، فهم کسب‌وکار و ارتباط با ذینفعان کارهایی هستند که AI نمی‌تواند به‌تنهایی انجام دهد. DS های موفق ۲۰۲۵ کسانی هستند که با LLM به عنوان دستیار کار می‌کنند.

دانشمند داده فقط کار فنی می‌کند

حدود نیمی از کار DS ارتباط است: با Product Manager، Engineering، مدیریت و حتی فروش. مهارت Storytelling و توضیح ساده مفاهیم پیچیده اغلب وجه تمایز DS متوسط و عالی است.

همه شرکت‌ها به دانشمند داده با مهارت‌های یکسان نیاز دارند

DS در یک استارتاپ ۲۰ نفره generalist است: SQL می‌نویسد، داشبورد می‌سازد و گاهی مدل ML می‌سازد. در یک شرکت ۱۰,۰۰۰ نفری ممکن است فقط روی causal inference یا experimentation کار کند. شناخت اندازه و فرهنگ شرکت قبل از apply مهم است.

یک روز کاری واقعی

در هر سطح روز کاری چه شکلی است؟

جونیور (۰–۲ سال)

بیشتر روز با راهنمایی ارشدها روی پروژه‌های مشخص کار می‌کنید. تمرکز بر یادگیری ابزارها، فهم داده شرکت و تمرین مهارت‌های ارتباطی است.

◆صبح: standup ۱۵ دقیقه‌ای + بررسی نتایج job های شبانه data pipeline
◆بلاک اول: نوشتن کوئری SQL برای تهیه داده مورد نیاز یک گزارش جدید
◆بعد از ناهار: کار روی یک تحلیل اکتشافی (EDA) برای تیم محصول و آماده‌سازی نمودارها
◆عصر: pair programming با یک DS ارشد روی یک مدل classification
◆پایان روز: مستندسازی نتایج در Confluence و به‌روزرسانی task board

میانی (۲–۵ سال)

خودتان مسئله را تعریف می‌کنید و تا انتها می‌برید. ترکیبی از کدنویسی، طراحی آزمایش و ارتباط با ذینفعان دارید.

◆صبح: بررسی نتایج آزمایش A/B هفته گذشته و آماده‌سازی توصیه برای Product Manager
◆جلسه ۳۰ دقیقه با تیم محصول: ارائه یافته‌ها و تصمیم‌گیری درباره ادامه یا توقف feature
◆بلاک کدنویسی: ساخت مدل پیش‌بینی churn و اجرای cross-validation
◆بعد از ناهار: code review برای کار جونیور + جلسه ۱:۱ با Tech Lead
◆عصر: نوشتن گزارش تحلیلی برای مدیر کل کسب‌وکار درباره فصل گذشته

ارشد (۵+ سال)

تمرکز روی تأثیر استراتژیک. کمتر کد می‌نویسید اما تصمیم‌هایتان روی جهت‌گیری تیم و محصول اثر بزرگ دارد. زمان زیادی را صرف منتورینگ و alignment می‌کنید.

◆صبح: جلسه با VP Product درباره roadmap داده برای کوارتر بعدی
◆بلاک کاری: بررسی طراحی آزمایش پیچیده و دادن feedback به DS های میانی
◆بعد از ناهار: کدنویسی هدفمند روی یک تحلیل علیت که نیاز به تجربه عمیق دارد
◆جلسه استخدام: مصاحبه فنی با کاندیدای DS و ارزیابی مهارت ارتباطی
◆پایان روز: نوشتن RFC برای پلتفرم experimentation جدید + mentor session با junior

مسئولیت‌ها و وظایف

مسئولیت‌های اصلی

وظایف روزانه و مهارت‌های مورد نیاز در این شغل

فنی

◈جمع‌آوری، پاکسازی و آماده‌سازی داده‌های خام برای تحلیل
◈اجرای تحلیل‌های آماری و استخراج بینش‌های کسب‌وکار
◈ساخت مدل‌های پیش‌بینی و ارزیابی دقت آن‌ها
◈طراحی و تحلیل آزمایش‌های A/B برای ارزیابی تغییرات محصول
◈ایجاد داشبوردها و گزارش‌های تجسم داده برای ذینفعان

مهارت نرم

◈ارائه یافته‌ها به مدیران و ذینفعان کسب‌وکار به زبان ساده
◈همکاری با تیم‌های محصول و مهندسی برای بهبود تصمیم‌گیری مبتنی بر داده

مدیریتی

◈تعریف و اندازه‌گیری KPI های مرتبط با هوش تجاری

مهارت‌های مورد نیاز

مهارت‌های فنی، نرم و حوزه‌ای که یک دانشمند داده موفق به آن‌ها نیاز دارد

مهارت‌های فنی

Python برای Data Scienceضروری

تسلط بر Pandas، NumPy، Scikit-learn و کار حرفه‌ای در Jupyter Notebook

SQL پیشرفتهضروری

نوشتن کوئری‌های پیچیده با JOIN، Window Functions، CTE و بهینه‌سازی performance

آمار و احتمالضروری

آمار توصیفی و استنباطی، آزمون فرض، توزیع‌ها، رگرسیون و درک p-value

یادگیری ماشینضروری

الگوریتم‌های supervised و unsupervised، ارزیابی مدل، Feature Engineering و جلوگیری از overfitting

تجسم دادهضروری

ساخت نمودارهای مؤثر با Matplotlib، Seaborn، Plotly و آشنایی با Tableau یا Power BI

A/B Testingمهم

طراحی، اجرا و تحلیل آزمایش‌های آماری برای ارزیابی تغییرات محصول و کسب‌وکار

Causal Inferenceمهم

تشخیص علیت از همبستگی با روش‌هایی مثل DiD، Synthetic Control و Propensity Score Matching

MLOps پایهمهم

Versioning مدل‌ها، استقرار با FastAPI/Streamlit و آشنایی با MLflow

Time Series Analysisمفید

تحلیل و پیش‌بینی سری‌های زمانی با ARIMA، Prophet و LSTM پایه

کار با کلان‌دادهمفید

PySpark، BigQuery یا Snowflake برای پردازش دیتاست‌های بزرگ

مهارت‌های نرم

Data Storytellingضروری

تبدیل اعداد و نمودارها به روایتی که تصمیم‌گیران آن را درک کرده و بر اساسش عمل کنند

ارتباط با غیرفنی‌هاضروری

توضیح مفاهیم آماری و ML به مدیران، فروش و بازاریابی بدون استفاده از اصطلاحات فنی

تعریف مسئلهضروری

تبدیل سؤال مبهم کسب‌وکار («چرا فروش کاهش یافته؟») به سؤال داده‌ای قابل پاسخ

کنجکاوی و سؤال‌محور بودنضروری

همیشه سؤال «چرا» بپرسید — دانشمند داده خوب از پاسخ‌های ساده‌انگارانه راضی نمی‌شود

مدیریت ابهاممهم

کار با داده‌های ناقص، نتایج غیرقطعی و تصمیم‌گیری با اطلاعات ناکامل

همکاری بین‌تیمیمهم

کار مؤثر با Product، Engineering، Marketing و درک نیازها و محدودیت‌های هرکدام

دانش حوزه‌ای

Domain Knowledgeضروری

درک عمیق صنعتی که در آن کار می‌کنید — یک DS مالی باید مفاهیم ریسک و سود را بفهمد

Experiment Designمهم

اصول طراحی آزمایش، power analysis، randomization و کنترل عوامل مخدوش‌کننده

Privacy و Ethicsمهم

آگاهی از GDPR، حفظ حریم خصوصی در تحلیل داده و bias در مدل‌ها

Business Acumenمهم

فهم چگونگی کسب درآمد شرکت، KPI های کلیدی و اولویت‌های استراتژیک

آشنایی با LLM هامفید

استفاده از ChatGPT/Claude به عنوان دستیار تحلیل و درک محدودیت‌های آن‌ها در کار DS

ضروری — بدون آن نمی‌توان وارد بازار کار شدمهم — تفاوت بین جونیور و میانیمفید — مزیت رقابتی

نقشه راه و مسیر آموزشی

نقشه راه تبدیل شدن به دانشمند داده

این مسیر گام به گام شما را از صفر تا حرفه‌ای هدایت می‌کند.

آمار، احتمال و ریاضیات

⏱️ ۲ تا ۳ ماه

ساخت پایه آماری قوی برای درک داده، طراحی آزمایش و تفسیر نتایج مدل‌ها بدون افتادن در دام نتایج گمراه‌کننده

آمار توصیفی و استنباطیاحتمال و توزیع‌هاآزمون فرض و p-valueهمبستگی در برابر علیتBayesian Thinkingجبر خطی پایه

منابع پیشنهادی

Statistics and Data Science MicroMasters - MITx Statistical Learning - Stanford Online Think Stats - Allen B. Downey (رایگان)

Python، SQL و کار با داده

⏱️ ۲ تا ۳ ماه

تسلط بر ابزارهای روزمره دانشمند داده: استخراج داده با SQL و تمیزسازی و آماده‌سازی آن با Python برای تحلیل

PythonPandasNumPySQL پیشرفته (Window Functions، CTE)Data CleaningEDA (Exploratory Data Analysis)Jupyter Notebook

منابع پیشنهادی

Python for Data Science Handbook - Jake VanderPlas Mode SQL Tutorial Kaggle Pandas Course (رایگان)Kaggle Data Cleaning Course

تجسم داده و Storytelling

⏱️ ۱ تا ۲ ماه

یادگیری نمایش بصری مؤثر داده و انتقال یافته‌ها به مخاطب غیرفنی — مهارتی که اغلب وجه تمایز بین دانشمند داده خوب و عالی است

MatplotlibSeabornPlotlyTableauPower BIاصول طراحی داشبوردData Storytelling

منابع پیشنهادی

Storytelling with Data - Cole Nussbaumer Knaflic Data Visualization with Python - Coursera Tableau Public (رایگان)

یادگیری ماشین کاربردی

⏱️ ۳ تا ۴ ماه

پیاده‌سازی مدل‌های یادگیری ماشین برای حل مسائل واقعی کسب‌وکار همراه با ارزیابی صحیح و جلوگیری از overfitting

Scikit-learnXGBoost / LightGBMFeature EngineeringCross-validationHyperparameter TuningImbalanced DataA/B Testing

منابع پیشنهادی

Machine Learning Specialization - Andrew Ng (Coursera)Hands-On Machine Learning - Aurélien Géron Kaggle Intro to Machine Learning

پروژه‌های واقعی، استقرار و LLMs در کار DS

⏱️ مداوم

ساخت پورتفولیو با مسائل واقعی، آشنایی با MLOps پایه برای استقرار مدل و استفاده از LLM ها به عنوان دستیار تحلیل

MLflowFastAPI / StreamlitDocker پایهGit & GitHubCausal InferenceTime SeriesLLM-augmented analytics

منابع پیشنهادی

Kaggle Competitions Made With ML - Goku Mohandas Towards Data Science (Medium)DeepLearning.AI - Generative AI for Data Scientists

ابزارها و استک فنی

ابزارهایی که هر مهندس AI باید بشناسد، دسته‌بندی‌شده بر اساس اولویت

زبان‌ها و کتابخانه‌های اصلی

Python

زبان غالب در Data Science با اکوسیستم گسترده کتابخانه‌ها

ضروری

Pandas

کتابخانه استاندارد برای کار با DataFrame ها و دستکاری داده

ضروری

NumPy

محاسبات عددی و آرایه‌های چندبعدی — پایه تمام کتابخانه‌های ML

ضروری

Scikit-learn

کتابخانه ML با APIs یکپارچه برای الگوریتم‌های کلاسیک

ضروری

زبان آماری قدرتمند، هنوز در حوزه‌های پزشکی و دانشگاهی محبوب

مفید

تجسم داده

Matplotlib

کتابخانه پایه تجسم در Python — انعطاف بالا، یادگیری متوسط

ضروری

Seaborn

نمودارهای آماری زیبا با کد کوتاه، روی Matplotlib ساخته شده

ضروری

Plotly

نمودارهای تعاملی برای داشبورد و گزارش‌های وب

مفید

Tableau

ابزار BI برای ساخت داشبوردهای حرفه‌ای — استاندارد صنعتی

مفید

Power BI

رقیب Tableau از Microsoft، در شرکت‌های بزرگ متداول

مفید

ML، آمار و آزمایش

XGBoost

Gradient Boosting قدرتمند — برنده اکثر مسابقات Kaggle با داده tabular

ضروری

LightGBM

جایگزین سریع‌تر XGBoost برای دیتاست‌های بزرگ

مفید

Statsmodels

تحلیل آماری دقیق — رگرسیون، Time Series و آزمون فرض

مفید

Jupyter Notebook

محیط تعاملی استاندارد برای EDA و گزارش

ضروری

MLflow

ردیابی آزمایش‌ها، مدیریت مدل و reproducibility

مفید

کلان‌داده، Cloud و SQL

SQL (PostgreSQL/MySQL)

زبان جهانی استخراج داده — مهارت غیرقابل چشم‌پوشی هر دانشمند داده

ضروری

Apache Spark / PySpark

پردازش توزیع‌شده داده‌های بزرگ — ضروری در شرکت‌های Enterprise

مفید

Google BigQuery

Data warehouse مقیاس‌پذیر و سریع برای تحلیل داده‌های میلیاردی

مفید

Snowflake

Data warehouse cloud-native، استاندارد جدید در صنعت

مفید

dbt

ابزار تبدیل داده مدرن (Transformation) — پل بین DS و Data Engineering

پیشرفته

ضروری — باید یاد بگیریدمفید — ارزش یادگیری داردپیشرفته — برای سطوح ارشد

مسیر پیشرفت شغلی

از جونیور تا Staff Engineer — چه مهارت‌هایی نیاز دارید و چه درآمدی انتظار داشته باشید

دانشمند داده جونیور

۰ تا ۲ سال

~$75K

میانگین سالانه (آمریکا)

کار روی پروژه‌های مشخص با راهنمایی، تحلیل توصیفی، آماده‌سازی داشبورد و کمک به تیم در EDA

PythonSQLPandasVisualizationآمار پایه

دانشمند داده

۲ تا ۵ سال

~$110K

میانگین سالانه (آمریکا)

تعریف مسئله، طراحی آزمایش، ساخت مدل‌های ML برای تولید و ارائه نتایج به ذینفعان غیرفنی

ML پیشرفتهA/B TestingFeature EngineeringStorytellingDomain Knowledge

دانشمند داده ارشد

۵ تا ۸ سال

~$155K

میانگین سالانه (آمریکا)

رهبری فنی پروژه‌های پیچیده، منتورینگ تیم، تعامل مستقیم با مدیریت محصول و طراحی استراتژی داده

System DesignCausal InferenceMLOpsStakeholder ManagementMentoring

Lead / Principal Data Scientist

۸+ سال

~$210K

میانگین سالانه (آمریکا)

تعریف roadmap داده شرکت، همکاری با C-level، استخدام و ساخت تیم، تصمیم‌گیری درباره سرمایه‌گذاری در ML

Technical StrategyTeam BuildingCross-functional LeadershipBusiness Acumen

چالش‌ها و جنبه‌های منفی

واقعیت‌هایی که کمتر در آگهی‌های شغلی می‌بینید — قبل از ورود بدانید

داده‌های کثیف و ناقص

عمومی

در دنیای واقعی برخلاف Kaggle، داده‌ها معمولاً ناقص، ناسازگار، یا اشتباه هستند. ممکن است هفته‌ها صرف کشف این کنید که چرا یک ستون مهم برای ۳۰٪ کاربران خالی است یا چرا تعریف یک متریک در دو سیستم متفاوت است.

ذینفعان با انتظارات نامشخص

عمومی

مدیر می‌گوید «یک تحلیل از مشتریان می‌خواهم» اما وقتی نتیجه را ارائه می‌دهید، می‌گوید این چیزی نیست که می‌خواستم. توانایی استخراج نیاز واقعی از سؤالات مبهم یکی از مهم‌ترین مهارت‌های نرم DS است.

ارتباط عدم قطعیت

عمومی

وقتی به مدیری می‌گویید «مدل با ۸۵٪ احتمال درست است»، اغلب این را می‌شنود: «مدل درست است.» انتقال عدم قطعیت، بازه اطمینان و محدودیت‌های مدل به مخاطب غیرفنی بسیار دشوار است و نیاز به تمرین مداوم دارد.

فشار p-hacking و تأیید فرضیه‌های مدیریت

شرکت بزرگ

گاهی مدیریت می‌خواهد یک فرضیه خاص را تأیید کنید (مثلاً «این کمپین موفق بود»). فشار سیاسی برای تنظیم تحلیل به نفع نتیجه دلخواه واقعی است. ایستادگی برای صداقت علمی نیاز به اعتماد به نفس و حمایت از سمت مدیر مستقیم دارد.

Model Decay و نگهداری بلندمدت

عمومی

مدلی که امروز با دقت ۹۰٪ کار می‌کند، ممکن است ۶ ماه دیگر به ۷۰٪ افت کند چون رفتار کاربر یا توزیع داده تغییر کرده. بدون monitoring و بازآموزی منظم، مدل‌های پروداکشن به‌مرور بی‌اعتبار می‌شوند.

«Data Science Theater» — کار جذاب اما بی‌اثر

عمومی

گاهی پروژه‌هایی که تکنیک‌های پیشرفته دارند (Deep Learning، NLP پیچیده) جذاب به نظر می‌رسند اما هیچ تصمیم واقعی را تغییر نمی‌دهند. DS موفق یاد می‌گیرد بین کاری که impact ایجاد می‌کند و کاری که فقط cool به نظر می‌رسد تمایز قائل شود — حتی اگر کار impactful ساده‌تر باشد.

حقوق و بازار کار جهانی

حقوق جهانی دانشمند داده

میانگین حقوق سالانه بر اساس تجربه در کشورهای مختلف

کشور	حداقل	میانه	حداکثر	ارز
🇦🇪اماراتبالاترین	AED 150,000	AED 220,000	AED 310,000	AED
🇺🇸آمریکا	$110,000	$155,000	$200,000	USD
🇨🇦کانادا	CA$95,000	CA$128,000	CA$165,000	CAD
🇸🇬سنگاپور	SGD 90,000	SGD 128,000	SGD 175,000	SGD
🇦🇺استرالیا	A$95,000	A$125,000	A$160,000	AUD
🇬🇧انگلستان	£65,000	£90,000	£120,000	GBP
🇩🇪آلمان	€60,000	€82,000	€110,000	EUR

* ارقام سالانه و تقریبی هستند و بر اساس میانگین بازار در سال ۲۰۲۵ محاسبه شده‌اند.

چگونه از صفر شروع کنیم

برنامه گام‌به‌گام برای ورود به مهندسی هوش مصنوعی

ماه ۱: آمار و Python برای داده

آمار توصیفی و استنباطی پایه + Pandas و NumPy. هدف: راحت کار کردن با DataFrame ها و درک p-value.

Khan Academy Statistics Kaggle Pandas Course

ماه ۲: SQL و EDA

SQL پیشرفته با Window Functions و CTE + اولین EDA کامل روی یک دیتاست Kaggle.

Mode SQL Tutorial Kaggle Datasets

ماه ۳: Visualization و Storytelling

Matplotlib، Seaborn، Plotly + کتاب Storytelling with Data. ساخت اولین داشبورد در Tableau Public.

Storytelling with Data Tableau Public

ماه ۴: Machine Learning کاربردی

دوره ML اندرو ان‌جی + پیاده‌سازی ۲ مدل (regression و classification) با Scikit-learn روی داده واقعی.

Machine Learning - Andrew Ng

ماه ۵: A/B Testing و پروژه پیشرفته

اصول طراحی و تحلیل A/B test + ساخت یک مدل پیش‌بینی کامل (مثل churn) با مستندسازی حرفه‌ای.

ماه ۶: پورتفولیو و جستجوی کار

تمیز کردن GitHub، نوشتن ۲ مقاله Medium درباره پروژه‌ها، بهینه‌سازی LinkedIn و apply برای رول‌های Junior DS.

پروژه‌های پیشنهادی برای رزومه

EDA کامل روی یک دیتاست واقعی Kaggle

مبتدی

یک دیتاست از Kaggle انتخاب کنید (مثل Titanic، Airbnb یا COVID-19) و یک تحلیل اکتشافی کامل انجام دهید: تمیزسازی، آمار توصیفی، تجسم و کشف الگوها. خروجی را به صورت Jupyter Notebook با روایت کامل ارائه دهید.

PythonPandasMatplotlibSeabornJupyter

زمان تخمینی: ۱ تا ۲ هفته

مدل پیش‌بینی Churn مشتری

متوسط

یک مدل classification بسازید که پیش‌بینی کند کدام مشتریان احتمال زیادی برای ترک سرویس دارند. روی Feature Engineering، انتخاب معیار ارزیابی مناسب (recall یا F1) و توضیح نتایج به تیم بازاریابی تمرکز کنید.

Scikit-learnXGBoostPandasSHAP

زمان تخمینی: ۲ تا ۳ هفته

تحلیل آزمایش A/B

متوسط

یک سناریو A/B test را شبیه‌سازی کنید (مثلاً تغییر دکمه خرید). آزمون آماری مناسب اجرا کنید، p-value و بازه اطمینان محاسبه کنید و تصمیم‌گیری مبتنی بر داده ارائه دهید — همراه با هشدارهای لازم درباره power و چندبارگی آزمون.

PythonScipyStatsmodelsPlotly

زمان تخمینی: ۲ هفته

داشبورد تعاملی فروش

متوسط

یک داشبورد در Tableau یا Power BI بسازید که KPI های یک کسب‌وکار خرده‌فروشی را نشان دهد: روند فروش، مقایسه بین شعب، تحلیل کوهورت و segment ها. هدف: کمک به مدیر فروش برای تصمیم‌گیری در ۳۰ ثانیه.

Tableau / Power BISQLExcel

زمان تخمینی: ۲ تا ۳ هفته

سیستم توصیه‌گر End-to-End

پیشرفته

یک سیستم توصیه‌گر فیلم یا محصول بسازید (Collaborative Filtering یا Content-Based)، با FastAPI به API تبدیل کنید، با Streamlit رابط ساده بسازید و در یک سرویس cloud رایگان مستقر کنید. کل پروژه را روی GitHub با README کامل منتشر کنید.

PythonSurprise / LightFMFastAPIStreamlitDocker

زمان تخمینی: ۴ تا ۶ هفته

مثال‌های واقعی و Case Studies

داستان‌های واقعی از مهندسانی که در این حوزه تأثیرگذار بوده‌اند

DJ Patil

پیشینه

دکترای ریاضی کاربردی از دانشگاه مریلند. کار در LinkedIn (۲۰۰۸–۲۰۱۱)، سپس Greylock Partners و RelateIQ. در ۲۰۱۵ به عنوان اولین Chief Data Scientist ایالات متحده توسط رئیس‌جمهور اوباما منصوب شد.

دستاورد

اصطلاح «Data Scientist» را در سال ۲۰۰۸ به همراه Jeff Hammerbacher (Facebook) ابداع کرد. در LinkedIn سیستم «People You May Know» را ساخت که میلیون‌ها کاربر جدید جذب کرد. در سمت دولتی، استفاده از داده در سیاست‌گذاری سلامت، عدالت کیفری و علم باز را ترویج کرد.

درس کلیدی

Patil نشان داد که Data Scientist می‌تواند در بالاترین سطوح تأثیرگذاری — از یک محصول فنی تا سیاست‌گذاری کشوری — نقش‌آفرین باشد. کلید موفقیت او ترکیب عمق فنی با مهارت ارتباطی و درک مسائل کلان بود.

Hilary Mason

پیشینه

تحصیلات در علوم کامپیوتر. Chief Scientist در Bitly (۲۰۰۹–۲۰۱۴) که اولین موج «شغل جذاب قرن» بودن DS را شکل داد. سپس بنیان‌گذار Fast Forward Labs و VP of Research در Cloudera. در ۲۰۱۸ شرکت ML را به Hidden Door تبدیل کرد.

دستاورد

یکی از تأثیرگذارترین زنان در حوزه داده. در Bitly روی تحلیل کلان‌داده URL ها کار کرد و نشان داد چگونه می‌توان از داده‌های کوچک ولی غنی، بینش‌های بزرگ گرفت. در Fast Forward Labs گزارش‌های کاربردی برای صنعت درباره موضوعاتی مثل Probabilistic Programming و Federated Learning تولید کرد.

درس کلیدی

Mason ثابت کرد که برای موفقیت در DS لازم نیست همیشه با بزرگ‌ترین دیتاست‌ها کار کنید. درک عمیق مسئله، انتخاب ابزار درست و توانایی توضیح ساده مفاهیم اغلب از پیچیدگی فنی مهم‌تر است.

Cassie Kozyrkov

پیشینه

تحصیلات در آمار، اقتصاد و علوم شناختی از دانشگاه‌های Chicago، NCSU و Duke. ۱۰ سال در Google کار کرد و تا سمت Chief Decision Scientist رسید. در ۲۰۲۳ Google را ترک کرد و Data Scientific را تأسیس کرد.

دستاورد

حوزه «Decision Intelligence» را در Google ابداع و رهبری کرد — رویکردی که آمار، علم تصمیم‌گیری و ML را ترکیب می‌کند. بیش از ۲۰,۰۰۰ کارمند Google را در زمینه تفکر داده‌محور آموزش داد. مقالات Medium او با میلیون‌ها بازدید مرجع آموزش DS برای غیرمتخصصان شده است.

درس کلیدی

Kozyrkov نشان داد که برتری در DS فقط مهارت فنی نیست — بلکه توانایی کمک به دیگران برای تصمیم‌گیری بهتر است. تمرکز او روی «چرا» قبل از «چگونه» و آموزش ساده مفاهیم پیچیده یک الگوی موفقیت در سطح جهانی شد.

نمونه آگهی استخدام واقعی + تحلیل

یک آگهی واقعی از شرکت فعال در حال استخدام، با تحلیل هر بخش

Senior Data Scientist — Personalization

Spotifyنیویورک یا استکهلم (Hybrid)2025-02

مشاهده آگهی اصلی

تحلیل نیازمندی‌ها

5+ years of experience in data science or analytics roles

۵ سال تجربه برای رول Senior منطقی است. اگر ۳–۴ سال تجربه قوی با impact واضح دارید، apply کنید — Spotify معمولاً درجات تجربه را انعطاف‌پذیر می‌بیند.

ضروری

Strong proficiency in Python, SQL, and statistical analysis

این سه پایه DS هستند. در مصاحبه فنی انتظار داشته باشید کوئری‌های پیچیده SQL بنویسید و یک مسئله آماری را از صفر حل کنید. Mock interview با LeetCode یا StrataScratch تمرین خوبی است.

ضروری

Experience designing and analyzing A/B experiments at scale

Spotify روزانه ده‌ها آزمایش اجرا می‌کند. تجربه با چالش‌های واقعی experimentation (multiple testing، novelty effect، interaction effects) ارزش بزرگی دارد. کتاب Trustworthy Online Controlled Experiments منبع خوبی است.

ضروری

Experience with recommender systems or personalization

این تخصص رول است. تجربه عملی با Collaborative Filtering، Matrix Factorization یا Neural Recommenders اساسی است. اگر تجربه ندارید، یک پروژه پورتفولیو در این حوزه قبل از apply بسازید.

ضروری

Ability to translate complex analyses into business recommendations

این مهارت نرم اما حیاتی است. در مصاحبه case study، نه فقط تحلیل بلکه «چه باید کرد» را با شفافیت ارائه دهید. به آنالیز خود همیشه «So what?» اضافه کنید.

ضروری

Experience with big data tools (Spark, BigQuery, or similar)

Spotify دیتاست‌های میلیاردی دارد. اگر تجربه مستقیم با Spark ندارید، آشنایی با مفاهیم distributed computing و توانایی نوشتن کوئری‌های BigQuery کافی است. یادگیری PySpark با تمرین قابل دسترس است.

مهم

PhD in quantitative field (preferred but not required)

کلمه کلیدی «preferred but not required» مهم است. Spotify در سال‌های اخیر استخدام بدون دکترا را افزایش داده است. پورتفولیو قوی و impact اثبات‌شده جایگزین مدرک می‌شود.

مفید

تحلیل مسئولیت‌ها

Design and analyze experiments to improve content discovery for 600M+ users

مقیاس کار جذاب است: تصمیم شما روی صدها میلیون کاربر اثر می‌گذارد. این یعنی هم فرصت تأثیر بزرگ و هم مسئولیت بالا — خطای آماری کوچک می‌تواند به میلیون‌ها دلار تبدیل شود.

Build models that predict user preferences across music, podcasts, and video

کار multi-modal و چند-حوزه‌ای. انتظار می‌رود با چالش cold-start، balance بین exploration و exploitation و حل تضاد بین کوتاه‌مدت (engagement) و بلندمدت (satisfaction) آشنا باشید.

Partner with PMs, engineers, and designers to ship recommendations features

DS در Spotify عضو فعال تیم محصول است، نه consultant جداگانه. مهارت کار همزمان با چند نقش، اولویت‌بندی و trade-off گرفتن از اهمیت بالایی برخوردار است.

Mentor junior data scientists and contribute to the DS community at Spotify

در سطح Senior، رشد دیگران بخشی از کار شماست. تجربه قبلی mentoring (حتی غیررسمی) ارزشمند است. Spotify فرهنگ «engineering excellence» قوی دارد و انتظار می‌رود به آن کمک کنید.

نتیجه‌گیری کلی

این آگهی ترکیبی از سه چیز را می‌خواهد: عمق فنی (آمار، ML، experimentation)، تجربه domain خاص (recommender systems) و مهارت‌های نرم سطح بالا (mentoring، communication). برای موفقیت در apply، روی یک پروژه recommender system در پورتفولیو خود سرمایه‌گذاری کنید و در مصاحبه case study، رویکرد سیستماتیک خود را با گفتن بلند فکرتان نشان دهید — Spotify به فرآیند تفکر شما به اندازه پاسخ نهایی اهمیت می‌دهد.

آینده و روندها

پیش‌بینی ۵–۱۰ ساله و مهارت‌هایی که باید یاد بگیرید

رشد ۳۶٪ در ۱۰ سال آینده — سریع‌ترین رشد در میان مشاغل علمی و فنی (BLS Occupational Outlook 2024)

منبع: U.S. Bureau of Labor Statistics + WEF Future of Jobs Report 2025

مهارت‌های نوظهور که باید یاد بگیرید

Causal Inference و Causal DiscoveryLLM-augmented Analytics و Agent-based WorkflowsReal-time و Streaming AnalyticsMLOps برای Data Scientist هاPrivacy-preserving ML (Differential Privacy، Federated Learning)Decision Intelligence و AI-native A/B Testing

پیش‌بینی‌های آینده

2026

ابزارهای LLM-native برای DS (مثل Hex Magic و Vercel v0) به استاندارد تبدیل می‌شوند — DS هایی که از این ابزارها استفاده می‌کنند ۲–۳ برابر سریع‌تر کار می‌کنند

2027

تمایز بین Data Analyst و Junior Data Scientist عملاً از بین می‌رود — رول‌های جدید مثل «Analytics Engineer» و «Decision Scientist» ظهور می‌کنند

2028

Causal Inference به مهارت پایه DS تبدیل می‌شود (نه پیشرفته) — شرکت‌ها انتظار دارند DS تشخیص دهد چه چیزی واقعاً علت است نه فقط همبستگی

2030

بازار به ۲ سر تقسیم می‌شود: DS های Senior با تخصص استراتژیک (تقاضای بالا، حقوق بالا) و رول‌های اپراتوری low-end که توسط AI tooling پر می‌شوند — مسیر میانی نازک می‌شود

ریسک‌های واقعی

سؤال مهم در ۲۰۲۵: آیا LLM ها جای دانشمند داده را می‌گیرند؟ پاسخ کوتاه: نه، اما کار را تغییر می‌دهند. کارهای routine مثل نوشتن SQL ساده، ساخت نمودارهای پایه و EDA اولیه به سرعت توسط ChatGPT و Claude انجام می‌شوند. در نتیجه DS های جونیور بیشترین فشار را تحمل می‌کنند. اما طراحی آزمایش، تفسیر علیت، فهم کسب‌وکار و ارتباط با ذینفعان همچنان نیاز به انسان دارد. DS های موفق آینده کسانی هستند که با LLM به عنوان دستیار کار می‌کنند، در causal inference عمق پیدا می‌کنند و روی impact کسب‌وکار به جای پیچیدگی فنی تمرکز می‌کنند.

ویدیوهای آموزشی

یک روز در زندگی یک Data Scientist

ویدیوهای واقعی از متخصصان این حوزه که روزانه چه کارهایی انجام می‌دهند

A Day in the Life of a Data Analyst (2023)

CareerFoundry

A Day In The Life Of A Data Science Manager

Recall by Dataiku

What REALLY is Data Science? Told by a Data Scientist

Joma Tech

Day in the Life of a Data Scientist | Flatiron Data Science Bootcamp Grad

Data Strategy Professionals

What is a Data Scientist? A day in the life & industry breakdown

Damsel in Data

What is Data Science?

IBM Technology

برای راهنمایی شخصی‌سازی‌شده مشاوره بگیرید

دانشمند داده

مقدمه و تعریف شغل

چه چیزی می‌سازید؟

تخصص‌های مختلف دانشمند داده

تفاوت با شغل‌های مشابه

تأثیر در صنایع مختلف

تصورات غلط رایج

یک روز کاری واقعی

مسئولیت‌ها و وظایف

مسئولیت‌های اصلی

مهارت‌های مورد نیاز

مهارت‌های فنی

مهارت‌های نرم

دانش حوزه‌ای

نقشه راه و مسیر آموزشی

نقشه راه تبدیل شدن به دانشمند داده

آمار، احتمال و ریاضیات

Python، SQL و کار با داده

تجسم داده و Storytelling

یادگیری ماشین کاربردی

پروژه‌های واقعی، استقرار و LLMs در کار DS

ابزارها و استک فنی

زبان‌ها و کتابخانه‌های اصلی

تجسم داده

ML، آمار و آزمایش

کلان‌داده، Cloud و SQL

مسیر پیشرفت شغلی

دانشمند داده جونیور

دانشمند داده

دانشمند داده ارشد

Lead / Principal Data Scientist

چالش‌ها و جنبه‌های منفی

داده‌های کثیف و ناقص

ذینفعان با انتظارات نامشخص

ارتباط عدم قطعیت

فشار p-hacking و تأیید فرضیه‌های مدیریت

Model Decay و نگهداری بلندمدت

«Data Science Theater» — کار جذاب اما بی‌اثر

حقوق و بازار کار جهانی

حقوق جهانی دانشمند داده

چگونه از صفر شروع کنیم

ماه ۱: آمار و Python برای داده

ماه ۲: SQL و EDA

ماه ۳: Visualization و Storytelling

ماه ۴: Machine Learning کاربردی

ماه ۵: A/B Testing و پروژه پیشرفته

ماه ۶: پورتفولیو و جستجوی کار

پروژه‌های پیشنهادی برای رزومه

EDA کامل روی یک دیتاست واقعی Kaggle

مدل پیش‌بینی Churn مشتری

تحلیل آزمایش A/B

داشبورد تعاملی فروش

سیستم توصیه‌گر End-to-End

مثال‌های واقعی و Case Studies

DJ Patil

Hilary Mason

Cassie Kozyrkov

نمونه آگهی استخدام واقعی + تحلیل

Senior Data Scientist — Personalization

تحلیل نیازمندی‌ها

تحلیل مسئولیت‌ها

آینده و روندها

مهارت‌های نوظهور که باید یاد بگیرید

پیش‌بینی‌های آینده

ویدیوهای آموزشی

یک روز در زندگی یک Data Scientist

A Day in the Life of a Data Analyst (2023)

A Day In The Life Of A Data Science Manager

What REALLY is Data Science? Told by a Data Scientist

Day in the Life of a Data Scientist | Flatiron Data Science Bootcamp Grad

What is a Data Scientist? A day in the life &amp; industry breakdown

What is Data Science?

What is a Data Scientist? A day in the life & industry breakdown