🔬
رتبه ۹ از ۱۰رشد ۲۶% سالانه

دانشمند یادگیری ماشین

Machine Learning Scientist

دانشمند یادگیری ماشین متخصصی است که بین تحقیق آکادمیک و مهندسی محصول قرار دارد. این فرد الگوریتم‌های جدید طراحی می‌کند، مقالات علمی می‌خواند و می‌نویسد، آزمایش‌های دقیق برای اثبات فرضیه‌ها اجرا می‌کند و نتایج تحقیقاتی را به مدل‌های قابل استفاده در محصول تبدیل می‌کند. در عصر مدل‌های پایه، ML Scientist یکی از کلیدی‌ترین نقش‌ها در شرکت‌هایی است که نمی‌خواهند صرفاً مصرف‌کننده API های OpenAI باشند، بلکه قصد دارند مزیت رقابتی الگوریتمی بسازند.

Deep Learning ResearchPyTorchStatisticsExperimentationPaper Reading & Writing

مقدمه و تعریف شغل

دانشمند یادگیری ماشین (ML Scientist) متخصصی است که در تقاطع تحقیق و کاربرد قرار دارد. برخلاف AI Researcher که عمدتاً paper چاپ می‌کند و برخلاف ML Engineer که مدل‌های آماده را در پروداکشن می‌برد، ML Scientist یک «hybrid» است: paper می‌خواند، فرضیه می‌سازد، آزمایش می‌کند، اما هدفش حل مسائل تجاری شرکت است نه فقط مقاله. در شرکت‌های بزرگ، این نقش گاهی Applied Scientist یا Research Engineer نامیده می‌شود.

این نقش با اقتصاد شرکت‌های AI به سرعت تکامل یافته است. در ۲۰۱۵، فقط Google، Facebook، Microsoft و کمی DeepMind، تیم‌های جدی ML Scientist داشتند. در ۲۰۲۵، تقریباً هر شرکت با ارزش بالای ۱ میلیارد دلار و فعالیت در AI، حداقل چند ML Scientist دارد. حقوق در شرکت‌های frontier (OpenAI، Anthropic، Google DeepMind) برای Senior Scientist ها به ۸۰۰,۰۰۰ تا ۱.۲ میلیون دلار رسیده، در حالی که در شرکت‌های متوسط ۲۵۰–۴۰۰ هزار دلار رایج است. بازار به‌شدت رقابتی است: شرکت‌ها برای پروفایل‌های قوی paper-publishing رقابت می‌کنند و طبق گزارش‌های صنعتی، نرخ retention ML Scientist ها در شرکت‌های بزرگ یکی از پایین‌ترین‌ها در tech است.

چه چیزی می‌سازید؟

مثال‌های واقعی از خروجی کار یک دانشمند یادگیری ماشین

🧬

مدل‌های پایه اختصاصی برای دامنه شرکت

یک شرکت bioinformatics می‌خواهد مدل foundation مخصوص پروتئین داشته باشد. شما معماری را طراحی می‌کنید، ۸۰۰GB داده ساختاری را تمیز می‌کنید و روی ۶۴ A100 برای ۳ هفته آموزش می‌دهید.

🎯

Recommender Systems نسل جدید

YouTube می‌خواهد توصیه‌گرش بهتر شود. شما یک معماری two-tower با retrieval embedding ها طراحی می‌کنید، A/B test روی ۵٪ ترافیک می‌گذارید و watch time را ۲٪ بالا می‌برید — معادل صدها میلیون دلار.

🔧

تکنیک‌های Fine-tuning کارآمد

شرکت حقوقی نمی‌تواند کل GPT-4 را fine-tune کند. شما LoRA + RAG hybrid طراحی می‌کنید که با ۰.۱٪ پارامتر، عملکرد مدل را روی domain حقوقی ۱۸٪ بهبود می‌دهد.

🔗

Causal Inference در سطح محصول

تیم محصول می‌گوید «این feature engagement را ۱۲٪ بالا برد». شما با causal analysis نشان می‌دهید که در واقع ۳٪ علت‌مند است و بقیه selection bias بوده — تصمیم استراتژیک تغییر می‌کند.

🎮

Reinforcement Learning برای مسائل واقعی

یک شرکت energy می‌خواهد مصرف datacenter ها را کاهش دهد. شما با RL policy ای طراحی می‌کنید که cooling system را به‌طور پویا تنظیم می‌کند و ۲۰٪ مصرف انرژی را کم می‌کند (دقیقاً همان کاری که DeepMind برای Google کرد).

📊

ارزیابی و Benchmarking مدل‌ها

قبل از publish یک LLM داخلی، شما یک سوئیت ارزیابی کامل می‌سازید که شامل safety، bias، factuality و reasoning است. این بخش از کار به اندازه ساخت مدل ارزشمند است.

تخصص‌های مختلف دانشمند یادگیری ماشین

این شغل یک عنوان واحد نیست — مسیرهای تخصصی متعددی دارد

🤖

محقق مدل‌های زبانی بزرگ

LLM Researcher

تخصص در pre-training، fine-tuning، alignment و capabilities مدل‌های بزرگ. پرتقاضاترین تخصص ۲۰۲۵.

👁️

دانشمند بینایی ماشین

Computer Vision Scientist

تمرکز روی image/video models، multimodal، generative vision. حوزه‌ای با کاربردهای deep در autonomous driving، medical imaging و AR/VR.

🎮

دانشمند یادگیری تقویتی

Reinforcement Learning Scientist

RL کلاسیک، RLHF، multi-agent. کاربرد در games، robotics، optimization و recently، alignment مدل‌های زبانی.

🔗

دانشمند ML علیتی

Causal ML Scientist

تخصص نادر و پرارزش در tech: استفاده از causal inference در محصول، uplift modeling و counterfactual reasoning.

🧬

ML برای علوم

ML for Science

کاربرد ML در biology، chemistry، physics. نمونه: AlphaFold. مسیری بین industry و آکادمی با impact عمیق.

تفاوت با شغل‌های مشابه

کجا این شغل تمام می‌شود و شغل دیگری شروع می‌شود؟

مهندس یادگیری ماشینML Engineer

ML Engineer روی استقرار و scaling تمرکز دارد — مدل را در production نگه می‌دارد، latency را بهینه می‌کند، monitoring می‌سازد. ML Scientist روی ساخت الگوریتم بهتر تمرکز دارد — فرضیه، آزمایش، paper. هر دو PyTorch می‌نویسند، اما با هدف متفاوت. شرکت‌های موفق هر دو را در یک تیم نگه می‌دارند.

محقق هوش مصنوعیAI Researcher

AI Researcher (به‌خصوص در labs مثل OpenAI یا DeepMind) primarily paper چاپ می‌کند و اولویت شخصی‌اش science است. ML Scientist در شرکت‌ها معمولاً اولویت محصول دارد — paper هم بنویسد، ولی مدل باید به production برسد. مرز بین این دو در شرکت‌های frontier محو است.

دانشمند دادهData Scientist

Data Scientist عمدتاً روی تحلیل و bizness insight کار می‌کند: SQL، dashboard، A/B test ساده. ML Scientist روی الگوریتم و مدل کار می‌کند: PyTorch، paper، training. در شرکت‌های کوچک گاهی یک نفر هر دو نقش را دارد، اما در ۲۰۲۵ این دو مسیر شغلی به‌طور قابل توجهی از هم جدا شده‌اند.

دانشمند کاربردیApplied Scientist (Amazon style)

Applied Scientist عنوانی است که آمازون (و حالا بقیه) به ML Scientist هایی می‌دهد که روی محصولات کار می‌کنند. عملاً معادل ML Scientist است، فقط با تأکید بیشتر روی tangible business impact. مصاحبه‌اش هم ML اما هم coding است.

تأثیر در صنایع مختلف

دانشمند یادگیری ماشین در همه صنایع مشغول به کار است — نه فقط شرکت‌های فناوری

💻

Big Tech

ساخت recommender systems، search ranking، speech recognition و حالا LLM ها — جایی که بیشترین ROI ML Scientist هاست

🧬

بیوتکنولوژی و دارو

Drug discovery، protein structure prediction (AlphaFold)، single-cell genomics و synthetic biology

🚗

خودرو خودران

Perception (segmentation، detection)، prediction (مدل‌سازی رفتار راننده)، planning با RL و imitation learning

💰

مالی و سرمایه‌گذاری

Alpha generation با ML، factor models، detection فعالیت غیرعادی و بازی‌سازی portfolio با RL

✈️

Defense و Aerospace

Sensor fusion، target tracking، autonomous systems — معمولاً با security clearance

🌍

Climate و Energy

Weather prediction (مثل GraphCast)، optimization grid، materials discovery برای batteries و solar

🤖

Robotics

Manipulation با RL، vision-language-action models، sim-to-real transfer و فاندیشن مدل‌های robotic

🏥

Healthcare AI

Medical imaging، EHR mining، clinical trial design با causal ML و personalized treatment

تصورات غلط رایج

قبل از تصمیم‌گیری، این باورهای اشتباه را بشناسید

بدون دکترا نمی‌توان ML Scientist شد

دکترا کمک بزرگی است اما الزامی نیست. شرکت‌هایی مثل OpenAI و Anthropic ML Scientist های بدون دکترا با track record قوی paper-publishing را استخدام می‌کنند. کلید، اثبات توانایی تحقیق با open source یا preprint است.

فقط در شرکت‌های frontier ML Scientist می‌توان بود

هزاران شرکت متوسط (Adobe، Spotify، Netflix، Snap، Roblox، بانک‌ها، بیمارستان‌ها) ML Scientist استخدام می‌کنند. حقوق پایین‌تر از OpenAI است اما هنوز در سطح Top 5٪ مشاغل tech.

ML Scientist فقط روی LLM کار می‌کند

LLM پر سر و صداترین حوزه است، اما recommender systems، CV، RL، speech، علوم پایه — همه فعال هستند. اگر فقط LLM را دنبال می‌کنید، شاید نقطه قوت‌تان را در حوزه‌ای کم‌تر شلوغ بیشتر نشان دهد.

Paper چاپ کردن یعنی توانایی Scientist بودن

بسیاری از paper ها reproducible نیستند یا کاربرد عملی ندارند. شرکت‌ها به دنبال کسی هستند که هم paper بنویسد و هم بتواند مدلش را به production برساند. Citations بدون code یا impact، در industry وزن کمی دارد.

این شغل از AI Engineer ساده‌تر است

برعکس. ML Scientist باید هم Engineer باشد (PyTorch، distributed training، ابزار)، هم Mathematician (statistical rigor)، هم Communicator (paper writing). bar ورود نسبتاً بالاتر است اما ceiling هم بسیار بالاتر.

یک روز کاری واقعی

در هر سطح روز کاری چه شکلی است؟

جونیور (۰–۲ سال)

بیشتر وقت در یادگیری و بازتولید کارهای دیگران. حدود ۷۰٪ کدنویسی و آزمایش، ۲۰٪ مطالعه paper، ۱۰٪ ارتباط با تیم.

  • صبح: ۱ ساعت paper reading قبل از standup
  • Standup ۱۵ دقیقه‌ای + بررسی نتایج آزمایش‌های شب گذشته در W&B
  • بلاک اول: اضافه کردن یک baseline جدید به repo و راه‌اندازی آزمایش روی cluster
  • بعد از ناهار: دیباگ یک issue عجیب در training (مثلاً NaN شدن loss)
  • عصر: pair programming با Senior Scientist روی پیاده‌سازی یک paper
  • پایان روز: launch کردن sweep شبانه روی hyperparameter ها

میانی (۲–۵ سال)

تعادل میان تعریف مسئله، آزمایش و ارتباط. ۴۰٪ آزمایش، ۲۵٪ تحلیل/نوشتن، ۲۰٪ collaboration و ۱۵٪ planning.

  • صبح: نوشتن experiment design doc برای فرضیه جدید
  • جلسه ۱:۱ با Senior Scientist برای feedback روی طرح
  • بلاک طولانی: پیاده‌سازی و launch آزمایش با Hydra config
  • ناهار با ML Engineer برای هماهنگی انتقال مدل قبلی به production
  • بعد از ناهار: تحلیل آماری نتایج آزمایش قبلی با scipy.stats
  • عصر: نوشتن بخش‌هایی از یک paper draft + خواندن ۲ paper مرتبط

ارشد (۵+ سال)

تمرکز روی research direction و mentoring. کدنویسی روزانه کم اما عمیق روی نقاط کلیدی. زمان زیاد برای planning و external impact.

  • صبح: review طرح پروژه ۳ scientist میانی + کامنت کتبی
  • جلسه با VP Research: ارائه ۲۰ دقیقه‌ای از progress فصلی و prioritization فصل بعد
  • بلاک کدنویسی هدفمند: پیاده‌سازی یک تکنیک کلیدی که فقط شما تجربه عمیق آن را دارید
  • ناهار با اساتید دانشگاه برای collaboration بالقوه
  • بعد از ناهار: review یک paper برای NeurIPS reviewing duty
  • عصر: نوشتن position paper داخلی درباره research strategy ۱۲ ماهه + 1:1 mentoring

مسئولیت‌ها و وظایف

مسئولیت‌های اصلی

وظایف روزانه و مهارت‌های مورد نیاز در این شغل

فنی
  • فرموله کردن سوالات تحقیقاتی روشن، آزمایش‌پذیر و مرتبط با محصول
  • طراحی آزمایش‌های با کنترل دقیق برای ارزیابی فرضیه‌های الگوریتمی
  • پیاده‌سازی مدل‌های پایه و معماری‌های جدید در PyTorch یا JAX
  • تحلیل آماری دقیق نتایج با confidence interval و significance test
  • خواندن و نقد paper های جدید روزانه و تبدیل آن‌ها به ایده‌های قابل آزمایش
مهارت نرم
  • نوشتن گزارش‌های فنی، preprint و در صورت امکان conference paper
  • ارائه نتایج به تیم product، engineering و گاهی executives
  • همکاری با ML Engineerها برای انتقال مدل از prototype به production

مهارت‌های مورد نیاز

مهارت‌های فنی، نرم و حوزه‌ای که یک دانشمند یادگیری ماشین موفق به آن‌ها نیاز دارد

مهارت‌های فنی

ریاضیات MLضروری

جبر خطی، حساب، احتمال و بهینه‌سازی در سطح کاربردی برای فهمیدن paper ها و طراحی الگوریتم

PyTorch / JAX advancedضروری

نوشتن custom loss، layer، dataloader و distributed training از صفر بدون نیاز به helper library

Deep Learning عمیقضروری

درک معماری‌های اصلی (CNN، RNN، Transformer)، attention، normalization و optimization

Experimental Designضروری

طراحی آزمایش با control، randomization و ablation studies — مهارت اصلی scientist بودن

Statistical Analysisضروری

Confidence intervals، hypothesis testing، multiple comparisons، effect size — نه فقط p-value

Paper Readingضروری

خواندن سریع و دقیق paper ها، استخراج contribution اصلی و نقد روش‌شناسی

Reproducibilityمهم

نوشتن کد قابل بازتولید با seed control، DVC، docker و گزارش دقیق محیط

Distributed Trainingمهم

آموزش مدل‌های large-scale با DDP، DeepSpeed، FSDP روی چندین node

حوزه تخصصی عمیقمهم

یکی از: NLP، CV، RL، Multimodal، Causal، Bayesian — انتخاب و عمق

CUDA / GPU intuitionمفید

درک حدود سرعت/حافظه GPU و توانایی شناسایی bottleneck در training

مهارت‌های نرم

Scientific Writingضروری

نوشتن paper، blog post و گزارش با وضوح بالا — برای industry هم به اندازه آکادمی مهم است

Critical Thinkingضروری

تشخیص ادعاهای پوچ در paper ها، تشخیص confound در آزمایش‌ها، اجتناب از hype

Communicating with PMsضروری

توضیح ساده محدودیت‌های ML به product manager و executive ها بدون نقشه‌برداری بیش از حد

Resilience to Failureضروری

۹۰٪ آزمایش‌های ML شکست می‌خورند — توانایی ادامه دادن بعد از یک ماه بی‌نتیجه‌گیری مهارت ذهنی کلیدی است

Mentoring & Peer Reviewمهم

feedback سازنده روی paper و کد دیگران، چه در تیم چه به‌عنوان reviewer در conferences

دانش حوزه‌ای

Causal Inferenceمهم

DAG ها، do-calculus، uplift modeling — مهارتی که هنوز در صنعت نادر است

Bayesian Methodsمفید

MCMC، variational inference، hierarchical models — مفید برای مسائل با عدم قطعیت بالا

AI Safetyمفید

Alignment، interpretability، evaluation — به‌خصوص برای کار با مدل‌های بزرگ

MLOpsمفید

حداقل آشنایی با pipeline و monitoring برای انتقال مدل به production

ضروری — بدون آن نمی‌توان وارد بازار کار شدمهم — تفاوت بین جونیور و میانیمفید — مزیت رقابتی

نقشه راه و مسیر آموزشی

نقشه راه تبدیل شدن به دانشمند یادگیری ماشین

این مسیر گام به گام شما را از صفر تا حرفه‌ای هدایت می‌کند.

1

پایه ریاضیات و آمار

⏱️ ۴ تا ۶ ماه

ML Science بدون پایه ریاضی قوی شدنی نیست. هدف این مرحله: درک شهودی + توانایی محاسبه، نه حفظ فرمول.

جبر خطی (eigenvalues, SVD)حساب چندمتغیرهاحتمال و آمار استنباطیبهینه‌سازی محدبنظریه اطلاعات (Shannon)Bayesian Thinking
2

ML کلاسیک و درک عمیق الگوریتم‌ها

⏱️ ۳ تا ۴ ماه

پیاده‌سازی الگوریتم‌های کلاسیک از صفر — نه فقط import کردن از sklearn. این مرحله intuition عمیق به شما می‌دهد که در سطح Engineer ندارید.

Linear/Logistic Regression از صفرSVM، Kernel MethodsDecision Trees و EnsemblesClustering (K-Means, GMM, DBSCAN)PCA, t-SNE, UMAPCross-Validation و Bias-Variance
3

یادگیری عمیق در عمق

⏱️ ۴ تا ۶ ماه

تسلط بر PyTorch، پیاده‌سازی معماری‌های اصلی از صفر، خواندن و بازتولید مقالات کلاسیک (AlexNet، ResNet، Transformer).

PyTorch advancedAutograd و Custom LayersCNN, RNN, LSTM, TransformerAttention MechanismRegularization پیشرفتهDistributed Training (DDP)Mixed Precision
4

تخصص و حوزه تحقیقاتی

⏱️ ۶ تا ۱۲ ماه

انتخاب یک حوزه (LLM، CV، RL، Causal، Bayesian) و عمق بسیار زیاد در آن. خواندن ۵۰+ مقاله، بازتولید ۳–۵ مقاله، شرکت در یک reading group.

خواندن paper روزانه (با کاغذ و قلم)بازتولید paper از کد و formulaآزمایش‌سازی منظم (Hydra، W&B)آماره دقیق (Confidence Intervals، Effect Size)ارائه کار به دیگرانهمکاری روی preprint
5

تولید Research با اثر — انتشار، open source، پروداکشن

⏱️ مداوم

نوشتن preprint روی arXiv، انتشار کد روی GitHub، ارائه در workshop ها، و تبدیل تحقیقات به مدل آماده production. این مرحله شما را از «کسی که paper می‌خواند» به «کسی که paper می‌نویسد» تبدیل می‌کند.

Scientific WritingOpen-Source MaintenanceReviewing Papers (NeurIPS/ICML)Production-Ready Research CodeCommunicating with PMs و EngineersEthics و Reproducibility

ابزارها و استک فنی

ابزارهایی که هر مهندس AI باید بشناسد، دسته‌بندی‌شده بر اساس اولویت

فریم‌ورک‌های تحقیقاتی

PyTorch

زبان غالب تحقیقات ML در ۲۰۲۵ — تقریباً تمام مقالات NeurIPS با آن نوشته می‌شوند

ضروری
JAX

فریم‌ورک Google با autodiff functional — انتخاب اول DeepMind و Anthropic

مفید
Hugging Face Transformers

ستون فقرات کار با LLMs و مدل‌های pretrained در تحقیقات

ضروری
PyTorch Lightning

لایه‌ای روی PyTorch برای کاهش boilerplate در تحقیقات

مفید

آزمایش‌سازی و reproducibility

Weights & Biases

استاندارد صنعتی tracking آزمایش، sweeps و reports تحقیقاتی

ضروری
Hydra

مدیریت کانفیگ آزمایش‌های ML توسعه‌یافته توسط Meta AI Research

مفید
MLflow

tracking آزمایش open-source، محبوب در شرکت‌های enterprise

مفید
DVC

Git برای دیتاست‌ها و مدل‌ها — ضروری برای reproducibility

مفید

محاسبات و زیرساخت

CUDA

زبان GPU computing — درک پایه‌ای برای optimize کردن training

مفید
Ray

محاسبات توزیع‌شده برای hyperparameter tuning و RL در مقیاس

مفید
SLURM / Kubernetes

ارکستراسیون job ها روی cluster — استاندارد آکادمیک و صنعتی

مفید
DeepSpeed / FSDP

آموزش مدل‌های بزرگ روی چندین GPU با memory optimization

پیشرفته

نوشتن و ارائه

LaTeX (Overleaf)

استاندارد نوشتن paper برای conferences

ضروری
matplotlib / seaborn

نمودارهای علمی برای paper و گزارش

ضروری
TikZ / draw.io

طراحی diagram های معماری مدل برای paper

مفید
arXiv

محل publish اولیه preprint — استاندارد ML community

ضروری
ضروری — باید یاد بگیریدمفید — ارزش یادگیری داردپیشرفته — برای سطوح ارشد

مسیر پیشرفت شغلی

از جونیور تا Staff Engineer — چه مهارت‌هایی نیاز دارید و چه درآمدی انتظار داشته باشید

Research Engineer جونیور / Research Resident

۰ تا ۲ سال

~$130K

میانگین سالانه (آمریکا)

پیاده‌سازی مقالات، کمک به Sr. Scientist در آزمایش‌ها، باز کردن کد و دیتاست، گرفتن intuition علمی

PyTorchPaper ReproductionStatisticsStrong MathCuriosity

ML Scientist میانی

۲ تا ۵ سال

~$200K

میانگین سالانه (آمریکا)

تعریف فرضیه‌های تحقیقاتی، طراحی آزمایش، نوشتن workshop paper یا conference paper، همکاری با تیم Engineering

Research DesignPaper WritingDomain SpecializationCross-functional

Senior / Staff ML Scientist

۵ تا ۸ سال

~$320K

میانگین سالانه (آمریکا)

رهبری یک خط تحقیقاتی، انتشار در venues اصلی (NeurIPS، ICML)، منتورینگ scientist های میانی، تأثیر روی product roadmap

Research VisionPublication Track RecordTech LeadershipIndustry Impact

Principal / Distinguished Scientist

۸+ سال

~$500K

میانگین سالانه (آمریکا)

تعریف research agenda شرکت، چاپ paper های با citation بالا، نمایندگی شرکت در community، جذب talent تحقیقاتی

Research AgendaThought LeadershipHiringExternal Influence

چالش‌ها و جنبه‌های منفی

واقعیت‌هایی که کمتر در آگهی‌های شغلی می‌بینید — قبل از ورود بدانید

نرخ بالای failure آزمایش‌ها

عمومی

حدود ۹۰٪ ایده‌های تحقیقاتی به نتیجه دلخواه نمی‌رسند. این برای engineer هایی که عادت دارند هر تسک کوچک را تمام کنند، خسته‌کننده است. ML Scientist باید بپذیرد که ۱۰ هفته کار ممکن است به paper تبدیل نشود و این طبیعی است.

فشار همزمان paper و product

شرکت بزرگ

Scientist های industry معمولاً KPI دوگانه دارند: انتشار paper برای reputation شرکت + impact روی محصول. این دو اغلب در تضادند — research خوب آهسته است، product سریع می‌خواهد. مدیریت expectations یک هنر است.

Compute به‌عنوان bottleneck

استارتاپ

اگر شرکت کوچک است، ممکن است فقط چند GPU داشته باشید — یعنی نمی‌توانید مثل OpenAI با ۱۰۰۰ GPU روی یک پروژه کار کنید. مهارت اصلی scientist های موفق این است که با compute محدود ایده‌های هوشمند بسازند.

تغییر سریع state-of-the-art

عمومی

تکنیکی که هفته پیش SOTA بود، این هفته توسط paper جدید از Google جا گذاشته می‌شود. ML Scientist باید همزمان روی کارش متمرکز باشد و یاد بگیرد paper های جدید را سریع filter کند. اگر هر paper شما را distract کند، هیچ‌وقت کارتان تمام نمی‌شود.

Reviewer Politics در conferences

تحقیقاتی

Peer review در ML شکسته است: reviewer ها ناآشنا، تصمیم‌گیری arbitrary، rebuttal کوتاه. paper های قوی گاهی reject می‌شوند و paper های ضعیف accept. باید پوست کلفت داشت و persistence نشان داد.

Career anxiety در عصر LLM

عمومی

بسیاری از زیرحوزه‌ها (مثل classical NLP، speech recognition) به دست LLM ها تحت‌الشعاع قرار گرفته‌اند. Scientist هایی که سال‌ها تخصص خاصی داشتند، الان مجبور به re-training هستند. مدیریت این تغییر روانی سخت است.

حقوق و بازار کار جهانی

حقوق جهانی دانشمند یادگیری ماشین

میانگین حقوق سالانه بر اساس تجربه در کشورهای مختلف

کشورمیانهارز
🇮🇳هند
₹6,000,000INR
🇦🇪امارات
AED 400,000AED
🇺🇸آمریکا
$360,000USD
🇨🇦کانادا
CA$250,000CAD
🇸🇬سنگاپور
SGD 230,000SGD
🇦🇺استرالیا
A$210,000AUD
🇨🇭سوئیس
CHF 200,000CHF
🇬🇧انگلستان
£160,000GBP
🇩🇪آلمان
€130,000EUR

* ارقام سالانه و تقریبی هستند و بر اساس میانگین بازار در سال ۲۰۲۵ محاسبه شده‌اند.

چگونه از صفر شروع کنیم

برنامه گام‌به‌گام برای ورود به مهندسی هوش مصنوعی

ماه ۱: تثبیت ریاضیات

مرور جدی جبر خطی، احتمال و آمار استنباطی با مثال ML. هدف: راحتی با expectation، variance، KL divergence.

ماه ۲: پیاده‌سازی ML کلاسیک از صفر

Linear/Logistic Regression، SVM، Decision Tree — همه را از صفر در NumPy بنویسید. درک عمیق‌تر از sklearn import کردن.

ماه ۳–۴: Deep Learning

Karpathy's Zero to Hero را تمام کنید. Transformer را از صفر در PyTorch پیاده کنید. روی WMT یا Tiny Shakespeare آموزش دهید.

ماه ۵: بازتولید یک paper

یک paper میانه را انتخاب کنید (مثلاً LoRA یا FlashAttention) و کد را از صفر بنویسید. نتایج را با paper مقایسه کنید.

ماه ۶: preprint و apply

بازتولید را به پروژه تحقیقاتی کوچک تبدیل کنید، روی arXiv بگذارید، در LinkedIn share کنید و apply کنید — Research Engineer یا Applied Scientist Resident.

پروژه‌های پیشنهادی برای رزومه

بازتولید paper کلاسیک (مثلاً Attention Is All You Need)

متوسط

Transformer را از صفر در PyTorch پیاده کنید بدون استفاده از nn.Transformer. روی WMT یا IWSLT آموزش دهید و BLEU را با paper اصلی مقایسه کنید.

PyTorchdatasetsBLEU evaluation
زمان تخمینی: ۴ هفته

بنچ‌مارک عمیق روی یک تکنیک

متوسط

یک ایده ساده (مثل dropout های مختلف) را در ۵ معماری مختلف و ۳ دیتاست آزمایش کنید. نمودارها و جدول‌های دقیق با confidence intervals تولید کنید. یک کاندیدای workshop paper.

PyTorchW&Bmatplotlibscipy.stats
زمان تخمینی: ۶ هفته

Fine-tuning پارامتر-کارا با تحلیل عمیق

پیشرفته

LoRA، QLoRA و DoRA را روی یک downstream task مقایسه کنید. علاوه بر accuracy، memory footprint و سرعت convergence را اندازه‌گیری کنید. preprint روی arXiv بگذارید.

PEFTTransformersbitsandbytesW&B
زمان تخمینی: ۸ هفته

Reinforcement Learning از صفر

پیشرفته

DQN و PPO را از صفر در PyTorch پیاده کنید و روی Atari/MuJoCo آموزش دهید. کد و نتایج را به دقت با baseline های Stable-Baselines3 مقایسه کنید.

PyTorchGymnasiumMuJoCoStable-Baselines3
زمان تخمینی: ۸ هفته

مطالعه جامع روی یک جنبه LLM

پیشرفته

یک سوال تحقیقاتی محدود انتخاب کنید (مثلاً «آیا quantization دقت few-shot را در LLaMA کاهش می‌دهد؟») و یک گزارش ۸ صفحه‌ای با آزمایش‌های دقیق بنویسید — قالب paper.

LLaMA / Mistrallm-evaluation-harnessbitsandbytesLaTeX
زمان تخمینی: ۱۰ هفته

مثال‌های واقعی و Case Studies

داستان‌های واقعی از مهندسانی که در این حوزه تأثیرگذار بوده‌اند

I

Ian Goodfellow

پیشینه

کارشناسی Stanford، کارشناسی ارشد Stanford، دکترا از Université de Montréal زیر نظر Yoshua Bengio. کار در Google Brain، OpenAI و سپس Apple به‌عنوان Director of Machine Learning. در ۲۰۲۲ به DeepMind پیوست به‌عنوان Research Scientist.

دستاورد

در ۲۰۱۴ Generative Adversarial Networks (GANs) را در یک paper تک‌نفره معرفی کرد — ایده‌ای که گفته می‌شود در یک بحث در یک بار با دوستانش جرقه زد. این paper تا ۲۰۲۵ بیش از ۸۰,۰۰۰ citation دارد و پایه نسل اول مدل‌های generative بود. همچنین کتاب «Deep Learning» را با Bengio و Courville نوشت که جزو معتبرترین مراجع است.

درس کلیدی

یک ایده درست می‌تواند کل صنعت را تغییر دهد. Goodfellow GAN ها را در ۲۸ سالگی منتشر کرد. مسیر شغلی او نشان می‌دهد که publication خوب در سن جوانی، در می‌توان بدون نیاز به Ivy League، با تلاش و curiosity به اوج رسید. همچنین مسیر آکادمی → industry → industry research مدل خوبی برای ML Scientist های با ذهن تحقیقاتی است.

F

Fei-Fei Li

پیشینه

متولد ۱۹۷۶ در پکن، مهاجرت به آمریکا در ۱۶ سالگی، کارشناسی فیزیک از Princeton، دکترا از Caltech. استاد Stanford و مدیر سابق Stanford AI Lab. در ۲۰۱۷–۲۰۱۸ Chief Scientist of AI/ML در Google Cloud. هم‌بنیان‌گذار AI4ALL برای تنوع در AI.

دستاورد

در ۲۰۰۹ پروژه ImageNet را راه‌اندازی کرد — دیتاستی با ۱۴ میلیون تصویر برچسب‌دار که چالش ImageNet Challenge را به وجود آورد. این challenge در ۲۰۱۲ منجر به موفقیت AlexNet شد و عملاً انقلاب deep learning را رقم زد. در ۲۰۲۴ World Labs را با ارزش‌گذاری بیش از ۱ میلیارد دلار تأسیس کرد — متمرکز بر spatial intelligence.

درس کلیدی

گاهی مهم‌ترین کار، نه ساخت یک الگوریتم بلکه ساخت یک منبع داده عمومی است که community را قادر می‌کند. Li روی ImageNet ۲.۵ سال کار کرد در شرایطی که اکثر همکارانش این کار را بی‌اهمیت می‌دانستند. تشخیص اهمیت زیربنا (نه فقط الگوریتم) و پیگیری ایده‌های long-term حتی در برابر شک، نشانه scientist واقعی است.

A

Andrew Ng

پیشینه

متولد ۱۹۷۶ در لندن، کارشناسی Carnegie Mellon، کارشناسی ارشد MIT، دکترا از Berkeley. استاد Stanford، هم‌بنیان‌گذار Google Brain (با Jeff Dean)، رئیس سابق Baidu AI Group، بنیان‌گذار Coursera و deeplearning.ai. کارآفرین سری در AI با Landing AI.

دستاورد

در ۲۰۱۱ کورس Machine Learning او در Coursera با ۱۰۰,۰۰۰ ثبت‌نام رکورد شکست و مفهوم MOOC را تثبیت کرد. در Google Brain روی مدل cat detection کار کرد که نشان داد neural networks در مقیاس کار می‌کنند. در deeplearning.ai هزاران مهندس را آموزش داد. ایده «AI is the new electricity» را به مفهوم رایج تبدیل کرد.

درس کلیدی

ترکیب تحقیق با آموزش می‌تواند بزرگ‌ترین multiplier impact باشد. Ng نه فقط paper چاپ کرد، بلکه چندین نسل از ML Scientist ها را آموزش داد. اگر می‌خواهید impact داشته باشید، نوشتن، ساختن کورس و توضیح ساده مفاهیم پیچیده — این‌ها به اندازه publication ارزشمندند.

نمونه آگهی استخدام واقعی + تحلیل

یک آگهی واقعی از شرکت فعال در حال استخدام، با تحلیل هر بخش

Research Engineer / Research Scientist, Frontier Red Team

Anthropicسان‌فرانسیسکو (حضوری) / لندن2025-04
مشاهده آگهی اصلی

تحلیل نیازمندی‌ها

EN

Strong background in machine learning, with significant research experience

Anthropic عمداً عنوان را Research Engineer/Scientist می‌گذارد تا spectrum وسیعی را پوشش دهد. «significant research experience» یعنی paper publishing track، یا تجربه عمیق در یک ML lab صنعتی (Google Brain، DeepMind، Meta AI و …). دکترا الزامی نیست اما track record باید قابل اثبات باشد.

ضروری
EN

Proficiency with Python and ML frameworks like PyTorch, JAX, or TensorFlow

Anthropic داخلاً عمدتاً JAX/Flax استفاده می‌کند، اما PyTorch هم پذیرفته است. مهم این است که بتوانید مدل‌های پیچیده را خودتان از صفر بسازید، نه فقط fine-tune کنید. بسیاری از مصاحبه‌های Anthropic شامل پیاده‌سازی یک معماری ساده از صفر در 90 دقیقه است.

ضروری
EN

Experience designing and evaluating capabilities of large language models

این موقعیت روی red-teaming و evaluation تمرکز دارد. باید بدانید چطور capabilities را با benchmarks دقیق ارزیابی کنید. کار قبلی روی elicitation، few-shot evaluation یا adversarial testing مزیت بزرگ است.

ضروری
EN

Strong written and verbal communication skills for research dissemination

Anthropic بسیار به نوشتن اهمیت می‌دهد. Constitutional AI، Sleeper Agents، Sparse Autoencoders — همه با blog post های دقیق و paper های مفصل منتشر شدند. شما در مصاحبه احتمالاً نمونه نوشته‌ای ارائه می‌دهید.

ضروری
EN

Background in cybersecurity, bioweapons, or other dual-use risk areas (for Frontier Red Team specifically)

این تیم خاص (Frontier Red Team) به دنبال people با domain expertise خارج از ML کلاسیک است. اگر شما PhD biology + PyTorch می‌دانید، شانس‌تان بسیار بیشتر از Pure ML researcher است.

مهم
EN

Comfort working with sensitive content and difficult ethical questions

Red teaming یعنی شما عمداً مدل را وادار می‌کنید چیزهای خطرناک تولید کند تا ضعف‌هایش را شناسایی کنید. این کار از نظر روانی سخت است. Anthropic در مصاحبه این موضوع را به دقت بررسی می‌کند.

مهم

تحلیل مسئولیت‌ها

EN

Design and execute capability evaluations on frontier models

طراحی benchmark های جدید برای اندازه‌گیری قابلیت‌های مدل (به‌خصوص در دامنه‌های خطرناک). این یعنی تخصص هم در ML evaluation داشته باشید و هم در domain خاص (مثلاً bioweapons threat modeling).

EN

Develop adversarial techniques to elicit model behaviors

روش‌های جدید برای jailbreaking یا elicit کردن قابلیت‌های مخفی مدل. این بخش هم art است هم science — نیاز به creativity فراوان دارد.

EN

Collaborate with policy teams to translate findings into safety frameworks

Frontier Red Team به‌طور مستقیم با Responsible Scaling Policy تیم همکاری می‌کند. شما باید قادر باشید نتایج فنی را به زبان policy ترجمه کنید.

EN

Publish results when appropriate to advance the field's understanding of AI risks

Anthropic معمولاً نتایج red team را publish می‌کند (مثل sleeper agents paper). شما در نوشتن این paper ها مشارکت خواهید کرد — همان مهارت‌های Scientific Writing.

نتیجه‌گیری کلی

این نقش نشان می‌دهد که در ۲۰۲۵، شرکت‌های frontier AI به دنبال «T-shaped scientist» هستند: عمق در یک حوزه + breadth در ML + توانایی writing. اگر نقطه قوت‌تان فقط ML است، با چند نفر در یک حوزه domain (security، bio، economics) همکاری کنید تا T-shape را بسازید. Anthropic معمولاً compensation عالی پیشنهاد می‌کند ($350K-$700K total comp) اما مصاحبه‌اش از سخت‌ترین در صنعت است.

آینده و روندها

پیش‌بینی ۵–۱۰ ساله و مهارت‌هایی که باید یاد بگیرید

رشد ۲۶٪ سالانه برای نقش Computer & Information Research Scientist تا ۲۰۳۲ — یکی از سریع‌ترین رشدها در آمار رسمی BLS

منبع: U.S. Bureau of Labor Statistics 2024–2034 Outlook + LinkedIn Top Jobs 2025 Report

مهارت‌های نوظهور که باید یاد بگیرید

Foundation Model Pre-training و Continual LearningAlignment و Interpretability (Mechanistic Interp)Multimodal و Embodied AIReasoning و Tool-Use در مدل‌های زبانیEvaluation Science (beyond benchmarks)AI for Science (biology، chemistry، materials)

پیش‌بینی‌های آینده

2026

تخصص Mechanistic Interpretability از حاشیه به mainstream می‌آید — هر تیم frontier حداقل یک interp scientist استخدام می‌کند

2027

AI for Science (به‌خصوص biology) به یکی از بزرگ‌ترین زیرحوزه‌های جذب ML Scientist تبدیل می‌شود — به دنبال AlphaFold momentum

2028

تفاوت میان «ML Scientist» و «AI Engineer» محو می‌شود — همه به سمت hybrid role حرکت می‌کنند که هم paper بنویسد و هم production code

2030

ML Scientist های با تخصص evaluation و safety، حقوق و prestige برابر با مدل‌سازان frontier پیدا می‌کنند — به دلیل اولویت regulatory

ریسک‌های واقعی

تمرکز بازار: شرکت‌های frontier (OpenAI، Anthropic، Google، Meta، xAI) ۸۰٪ بهترین ML Scientist ها را جذب می‌کنند. این یعنی شرکت‌های متوسط نمی‌توانند با حقوق رقابت کنند و گاهی کیفیت تحقیقاتشان پایین می‌آید. خطر دیگر: commoditization تخصص LLM — هرچه ابزارها و pretrained models بیشتر می‌شوند، نقش Scientist هایی که فقط fine-tuning می‌کنند تحت فشار قرار می‌گیرد. Scientist هایی که سراغ مرزهای جدید (RL، multimodal، AI for science) می‌روند، آینده‌شان امن‌تر است.

ویدیوهای آموزشی

برای راهنمایی شخصی‌سازی‌شده مشاوره بگیرید