دانشمند یادگیری ماشین
Machine Learning Scientist
دانشمند یادگیری ماشین متخصصی است که بین تحقیق آکادمیک و مهندسی محصول قرار دارد. این فرد الگوریتمهای جدید طراحی میکند، مقالات علمی میخواند و مینویسد، آزمایشهای دقیق برای اثبات فرضیهها اجرا میکند و نتایج تحقیقاتی را به مدلهای قابل استفاده در محصول تبدیل میکند. در عصر مدلهای پایه، ML Scientist یکی از کلیدیترین نقشها در شرکتهایی است که نمیخواهند صرفاً مصرفکننده API های OpenAI باشند، بلکه قصد دارند مزیت رقابتی الگوریتمی بسازند.
مقدمه و تعریف شغل
دانشمند یادگیری ماشین (ML Scientist) متخصصی است که در تقاطع تحقیق و کاربرد قرار دارد. برخلاف AI Researcher که عمدتاً paper چاپ میکند و برخلاف ML Engineer که مدلهای آماده را در پروداکشن میبرد، ML Scientist یک «hybrid» است: paper میخواند، فرضیه میسازد، آزمایش میکند، اما هدفش حل مسائل تجاری شرکت است نه فقط مقاله. در شرکتهای بزرگ، این نقش گاهی Applied Scientist یا Research Engineer نامیده میشود.
این نقش با اقتصاد شرکتهای AI به سرعت تکامل یافته است. در ۲۰۱۵، فقط Google، Facebook، Microsoft و کمی DeepMind، تیمهای جدی ML Scientist داشتند. در ۲۰۲۵، تقریباً هر شرکت با ارزش بالای ۱ میلیارد دلار و فعالیت در AI، حداقل چند ML Scientist دارد. حقوق در شرکتهای frontier (OpenAI، Anthropic، Google DeepMind) برای Senior Scientist ها به ۸۰۰,۰۰۰ تا ۱.۲ میلیون دلار رسیده، در حالی که در شرکتهای متوسط ۲۵۰–۴۰۰ هزار دلار رایج است. بازار بهشدت رقابتی است: شرکتها برای پروفایلهای قوی paper-publishing رقابت میکنند و طبق گزارشهای صنعتی، نرخ retention ML Scientist ها در شرکتهای بزرگ یکی از پایینترینها در tech است.
چه چیزی میسازید؟
مثالهای واقعی از خروجی کار یک دانشمند یادگیری ماشین
مدلهای پایه اختصاصی برای دامنه شرکت
یک شرکت bioinformatics میخواهد مدل foundation مخصوص پروتئین داشته باشد. شما معماری را طراحی میکنید، ۸۰۰GB داده ساختاری را تمیز میکنید و روی ۶۴ A100 برای ۳ هفته آموزش میدهید.
Recommender Systems نسل جدید
YouTube میخواهد توصیهگرش بهتر شود. شما یک معماری two-tower با retrieval embedding ها طراحی میکنید، A/B test روی ۵٪ ترافیک میگذارید و watch time را ۲٪ بالا میبرید — معادل صدها میلیون دلار.
تکنیکهای Fine-tuning کارآمد
شرکت حقوقی نمیتواند کل GPT-4 را fine-tune کند. شما LoRA + RAG hybrid طراحی میکنید که با ۰.۱٪ پارامتر، عملکرد مدل را روی domain حقوقی ۱۸٪ بهبود میدهد.
Causal Inference در سطح محصول
تیم محصول میگوید «این feature engagement را ۱۲٪ بالا برد». شما با causal analysis نشان میدهید که در واقع ۳٪ علتمند است و بقیه selection bias بوده — تصمیم استراتژیک تغییر میکند.
Reinforcement Learning برای مسائل واقعی
یک شرکت energy میخواهد مصرف datacenter ها را کاهش دهد. شما با RL policy ای طراحی میکنید که cooling system را بهطور پویا تنظیم میکند و ۲۰٪ مصرف انرژی را کم میکند (دقیقاً همان کاری که DeepMind برای Google کرد).
ارزیابی و Benchmarking مدلها
قبل از publish یک LLM داخلی، شما یک سوئیت ارزیابی کامل میسازید که شامل safety، bias، factuality و reasoning است. این بخش از کار به اندازه ساخت مدل ارزشمند است.
تخصصهای مختلف دانشمند یادگیری ماشین
این شغل یک عنوان واحد نیست — مسیرهای تخصصی متعددی دارد
محقق مدلهای زبانی بزرگ
LLM Researcher
تخصص در pre-training، fine-tuning، alignment و capabilities مدلهای بزرگ. پرتقاضاترین تخصص ۲۰۲۵.
دانشمند بینایی ماشین
Computer Vision Scientist
تمرکز روی image/video models، multimodal، generative vision. حوزهای با کاربردهای deep در autonomous driving، medical imaging و AR/VR.
دانشمند یادگیری تقویتی
Reinforcement Learning Scientist
RL کلاسیک، RLHF، multi-agent. کاربرد در games، robotics، optimization و recently، alignment مدلهای زبانی.
دانشمند ML علیتی
Causal ML Scientist
تخصص نادر و پرارزش در tech: استفاده از causal inference در محصول، uplift modeling و counterfactual reasoning.
ML برای علوم
ML for Science
کاربرد ML در biology، chemistry، physics. نمونه: AlphaFold. مسیری بین industry و آکادمی با impact عمیق.
تفاوت با شغلهای مشابه
کجا این شغل تمام میشود و شغل دیگری شروع میشود؟
ML Engineer روی استقرار و scaling تمرکز دارد — مدل را در production نگه میدارد، latency را بهینه میکند، monitoring میسازد. ML Scientist روی ساخت الگوریتم بهتر تمرکز دارد — فرضیه، آزمایش، paper. هر دو PyTorch مینویسند، اما با هدف متفاوت. شرکتهای موفق هر دو را در یک تیم نگه میدارند.
AI Researcher (بهخصوص در labs مثل OpenAI یا DeepMind) primarily paper چاپ میکند و اولویت شخصیاش science است. ML Scientist در شرکتها معمولاً اولویت محصول دارد — paper هم بنویسد، ولی مدل باید به production برسد. مرز بین این دو در شرکتهای frontier محو است.
Data Scientist عمدتاً روی تحلیل و bizness insight کار میکند: SQL، dashboard، A/B test ساده. ML Scientist روی الگوریتم و مدل کار میکند: PyTorch، paper، training. در شرکتهای کوچک گاهی یک نفر هر دو نقش را دارد، اما در ۲۰۲۵ این دو مسیر شغلی بهطور قابل توجهی از هم جدا شدهاند.
Applied Scientist عنوانی است که آمازون (و حالا بقیه) به ML Scientist هایی میدهد که روی محصولات کار میکنند. عملاً معادل ML Scientist است، فقط با تأکید بیشتر روی tangible business impact. مصاحبهاش هم ML اما هم coding است.
تأثیر در صنایع مختلف
دانشمند یادگیری ماشین در همه صنایع مشغول به کار است — نه فقط شرکتهای فناوری
Big Tech
ساخت recommender systems، search ranking، speech recognition و حالا LLM ها — جایی که بیشترین ROI ML Scientist هاست
بیوتکنولوژی و دارو
Drug discovery، protein structure prediction (AlphaFold)، single-cell genomics و synthetic biology
خودرو خودران
Perception (segmentation، detection)، prediction (مدلسازی رفتار راننده)، planning با RL و imitation learning
مالی و سرمایهگذاری
Alpha generation با ML، factor models، detection فعالیت غیرعادی و بازیسازی portfolio با RL
Defense و Aerospace
Sensor fusion، target tracking، autonomous systems — معمولاً با security clearance
Climate و Energy
Weather prediction (مثل GraphCast)، optimization grid، materials discovery برای batteries و solar
Robotics
Manipulation با RL، vision-language-action models، sim-to-real transfer و فاندیشن مدلهای robotic
Healthcare AI
Medical imaging، EHR mining، clinical trial design با causal ML و personalized treatment
تصورات غلط رایج
قبل از تصمیمگیری، این باورهای اشتباه را بشناسید
بدون دکترا نمیتوان ML Scientist شد
دکترا کمک بزرگی است اما الزامی نیست. شرکتهایی مثل OpenAI و Anthropic ML Scientist های بدون دکترا با track record قوی paper-publishing را استخدام میکنند. کلید، اثبات توانایی تحقیق با open source یا preprint است.
فقط در شرکتهای frontier ML Scientist میتوان بود
هزاران شرکت متوسط (Adobe، Spotify، Netflix، Snap، Roblox، بانکها، بیمارستانها) ML Scientist استخدام میکنند. حقوق پایینتر از OpenAI است اما هنوز در سطح Top 5٪ مشاغل tech.
ML Scientist فقط روی LLM کار میکند
LLM پر سر و صداترین حوزه است، اما recommender systems، CV، RL، speech، علوم پایه — همه فعال هستند. اگر فقط LLM را دنبال میکنید، شاید نقطه قوتتان را در حوزهای کمتر شلوغ بیشتر نشان دهد.
Paper چاپ کردن یعنی توانایی Scientist بودن
بسیاری از paper ها reproducible نیستند یا کاربرد عملی ندارند. شرکتها به دنبال کسی هستند که هم paper بنویسد و هم بتواند مدلش را به production برساند. Citations بدون code یا impact، در industry وزن کمی دارد.
این شغل از AI Engineer سادهتر است
برعکس. ML Scientist باید هم Engineer باشد (PyTorch، distributed training، ابزار)، هم Mathematician (statistical rigor)، هم Communicator (paper writing). bar ورود نسبتاً بالاتر است اما ceiling هم بسیار بالاتر.
یک روز کاری واقعی
در هر سطح روز کاری چه شکلی است؟
جونیور (۰–۲ سال)
بیشتر وقت در یادگیری و بازتولید کارهای دیگران. حدود ۷۰٪ کدنویسی و آزمایش، ۲۰٪ مطالعه paper، ۱۰٪ ارتباط با تیم.
- ◆صبح: ۱ ساعت paper reading قبل از standup
- ◆Standup ۱۵ دقیقهای + بررسی نتایج آزمایشهای شب گذشته در W&B
- ◆بلاک اول: اضافه کردن یک baseline جدید به repo و راهاندازی آزمایش روی cluster
- ◆بعد از ناهار: دیباگ یک issue عجیب در training (مثلاً NaN شدن loss)
- ◆عصر: pair programming با Senior Scientist روی پیادهسازی یک paper
- ◆پایان روز: launch کردن sweep شبانه روی hyperparameter ها
میانی (۲–۵ سال)
تعادل میان تعریف مسئله، آزمایش و ارتباط. ۴۰٪ آزمایش، ۲۵٪ تحلیل/نوشتن، ۲۰٪ collaboration و ۱۵٪ planning.
- ◆صبح: نوشتن experiment design doc برای فرضیه جدید
- ◆جلسه ۱:۱ با Senior Scientist برای feedback روی طرح
- ◆بلاک طولانی: پیادهسازی و launch آزمایش با Hydra config
- ◆ناهار با ML Engineer برای هماهنگی انتقال مدل قبلی به production
- ◆بعد از ناهار: تحلیل آماری نتایج آزمایش قبلی با scipy.stats
- ◆عصر: نوشتن بخشهایی از یک paper draft + خواندن ۲ paper مرتبط
ارشد (۵+ سال)
تمرکز روی research direction و mentoring. کدنویسی روزانه کم اما عمیق روی نقاط کلیدی. زمان زیاد برای planning و external impact.
- ◆صبح: review طرح پروژه ۳ scientist میانی + کامنت کتبی
- ◆جلسه با VP Research: ارائه ۲۰ دقیقهای از progress فصلی و prioritization فصل بعد
- ◆بلاک کدنویسی هدفمند: پیادهسازی یک تکنیک کلیدی که فقط شما تجربه عمیق آن را دارید
- ◆ناهار با اساتید دانشگاه برای collaboration بالقوه
- ◆بعد از ناهار: review یک paper برای NeurIPS reviewing duty
- ◆عصر: نوشتن position paper داخلی درباره research strategy ۱۲ ماهه + 1:1 mentoring
مسئولیتها و وظایف
مسئولیتهای اصلی
وظایف روزانه و مهارتهای مورد نیاز در این شغل
- ◈فرموله کردن سوالات تحقیقاتی روشن، آزمایشپذیر و مرتبط با محصول
- ◈طراحی آزمایشهای با کنترل دقیق برای ارزیابی فرضیههای الگوریتمی
- ◈پیادهسازی مدلهای پایه و معماریهای جدید در PyTorch یا JAX
- ◈تحلیل آماری دقیق نتایج با confidence interval و significance test
- ◈خواندن و نقد paper های جدید روزانه و تبدیل آنها به ایدههای قابل آزمایش
- ◈نوشتن گزارشهای فنی، preprint و در صورت امکان conference paper
- ◈ارائه نتایج به تیم product، engineering و گاهی executives
- ◈همکاری با ML Engineerها برای انتقال مدل از prototype به production
مهارتهای مورد نیاز
مهارتهای فنی، نرم و حوزهای که یک دانشمند یادگیری ماشین موفق به آنها نیاز دارد
مهارتهای فنی
جبر خطی، حساب، احتمال و بهینهسازی در سطح کاربردی برای فهمیدن paper ها و طراحی الگوریتم
نوشتن custom loss، layer، dataloader و distributed training از صفر بدون نیاز به helper library
درک معماریهای اصلی (CNN، RNN، Transformer)، attention، normalization و optimization
طراحی آزمایش با control، randomization و ablation studies — مهارت اصلی scientist بودن
Confidence intervals، hypothesis testing، multiple comparisons، effect size — نه فقط p-value
خواندن سریع و دقیق paper ها، استخراج contribution اصلی و نقد روششناسی
نوشتن کد قابل بازتولید با seed control، DVC، docker و گزارش دقیق محیط
آموزش مدلهای large-scale با DDP، DeepSpeed، FSDP روی چندین node
یکی از: NLP، CV، RL، Multimodal، Causal، Bayesian — انتخاب و عمق
درک حدود سرعت/حافظه GPU و توانایی شناسایی bottleneck در training
مهارتهای نرم
نوشتن paper، blog post و گزارش با وضوح بالا — برای industry هم به اندازه آکادمی مهم است
تشخیص ادعاهای پوچ در paper ها، تشخیص confound در آزمایشها، اجتناب از hype
توضیح ساده محدودیتهای ML به product manager و executive ها بدون نقشهبرداری بیش از حد
۹۰٪ آزمایشهای ML شکست میخورند — توانایی ادامه دادن بعد از یک ماه بینتیجهگیری مهارت ذهنی کلیدی است
feedback سازنده روی paper و کد دیگران، چه در تیم چه بهعنوان reviewer در conferences
دانش حوزهای
DAG ها، do-calculus، uplift modeling — مهارتی که هنوز در صنعت نادر است
MCMC، variational inference، hierarchical models — مفید برای مسائل با عدم قطعیت بالا
Alignment، interpretability، evaluation — بهخصوص برای کار با مدلهای بزرگ
حداقل آشنایی با pipeline و monitoring برای انتقال مدل به production
نقشه راه و مسیر آموزشی
نقشه راه تبدیل شدن به دانشمند یادگیری ماشین
این مسیر گام به گام شما را از صفر تا حرفهای هدایت میکند.
پایه ریاضیات و آمار
ML Science بدون پایه ریاضی قوی شدنی نیست. هدف این مرحله: درک شهودی + توانایی محاسبه، نه حفظ فرمول.
ML کلاسیک و درک عمیق الگوریتمها
پیادهسازی الگوریتمهای کلاسیک از صفر — نه فقط import کردن از sklearn. این مرحله intuition عمیق به شما میدهد که در سطح Engineer ندارید.
یادگیری عمیق در عمق
تسلط بر PyTorch، پیادهسازی معماریهای اصلی از صفر، خواندن و بازتولید مقالات کلاسیک (AlexNet، ResNet، Transformer).
تخصص و حوزه تحقیقاتی
انتخاب یک حوزه (LLM، CV، RL، Causal، Bayesian) و عمق بسیار زیاد در آن. خواندن ۵۰+ مقاله، بازتولید ۳–۵ مقاله، شرکت در یک reading group.
تولید Research با اثر — انتشار، open source، پروداکشن
نوشتن preprint روی arXiv، انتشار کد روی GitHub، ارائه در workshop ها، و تبدیل تحقیقات به مدل آماده production. این مرحله شما را از «کسی که paper میخواند» به «کسی که paper مینویسد» تبدیل میکند.
ابزارها و استک فنی
ابزارهایی که هر مهندس AI باید بشناسد، دستهبندیشده بر اساس اولویت
فریمورکهای تحقیقاتی
آزمایشسازی و reproducibility
محاسبات و زیرساخت
مسیر پیشرفت شغلی
از جونیور تا Staff Engineer — چه مهارتهایی نیاز دارید و چه درآمدی انتظار داشته باشید
Research Engineer جونیور / Research Resident
۰ تا ۲ سال
~$130K
میانگین سالانه (آمریکا)
پیادهسازی مقالات، کمک به Sr. Scientist در آزمایشها، باز کردن کد و دیتاست، گرفتن intuition علمی
ML Scientist میانی
۲ تا ۵ سال
~$200K
میانگین سالانه (آمریکا)
تعریف فرضیههای تحقیقاتی، طراحی آزمایش، نوشتن workshop paper یا conference paper، همکاری با تیم Engineering
Senior / Staff ML Scientist
۵ تا ۸ سال
~$320K
میانگین سالانه (آمریکا)
رهبری یک خط تحقیقاتی، انتشار در venues اصلی (NeurIPS، ICML)، منتورینگ scientist های میانی، تأثیر روی product roadmap
Principal / Distinguished Scientist
۸+ سال
~$500K
میانگین سالانه (آمریکا)
تعریف research agenda شرکت، چاپ paper های با citation بالا، نمایندگی شرکت در community، جذب talent تحقیقاتی
چالشها و جنبههای منفی
واقعیتهایی که کمتر در آگهیهای شغلی میبینید — قبل از ورود بدانید
نرخ بالای failure آزمایشها
عمومیحدود ۹۰٪ ایدههای تحقیقاتی به نتیجه دلخواه نمیرسند. این برای engineer هایی که عادت دارند هر تسک کوچک را تمام کنند، خستهکننده است. ML Scientist باید بپذیرد که ۱۰ هفته کار ممکن است به paper تبدیل نشود و این طبیعی است.
فشار همزمان paper و product
شرکت بزرگScientist های industry معمولاً KPI دوگانه دارند: انتشار paper برای reputation شرکت + impact روی محصول. این دو اغلب در تضادند — research خوب آهسته است، product سریع میخواهد. مدیریت expectations یک هنر است.
Compute بهعنوان bottleneck
استارتاپاگر شرکت کوچک است، ممکن است فقط چند GPU داشته باشید — یعنی نمیتوانید مثل OpenAI با ۱۰۰۰ GPU روی یک پروژه کار کنید. مهارت اصلی scientist های موفق این است که با compute محدود ایدههای هوشمند بسازند.
تغییر سریع state-of-the-art
عمومیتکنیکی که هفته پیش SOTA بود، این هفته توسط paper جدید از Google جا گذاشته میشود. ML Scientist باید همزمان روی کارش متمرکز باشد و یاد بگیرد paper های جدید را سریع filter کند. اگر هر paper شما را distract کند، هیچوقت کارتان تمام نمیشود.
Reviewer Politics در conferences
تحقیقاتیPeer review در ML شکسته است: reviewer ها ناآشنا، تصمیمگیری arbitrary، rebuttal کوتاه. paper های قوی گاهی reject میشوند و paper های ضعیف accept. باید پوست کلفت داشت و persistence نشان داد.
Career anxiety در عصر LLM
عمومیبسیاری از زیرحوزهها (مثل classical NLP، speech recognition) به دست LLM ها تحتالشعاع قرار گرفتهاند. Scientist هایی که سالها تخصص خاصی داشتند، الان مجبور به re-training هستند. مدیریت این تغییر روانی سخت است.
حقوق و بازار کار جهانی
حقوق جهانی دانشمند یادگیری ماشین
میانگین حقوق سالانه بر اساس تجربه در کشورهای مختلف
| کشور | میانه | ارز |
|---|---|---|
🇮🇳هند | ₹6,000,000 | INR |
🇦🇪امارات | AED 400,000 | AED |
🇺🇸آمریکا | $360,000 | USD |
🇨🇦کانادا | CA$250,000 | CAD |
🇸🇬سنگاپور | SGD 230,000 | SGD |
🇦🇺استرالیا | A$210,000 | AUD |
🇨🇭سوئیس | CHF 200,000 | CHF |
🇬🇧انگلستان | £160,000 | GBP |
🇩🇪آلمان | €130,000 | EUR |
* ارقام سالانه و تقریبی هستند و بر اساس میانگین بازار در سال ۲۰۲۵ محاسبه شدهاند.
چگونه از صفر شروع کنیم
برنامه گامبهگام برای ورود به مهندسی هوش مصنوعی
ماه ۱: تثبیت ریاضیات
مرور جدی جبر خطی، احتمال و آمار استنباطی با مثال ML. هدف: راحتی با expectation، variance، KL divergence.
ماه ۲: پیادهسازی ML کلاسیک از صفر
Linear/Logistic Regression، SVM، Decision Tree — همه را از صفر در NumPy بنویسید. درک عمیقتر از sklearn import کردن.
ماه ۳–۴: Deep Learning
Karpathy's Zero to Hero را تمام کنید. Transformer را از صفر در PyTorch پیاده کنید. روی WMT یا Tiny Shakespeare آموزش دهید.
ماه ۵: بازتولید یک paper
یک paper میانه را انتخاب کنید (مثلاً LoRA یا FlashAttention) و کد را از صفر بنویسید. نتایج را با paper مقایسه کنید.
ماه ۶: preprint و apply
بازتولید را به پروژه تحقیقاتی کوچک تبدیل کنید، روی arXiv بگذارید، در LinkedIn share کنید و apply کنید — Research Engineer یا Applied Scientist Resident.
پروژههای پیشنهادی برای رزومه
بازتولید paper کلاسیک (مثلاً Attention Is All You Need)
متوسطTransformer را از صفر در PyTorch پیاده کنید بدون استفاده از nn.Transformer. روی WMT یا IWSLT آموزش دهید و BLEU را با paper اصلی مقایسه کنید.
بنچمارک عمیق روی یک تکنیک
متوسطیک ایده ساده (مثل dropout های مختلف) را در ۵ معماری مختلف و ۳ دیتاست آزمایش کنید. نمودارها و جدولهای دقیق با confidence intervals تولید کنید. یک کاندیدای workshop paper.
Fine-tuning پارامتر-کارا با تحلیل عمیق
پیشرفتهLoRA، QLoRA و DoRA را روی یک downstream task مقایسه کنید. علاوه بر accuracy، memory footprint و سرعت convergence را اندازهگیری کنید. preprint روی arXiv بگذارید.
Reinforcement Learning از صفر
پیشرفتهDQN و PPO را از صفر در PyTorch پیاده کنید و روی Atari/MuJoCo آموزش دهید. کد و نتایج را به دقت با baseline های Stable-Baselines3 مقایسه کنید.
مطالعه جامع روی یک جنبه LLM
پیشرفتهیک سوال تحقیقاتی محدود انتخاب کنید (مثلاً «آیا quantization دقت few-shot را در LLaMA کاهش میدهد؟») و یک گزارش ۸ صفحهای با آزمایشهای دقیق بنویسید — قالب paper.
مثالهای واقعی و Case Studies
داستانهای واقعی از مهندسانی که در این حوزه تأثیرگذار بودهاند
کارشناسی Stanford، کارشناسی ارشد Stanford، دکترا از Université de Montréal زیر نظر Yoshua Bengio. کار در Google Brain، OpenAI و سپس Apple بهعنوان Director of Machine Learning. در ۲۰۲۲ به DeepMind پیوست بهعنوان Research Scientist.
در ۲۰۱۴ Generative Adversarial Networks (GANs) را در یک paper تکنفره معرفی کرد — ایدهای که گفته میشود در یک بحث در یک بار با دوستانش جرقه زد. این paper تا ۲۰۲۵ بیش از ۸۰,۰۰۰ citation دارد و پایه نسل اول مدلهای generative بود. همچنین کتاب «Deep Learning» را با Bengio و Courville نوشت که جزو معتبرترین مراجع است.
یک ایده درست میتواند کل صنعت را تغییر دهد. Goodfellow GAN ها را در ۲۸ سالگی منتشر کرد. مسیر شغلی او نشان میدهد که publication خوب در سن جوانی، در میتوان بدون نیاز به Ivy League، با تلاش و curiosity به اوج رسید. همچنین مسیر آکادمی → industry → industry research مدل خوبی برای ML Scientist های با ذهن تحقیقاتی است.
متولد ۱۹۷۶ در پکن، مهاجرت به آمریکا در ۱۶ سالگی، کارشناسی فیزیک از Princeton، دکترا از Caltech. استاد Stanford و مدیر سابق Stanford AI Lab. در ۲۰۱۷–۲۰۱۸ Chief Scientist of AI/ML در Google Cloud. همبنیانگذار AI4ALL برای تنوع در AI.
در ۲۰۰۹ پروژه ImageNet را راهاندازی کرد — دیتاستی با ۱۴ میلیون تصویر برچسبدار که چالش ImageNet Challenge را به وجود آورد. این challenge در ۲۰۱۲ منجر به موفقیت AlexNet شد و عملاً انقلاب deep learning را رقم زد. در ۲۰۲۴ World Labs را با ارزشگذاری بیش از ۱ میلیارد دلار تأسیس کرد — متمرکز بر spatial intelligence.
گاهی مهمترین کار، نه ساخت یک الگوریتم بلکه ساخت یک منبع داده عمومی است که community را قادر میکند. Li روی ImageNet ۲.۵ سال کار کرد در شرایطی که اکثر همکارانش این کار را بیاهمیت میدانستند. تشخیص اهمیت زیربنا (نه فقط الگوریتم) و پیگیری ایدههای long-term حتی در برابر شک، نشانه scientist واقعی است.
متولد ۱۹۷۶ در لندن، کارشناسی Carnegie Mellon، کارشناسی ارشد MIT، دکترا از Berkeley. استاد Stanford، همبنیانگذار Google Brain (با Jeff Dean)، رئیس سابق Baidu AI Group، بنیانگذار Coursera و deeplearning.ai. کارآفرین سری در AI با Landing AI.
در ۲۰۱۱ کورس Machine Learning او در Coursera با ۱۰۰,۰۰۰ ثبتنام رکورد شکست و مفهوم MOOC را تثبیت کرد. در Google Brain روی مدل cat detection کار کرد که نشان داد neural networks در مقیاس کار میکنند. در deeplearning.ai هزاران مهندس را آموزش داد. ایده «AI is the new electricity» را به مفهوم رایج تبدیل کرد.
ترکیب تحقیق با آموزش میتواند بزرگترین multiplier impact باشد. Ng نه فقط paper چاپ کرد، بلکه چندین نسل از ML Scientist ها را آموزش داد. اگر میخواهید impact داشته باشید، نوشتن، ساختن کورس و توضیح ساده مفاهیم پیچیده — اینها به اندازه publication ارزشمندند.
نمونه آگهی استخدام واقعی + تحلیل
یک آگهی واقعی از شرکت فعال در حال استخدام، با تحلیل هر بخش
Research Engineer / Research Scientist, Frontier Red Team
تحلیل نیازمندیها
Strong background in machine learning, with significant research experience
Anthropic عمداً عنوان را Research Engineer/Scientist میگذارد تا spectrum وسیعی را پوشش دهد. «significant research experience» یعنی paper publishing track، یا تجربه عمیق در یک ML lab صنعتی (Google Brain، DeepMind، Meta AI و …). دکترا الزامی نیست اما track record باید قابل اثبات باشد.
ضروریProficiency with Python and ML frameworks like PyTorch, JAX, or TensorFlow
Anthropic داخلاً عمدتاً JAX/Flax استفاده میکند، اما PyTorch هم پذیرفته است. مهم این است که بتوانید مدلهای پیچیده را خودتان از صفر بسازید، نه فقط fine-tune کنید. بسیاری از مصاحبههای Anthropic شامل پیادهسازی یک معماری ساده از صفر در 90 دقیقه است.
ضروریExperience designing and evaluating capabilities of large language models
این موقعیت روی red-teaming و evaluation تمرکز دارد. باید بدانید چطور capabilities را با benchmarks دقیق ارزیابی کنید. کار قبلی روی elicitation، few-shot evaluation یا adversarial testing مزیت بزرگ است.
ضروریStrong written and verbal communication skills for research dissemination
Anthropic بسیار به نوشتن اهمیت میدهد. Constitutional AI، Sleeper Agents، Sparse Autoencoders — همه با blog post های دقیق و paper های مفصل منتشر شدند. شما در مصاحبه احتمالاً نمونه نوشتهای ارائه میدهید.
ضروریBackground in cybersecurity, bioweapons, or other dual-use risk areas (for Frontier Red Team specifically)
این تیم خاص (Frontier Red Team) به دنبال people با domain expertise خارج از ML کلاسیک است. اگر شما PhD biology + PyTorch میدانید، شانستان بسیار بیشتر از Pure ML researcher است.
مهمComfort working with sensitive content and difficult ethical questions
Red teaming یعنی شما عمداً مدل را وادار میکنید چیزهای خطرناک تولید کند تا ضعفهایش را شناسایی کنید. این کار از نظر روانی سخت است. Anthropic در مصاحبه این موضوع را به دقت بررسی میکند.
مهمتحلیل مسئولیتها
Design and execute capability evaluations on frontier models
طراحی benchmark های جدید برای اندازهگیری قابلیتهای مدل (بهخصوص در دامنههای خطرناک). این یعنی تخصص هم در ML evaluation داشته باشید و هم در domain خاص (مثلاً bioweapons threat modeling).
Develop adversarial techniques to elicit model behaviors
روشهای جدید برای jailbreaking یا elicit کردن قابلیتهای مخفی مدل. این بخش هم art است هم science — نیاز به creativity فراوان دارد.
Collaborate with policy teams to translate findings into safety frameworks
Frontier Red Team بهطور مستقیم با Responsible Scaling Policy تیم همکاری میکند. شما باید قادر باشید نتایج فنی را به زبان policy ترجمه کنید.
Publish results when appropriate to advance the field's understanding of AI risks
Anthropic معمولاً نتایج red team را publish میکند (مثل sleeper agents paper). شما در نوشتن این paper ها مشارکت خواهید کرد — همان مهارتهای Scientific Writing.
نتیجهگیری کلی
این نقش نشان میدهد که در ۲۰۲۵، شرکتهای frontier AI به دنبال «T-shaped scientist» هستند: عمق در یک حوزه + breadth در ML + توانایی writing. اگر نقطه قوتتان فقط ML است، با چند نفر در یک حوزه domain (security، bio، economics) همکاری کنید تا T-shape را بسازید. Anthropic معمولاً compensation عالی پیشنهاد میکند ($350K-$700K total comp) اما مصاحبهاش از سختترین در صنعت است.
آینده و روندها
پیشبینی ۵–۱۰ ساله و مهارتهایی که باید یاد بگیرید
رشد ۲۶٪ سالانه برای نقش Computer & Information Research Scientist تا ۲۰۳۲ — یکی از سریعترین رشدها در آمار رسمی BLS
منبع: U.S. Bureau of Labor Statistics 2024–2034 Outlook + LinkedIn Top Jobs 2025 Report
مهارتهای نوظهور که باید یاد بگیرید
پیشبینیهای آینده
تخصص Mechanistic Interpretability از حاشیه به mainstream میآید — هر تیم frontier حداقل یک interp scientist استخدام میکند
AI for Science (بهخصوص biology) به یکی از بزرگترین زیرحوزههای جذب ML Scientist تبدیل میشود — به دنبال AlphaFold momentum
تفاوت میان «ML Scientist» و «AI Engineer» محو میشود — همه به سمت hybrid role حرکت میکنند که هم paper بنویسد و هم production code
ML Scientist های با تخصص evaluation و safety، حقوق و prestige برابر با مدلسازان frontier پیدا میکنند — به دلیل اولویت regulatory
تمرکز بازار: شرکتهای frontier (OpenAI، Anthropic، Google، Meta، xAI) ۸۰٪ بهترین ML Scientist ها را جذب میکنند. این یعنی شرکتهای متوسط نمیتوانند با حقوق رقابت کنند و گاهی کیفیت تحقیقاتشان پایین میآید. خطر دیگر: commoditization تخصص LLM — هرچه ابزارها و pretrained models بیشتر میشوند، نقش Scientist هایی که فقط fine-tuning میکنند تحت فشار قرار میگیرد. Scientist هایی که سراغ مرزهای جدید (RL، multimodal، AI for science) میروند، آیندهشان امنتر است.
ویدیوهای آموزشی
یک روز در زندگی یک Machine Learning Scientist
ویدیوهای واقعی از متخصصان این حوزه که روزانه چه کارهایی انجام میدهند

What I *actually* do as a Data Scientist (salary, job, reality)
Egor Howell

Productive Day in the Life of a Data Scientist | What Data Scientists ACTUALLY Do at Work 👩🏻💻
candidly vivian

The Complete Data Science Roadmap
Programming with Mosh

The Complete Machine Learning Roadmap
Programming with Mosh

Cracking the Code: A Day in the Life of Data Scientist.
Random Talkz

A day in the life of a Data Scientist | Ep #3
Accredian
