🎯

رتبه ۱۹ از ۱۰رشد ۳۸.۴% سالانه

مهندس تنظیم دقیق مدل

Fine-tuning Engineer

مهندس Fine-tuning متخصصی است که مدل‌های زبانی بزرگ از پیش آموزش‌دیده را برای دامنه‌های تخصصی، دیتاهای خصوصی، و رفتارهای دلخواه سازمان تنظیم می‌کند. این فرد با تکنیک‌هایی مانند LoRA، QLoRA، DPO و RLHF مدل‌های عمومی را به دستیارهای هدفمند تبدیل می‌کند. با ورود مدل‌های متن‌باز قدرتمند، Fine-tuning به ستون فقرات استراتژی AI شرکت‌ها تبدیل شده و یکی از پرتقاضاترین تخصص‌های ۲۰۲۵ به شمار می‌رود.

LoRA / QLoRAPyTorchHugging Face TRLData CurationDPO / RLHF

مقدمه و تعریف شغل

مهندس Fine-tuning (Fine-tuning Engineer) متخصصی است که مدل‌های زبانی بزرگ از پیش آموزش‌دیده را برای کاربردهای خاص بازآموزی می‌کند. این فرد مدل عمومی مانند Llama یا Mistral را با دیتای تخصصی، رفتار دلخواه و سبک ارتباطی خاص شرکت تنظیم می‌کند. برخلاف Pre-training که هزاران GPU و میلیون‌ها دلار نیاز دارد، Fine-tuning با تکنیک‌هایی مانند LoRA و QLoRA حتی روی یک GPU مصرفی هم ممکن است.

تا اوایل ۲۰۲۳، اکثر شرکت‌ها برای ساخت محصول AI فقط دو گزینه داشتند: یا از API های پولی مثل OpenAI استفاده کنند، یا مدل را از صفر آموزش دهند که عملاً غیرممکن بود. با عرضه Llama توسط Meta و سپس انفجار مدل‌های متن‌باز قدرتمند مانند Llama 3، Mistral، Qwen، DeepSpeek و Gemma، گزینه سوم متولد شد: گرفتن یک مدل قوی متن‌باز و تنظیم آن برای نیازهای خاص. این تغییر باعث شده تقاضا برای Fine-tuning Engineer در ۲۰۲۵ به یکی از داغ‌ترین مسیرهای AI تبدیل شود، چون هر شرکتی که داده اختصاصی دارد، می‌خواهد مدل اختصاصی هم داشته باشد.

چه چیزی می‌سازید؟

مثال‌های واقعی از خروجی کار یک مهندس تنظیم دقیق مدل

🏢

دستیار سازمانی با دانش داخلی

یک شرکت بیمه می‌خواهد دستیاری بسازد که با لحن خاص شرکت و دانش ۱۰ هزار صفحه policy داخلی صحبت کند. شما Llama 3 70B را با ۵۰ هزار جفت Q&A داخلی Fine-tune می‌کنید.

⚖️

مدل تخصصی برای دامنه عمودی

یک استارتاپ legal-tech به مدلی نیاز دارد که اصطلاحات حقوقی را عمیق بفهمد. شما Mistral 7B را روی corpus قراردادها و آرای قضایی تنظیم می‌کنید و دقت را ۴۰٪ بهبود می‌دهید.

📉

مدل کوچک با کیفیت بزرگ (Distillation)

هزینه inference با GPT-4 بالاست. شما با distillation، یک مدل ۸B می‌سازید که در دامنه خاص شرکت ۹۵٪ کیفیت GPT-4 را با ۱۰ برابر هزینه کمتر دارد.

🌍

تغییر زبان و فرهنگ مدل

یک شرکت ایرانی می‌خواهد مدلی که فارسی روان، احترام‌آمیز و با ارجاع به متون فرهنگی فارسی پاسخ دهد. شما با Continued Pre-training روی متون فارسی و سپس SFT این رفتار را می‌سازید.

🔧

مدل‌های ابزارمحور (Tool-calling)

یک محصول agentic به مدلی نیاز دارد که بتواند ۵۰ ابزار اختصاصی شرکت را به درستی فراخوانی کند. شما با Function-calling SFT این توانایی را به مدل اضافه می‌کنید.

🛡️

مدل‌های ایمن و Aligned

یک پلتفرم آموزشی کودک می‌خواهد مدلش هیچ‌گاه محتوای نامناسب تولید نکند. شما با DPO و RLHF رفتار ایمن را شکل می‌دهید و سپس با red-teaming تست می‌کنید.

تخصص‌های مختلف مهندس تنظیم دقیق مدل

این شغل یک عنوان واحد نیست — مسیرهای تخصصی متعددی دارد

💬

متخصص Instruction Tuning

Instruction Tuning Specialist

ساخت دیتاست Instruction و آموزش مدل برای پیروی از دستورالعمل — قلب ساخت دستیارهای chat.

🎯

مهندس RLHF و بهینه‌سازی ترجیحات

RLHF / Preference Optimization Engineer

کار با DPO، RLHF و reward modeling برای شکل‌دهی رفتار مدل با feedback انسانی — تخصص نادر و گران.

🏥

مهندس انطباق دامنه

Domain Adaptation Engineer

تخصص در تنظیم مدل برای صنایع خاص: پزشکی، حقوقی، مالی، کد‌نویسی. درک عمیق از حوزه لازم است.

🌐

مهندس تنظیم چندزبانه

Multilingual Fine-tuning Engineer

تنظیم مدل برای زبان‌های کم‌منبع — از جمله فارسی، عربی، ترکی. فرصت طلایی برای مهندسان منطقه.

📉

مهندس تقطیر مدل

Model Distillation Engineer

ساخت مدل‌های کوچک با کیفیت بالا با distillation از مدل‌های بزرگ — کلید کاهش هزینه inference.

تفاوت با شغل‌های مشابه

کجا این شغل تمام می‌شود و شغل دیگری شروع می‌شود؟

مهندس هوش مصنوعیAI Engineer

AI Engineer از مدل‌های آماده و API استفاده می‌کند و روی محصول نهایی تمرکز دارد. Fine-tuning Engineer قبل از این مرحله است — او خود مدل را به شکلی که محصول می‌خواهد در می‌آورد. در تیم‌های بزرگ این دو نقش جدا هستند، در تیم‌های کوچک یک نفر هر دو را انجام می‌دهد.

محقق یادگیری ماشینML Research Scientist

محقق روی اختراع الگوریتم‌های جدید Fine-tuning کار می‌کند (مثل اختراع DPO یا QLoRA). Fine-tuning Engineer از این تکنیک‌ها برای حل مسائل عملی استفاده می‌کند. محقق مقاله می‌نویسد، مهندس مدل قابل استفاده تحویل می‌دهد.

مهندس MLOpsMLOps Engineer

MLOps روی pipeline، deployment و monitoring تمرکز دارد و اغلب با مدل به‌عنوان جعبه سیاه کار می‌کند. Fine-tuning Engineer داخل مدل را می‌بیند — او loss curves، gradient ها و رفتار attention را تحلیل می‌کند. این دو نقش مکمل هم هستند.

دانشمند دادهData Scientist

Data Scientist روی تحلیل داده و الگوریتم‌های کلاسیک ML تمرکز دارد. Fine-tuning Engineer متخصص دامنه‌ای باریک‌تر اما عمیق‌تر است: فقط شبکه‌های عصبی بزرگ. در ۲۰۲۵ این تخصص آن‌قدر مهم شده که مسیر شغلی جدا از Data Science پیدا کرده است.

تأثیر در صنایع مختلف

مهندس تنظیم دقیق مدل در همه صنایع مشغول به کار است — نه فقط شرکت‌های فناوری

🏥

بهداشت و درمان

مدل‌های تخصصی برای کدگذاری ICD، تحلیل گزارش پاتولوژی و دستیار بالینی که با اصطلاحات پزشکی روزآمد هستند

🏦

مالی و بانکی

مدل‌های اختصاصی برای تحلیل گزارش‌های مالی، پاسخگویی به قوانین داخلی بانک و risk scoring روی داده محرمانه

⚖️

حقوقی

تنظیم روی corpus قراردادها و آرای قضایی هر کشور — مدلی که قانون محلی را می‌فهمد

📚

آموزش

مدل‌های همراه با curriculum خاص هر مدرسه یا دانشگاه — معلم AI که مطالب کلاس را می‌داند

🎧

خدمات مشتری

دستیار پشتیبانی که با محصول و brand voice شرکت آموزش دیده و از API های عمومی متمایز است

💻

تولید کد

مدل‌های coding تنظیم‌شده روی codebase داخلی شرکت — autocomplete که سبک کدنویسی تیم را می‌داند

🛒

خرده‌فروشی

توصیه محصول، تحلیل بازخورد مشتری و دستیار خرید با لحن brand خاص هر فروشگاه

🛡️

دفاع و امنیت

مدل‌های on-premise برای تحلیل اسناد طبقه‌بندی‌شده که هیچ‌گاه نباید با API خارجی تماس بگیرند

تصورات غلط رایج

قبل از تصمیم‌گیری، این باورهای اشتباه را بشناسید

Fine-tuning همیشه از RAG بهتر است

خیر. اگر هدف اضافه‌کردن دانش جدید است، RAG معمولاً ارزان‌تر و قابل به‌روزرسانی‌تر است. Fine-tuning برای تغییر رفتار، سبک و قالب پاسخ بهتر است نه برای حفظ کردن واقعیت‌های جدید.

هرچه داده بیشتر، نتیجه بهتر

کیفیت داده مهم‌تر از کمیت است. ۵۰۰ مثال با کیفیت بالا اغلب بهتر از ۵۰ هزار مثال نویزی است. تجربه نشان داده Curation با Argilla کلیدی‌تر از scraping بزرگ است.

نیاز به ده‌ها GPU دارد

با QLoRA می‌توان مدل ۷B را روی یک RTX 4090 تنظیم کرد و مدل ۷۰B را روی دو A100. هزینه ورود به این حوزه در سه سال گذشته به شدت کاهش یافته است.

Fine-tuning یک بار انجام می‌شود و تمام

در پروداکشن، Fine-tuning یک چرخه مداوم است. با تغییر داده و نیاز کاربر، باید هر چند ماه retrain کنید. این یعنی نیاز به Continuous Fine-tuning pipeline.

نتیجه Fine-tuning قابل پیش‌بینی است

خیر. حتی با همان هیپرپارامترها، run های مختلف نتایج متفاوت می‌دهند. این یعنی نیاز به ارزیابی دقیق و گاهی چند run قبل از تصمیم نهایی.

یک روز کاری واقعی

در هر سطح روز کاری چه شکلی است؟

جونیور (۰–۲ سال)

بیشتر زمان صرف اجرای job های مشخص‌شده، تمیزکاری دیتا و گزارش نتایج می‌شود. هنوز در حال ساختن intuition درباره hyperparameter و رفتار مدل هستید.

◆صبح: بررسی job های شب گذشته در W&B + مقایسه loss curve با baseline
◆بلاک اول: اجرای یک run جدید LoRA با تنظیمات پیشنهادی ارشد
◆بعد از ناهار: پاکسازی یک batch دیتا با Argilla — حذف duplicate و نمونه‌های نویزی
◆عصر: اجرای benchmark روی checkpoint جدید و گزارش به تیم
◆پایان روز: مطالعه paper جدید (مثلاً تکنیک جدید Distillation) و خلاصه‌نویسی

میانی (۲–۵ سال)

خودتان استراتژی تنظیم را طراحی می‌کنید. تعادل بین run های experimental و تحویل مدل پروداکشن. بخشی از زمان صرف data design می‌شود.

◆صبح: stand-up + بررسی نتایج ۳ run موازی دیشب در cluster
◆جلسه ۴۵ دقیقه با Product: تعریف معیار موفقیت مدل جدید برای پشتیبانی مشتری
◆بلاک عمیق: طراحی synthetic data pipeline با Claude و curation با Argilla
◆بعد از ناهار: code review برای job جونیور + کمک در debug
◆عصر: نوشتن RFC برای استراتژی DPO جدید + ارسال به تیم

ارشد (۵+ سال)

کمتر کد می‌نویسید، بیشتر معماری می‌کشید. تصمیم‌های کلیدی مثل انتخاب مدل پایه شرکت یا open-weight کردن مدل بر عهده شماست.

◆صبح: مرور metrics مدل‌های پروداکشن — drift، latency، quality scores
◆جلسه با CTO: تصمیم درباره upgrade مدل پایه از Llama 3 به نسل جدید
◆کدنویسی هدفمند: فقط بخش‌هایی که نیاز به تجربه عمیق دارند (مثلاً distributed training config)
◆بعد از ناهار: ۱:۱ با ۲ نفر از تیم + بازنگری career growth
◆عصر: نوشتن post-mortem یک incident — کاهش کیفیت بعد از retrain اخیر

مسئولیت‌ها و وظایف

مسئولیت‌های اصلی

وظایف روزانه و مهارت‌های مورد نیاز در این شغل

فنی

◈انتخاب مدل پایه مناسب (Llama، Mistral، Qwen، Gemma) بر اساس نیاز و محدودیت‌های پروژه
◈طراحی و اجرای job های LoRA / QLoRA / SFT روی GPU cluster
◈پاکسازی، deduplication و تولید synthetic data برای ساخت دیتاست با کیفیت
◈اجرای DPO یا RLHF برای بهبود alignment و کیفیت پاسخ
◈طراحی benchmark سفارشی و ارزیابی مدل قبل و بعد از تنظیم
◈بهینه‌سازی hyperparameter ها و انتخاب بهترین checkpoint
◈استقرار مدل تنظیم‌شده با vLLM یا TGI و مانیتورینگ کیفیت در پروداکشن

مهارت نرم

◈همکاری با تیم محصول برای تعریف رفتار مطلوب مدل و معیارهای موفقیت

مهارت‌های مورد نیاز

مهارت‌های فنی، نرم و حوزه‌ای که یک مهندس تنظیم دقیق مدل موفق به آن‌ها نیاز دارد

مهارت‌های فنی

PyTorch پیشرفتهضروری

تسلط عمیق بر PyTorch، custom training loop و debug شبکه‌های عمیق

معماری Transformerضروری

درک عمیق attention، positional encoding، KV cache و نحوه جریان gradient

LoRA و QLoRAضروری

تسلط بر Parameter-Efficient Fine-tuning و انتخاب rank و target modules مناسب

Hugging Face Ecosystemضروری

تسلط بر Transformers، PEFT، TRL، Datasets و Accelerate

Distributed Trainingضروری

آشنایی با DeepSpeed، FSDP و چالش‌های آموزش روی چند GPU/Node

Data Curationضروری

طراحی دیتاست با کیفیت، deduplication، filtering و synthetic generation

Quantizationمهم

درک bit-width مختلف، تأثیر آن روی کیفیت و سرعت، و استفاده از bitsandbytes

DPO و RLHFمهم

تنظیم رفتار مدل با preference data و reward modeling

ارزیابی LLMمهم

طراحی benchmark، استفاده از lm-eval-harness و human evaluation

vLLM / Inferenceمفید

استقرار مدل تنظیم‌شده با کمترین latency و بیشترین throughput

مهارت‌های نرم

صبر و سیستماتیک بودنضروری

Fine-tuning خیلی زود نتیجه نمی‌دهد؛ هر run چند ساعت تا چند روز طول می‌کشد. باید بدون عجله یاد بگیرید

تفکر تحلیلیضروری

تشخیص اینکه loss curve بد یعنی چه — overfitting، lr بالا، یا داده آلوده؟ این یک هنر است

ارتباط با تیم محصولضروری

ترجمه «مدل ما باید بهتر باشد» به معیار قابل اندازه‌گیری و قابل آموزش

پیگیری مقالاتمهم

حوزه Fine-tuning هر ماه تغییر می‌کند. مهندس موفق باید arXiv را زنده دنبال کند

مدیریت هزینه GPUمهم

هر run می‌تواند صدها دلار هزینه داشته باشد. تصمیم درباره ادامه یا توقف یک پروژه مالی است نه فقط فنی

دانش حوزه‌ای

خواندن مقاله MLضروری

توانایی خواندن paper جدید (مثلاً DPO، KTO، ORPO) و پیاده‌سازی سریع آن

آشنایی با Linux و SSHضروری

اکثر job ها روی cluster لینوکسی اجرا می‌شوند؛ tmux، screen و رفع مشکل OOM روزمره است

تجربه با Cloud GPUمهم

AWS، Lambda Labs، RunPod، Modal — هر کدام trade-off های خاص خود را دارند

آشنایی با Open Weights Licenseمهم

Llama، Mistral و سایر مدل‌ها مجوزهای متفاوت دارند. باید بدانید چه چیزی را می‌توان تجاری استفاده کرد

ضروری — بدون آن نمی‌توان وارد بازار کار شدمهم — تفاوت بین جونیور و میانیمفید — مزیت رقابتی

نقشه راه و مسیر آموزشی

نقشه راه تبدیل شدن به مهندس تنظیم دقیق مدل

این مسیر گام به گام شما را از صفر تا حرفه‌ای هدایت می‌کند.

پایه‌های یادگیری عمیق و PyTorch

⏱️ ۲ تا ۳ ماه

تسلط بر PyTorch و درک عمیق از معماری Transformer که پیش‌نیاز هرگونه کار جدی روی Fine-tuning است

Python پیشرفتهPyTorchمعماری TransformerAttention MechanismBackpropagationTokenizationGradient Descent

منابع پیشنهادی

Deep Learning Specialization - DeepLearning.AI The Illustrated Transformer - Jay Alammar PyTorch Official Tutorials

اکوسیستم Hugging Face و کار با مدل‌های از پیش آموزش‌دیده

⏱️ ۲ ماه

یادگیری ابزارهای استاندارد صنعت برای بارگذاری، اجرا و تنظیم مدل‌های متن‌باز مانند Llama، Mistral، Qwen و Gemma

Hugging Face TransformersDatasets LibraryTokenizersModel HubAccelerateInference PipelineQuantization (bitsandbytes)

منابع پیشنهادی

Hugging Face NLP Course Hugging Face LLM Course Natural Language Processing with Transformers - O'Reilly

Parameter-Efficient Fine-tuning: LoRA و QLoRA

⏱️ ۲ تا ۳ ماه

تسلط بر تکنیک‌های Fine-tuning کارآمد که با حداقل حافظه GPU، مدل‌های میلیاردی پارامتر را قابل آموزش می‌کنند

LoRA (Low-Rank Adaptation)QLoRAPEFT LibraryAdapter TuningPrefix Tuning4-bit / 8-bit QuantizationMixed Precision Training

منابع پیشنهادی

PEFT — Hugging Face Documentation LoRA: Low-Rank Adaptation Paper QLoRA Paper - Dettmers et al.Fine-tuning Large Language Models - DeepLearning.AI

Instruction Tuning و Preference Optimization

⏱️ ۲ تا ۳ ماه

یادگیری چگونگی شکل‌دهی به رفتار مدل با Instruction Tuning، RLHF و DPO برای ساخت دستیارهایی که از دستورالعمل پیروی می‌کنند

Instruction Datasets (Alpaca, Dolly)Supervised Fine-Tuning (SFT)RLHFDPO (Direct Preference Optimization)TRL LibraryReward Modelingارزیابی Alignment

منابع پیشنهادی

TRL - Transformer Reinforcement Learning Docs InstructGPT Paper - Ouyang et al.DPO Paper - Rafailov et al.Reinforcement Learning from Human Feedback - DeepLearning.AI

Data Curation، ارزیابی و استقرار تولیدی

⏱️ مداوم

آماده‌سازی دیتاست با کیفیت بالا، طراحی benchmark، استقرار مدل تنظیم‌شده در محیط Production و مانیتورینگ کیفیت در طول زمان

Data Cleaning & DeduplicationSynthetic Data GenerationEvaluation Frameworks (lm-eval-harness)vLLM / TGIModel DistillationContinuous Fine-tuningA/B Testing

منابع پیشنهادی

EleutherAI lm-evaluation-harness vLLM - High-throughput LLM Serving Argilla - Data Curation Platform Hugging Face Open Source AI Cookbook

ابزارها و استک فنی

ابزارهایی که هر مهندس AI باید بشناسد، دسته‌بندی‌شده بر اساس اولویت

فریم‌ورک‌های Fine-tuning

Hugging Face Transformers

زیربنای کار با مدل‌های از پیش آموزش‌دیده و Trainer API

ضروری

PEFT

کتابخانه استاندارد LoRA، QLoRA و سایر روش‌های Parameter-Efficient

ضروری

TRL

ابزار اصلی برای SFT، DPO و RLHF — توسعه‌یافته توسط Hugging Face

ضروری

Axolotl

فریم‌ورک تنظیم تنها با فایل YAML — محبوب در community متن‌باز

مفید

بهینه‌سازی و توزیع

DeepSpeed

موتور Microsoft برای آموزش توزیع‌شده و ZeRO Optimization

ضروری

Accelerate

ابزار Hugging Face برای اجرای آموزش روی چند GPU بدون تغییر کد

ضروری

bitsandbytes

Quantization به ۴ و ۸ بیت برای آموزش روی GPU های مصرفی

ضروری

FSDP

Fully Sharded Data Parallel در PyTorch برای مدل‌های بسیار بزرگ

پیشرفته

ارزیابی و دیتاست

lm-evaluation-harness

استاندارد صنعتی برای ارزیابی LLMs روی صدها benchmark

ضروری

Argilla

پلتفرم برچسب‌گذاری و curation برای ساخت دیتاست با کیفیت

مفید

LightEval

ابزار Hugging Face برای ارزیابی سریع مدل‌های تنظیم‌شده

مفید

Weights & Biases

ردیابی experiment ها، loss curves و مقایسه run های Fine-tuning

ضروری

استقرار و سرویس‌دهی

vLLM

موتور سریع‌ترین inference برای مدل‌های Fine-tune شده در پروداکشن

ضروری

Text Generation Inference (TGI)

سرور Hugging Face برای سرویس‌دهی LLM با throughput بالا

مفید

Ollama

اجرای محلی مدل‌های تنظیم‌شده برای تست و توسعه

مفید

Modal / RunPod

زیرساخت ابری مقرون‌به‌صرفه برای اجرای job های Fine-tuning

مفید

ضروری — باید یاد بگیریدمفید — ارزش یادگیری داردپیشرفته — برای سطوح ارشد

مسیر پیشرفت شغلی

از جونیور تا Staff Engineer — چه مهارت‌هایی نیاز دارید و چه درآمدی انتظار داشته باشید

مهندس Fine-tuning جونیور

۰ تا ۲ سال

~$95K

میانگین سالانه (آمریکا)

اجرای job های آموزشی از پیش طراحی‌شده، پاکسازی دیتاست، اجرای benchmark ها و گزارش‌گیری از نتایج

PyTorchHugging FaceLoRAPythonLinux / SSH

مهندس Fine-tuning میانی

۲ تا ۵ سال

~$145K

میانگین سالانه (آمریکا)

طراحی استراتژی تنظیم، انتخاب مدل پایه، curation دیتاست تخصصی و بهینه‌سازی hyperparameter ها

DPO / RLHFDistributed TrainingData CurationEvaluation DesignQuantization

مهندس ارشد Fine-tuning

۵ تا ۸ سال

~$195K

میانگین سالانه (آمریکا)

رهبری تیم Adaptation، تعریف pipeline استاندارد سازمان، تصمیم‌گیری روی build vs. buy مدل پایه

Multi-GPU ArchitectureRLHFSynthetic DataReward ModelingTeam Mentorship

Staff / Principal Fine-tuning Engineer

۸+ سال

~$290K

میانگین سالانه (آمریکا)

تعیین استراتژی Post-Training شرکت، انتشار مدل‌های open-weight، همکاری با تیم تحقیقات

Research DirectionPost-Training StrategyOpen Source LeadershipCross-org Influence

چالش‌ها و جنبه‌های منفی

واقعیت‌هایی که کمتر در آگهی‌های شغلی می‌بینید — قبل از ورود بدانید

Catastrophic Forgetting

عمومی

هنگام Fine-tuning، مدل ممکن است توانایی‌های عمومی خود را فراموش کند. تنظیم مدل برای پاسخگویی حقوقی می‌تواند توانایی ریاضی آن را نابود کند. مدیریت این trade-off یکی از چالش‌های اصلی است.

هزینه GPU و زمان آموزش

استارتاپ

حتی با QLoRA، آموزش مدل ۷۰B چندین ساعت روی A100 طول می‌کشد و هزینه بالایی دارد. یک hyperparameter اشتباه یعنی صدها دلار هدر رفته. مدیریت بودجه آزمایش حیاتی است.

ارزیابی subjective

عمومی

برخلاف classification که accuracy ساده است، ارزیابی کیفیت پاسخ generative چالش‌برانگیز است. Benchmark های استاندارد همیشه نشان‌دهنده کیفیت واقعی برای کاربر شما نیستند.

Data Drift و نیاز به retrain

شرکت بزرگ

مدلی که امروز عالی است، شش ماه دیگر ممکن است عقب بیفتد. تغییر زبان کاربران، اصطلاحات جدید و تغییر محصول، نیاز به retrain مداوم را ایجاد می‌کند که هزینه دائمی است.

Reproducibility ضعیف

عمومی

دو run با همان hyperparameter می‌توانند نتایج متفاوت بدهند به‌خاطر floating-point، seed، یا حتی نسخه CUDA. این مشکل debug را بسیار سخت می‌کند.

محرمانگی دیتا برای enterprise

شرکت بزرگ

بسیاری از شرکت‌های بزرگ نمی‌توانند دیتای خود را به cloud عمومی بفرستند. این یعنی باید pipeline کامل on-premise بسازید — از GPU server تا monitoring — که پیچیدگی را چند برابر می‌کند.

حقوق و بازار کار جهانی

حقوق جهانی مهندس تنظیم دقیق مدل

میانگین حقوق سالانه بر اساس تجربه در کشورهای مختلف

کشور	حداقل	میانه	حداکثر	ارز
🇮🇳هندبالاترین	₹2,500,000	₹4,500,000	₹7,500,000	INR
🇦🇪امارات	AED 230,000	AED 310,000	AED 420,000	AED
🇺🇸آمریکا	$170,000	$230,000	$320,000	USD
🇸🇬سنگاپور	SGD 130,000	SGD 180,000	SGD 230,000	SGD
🇨🇦کانادا	CA$135,000	CA$175,000	CA$220,000	CAD
🇨🇭سوئیس	CHF 135,000	CHF 175,000	CHF 220,000	CHF
🇦🇺استرالیا	A$130,000	A$165,000	A$200,000	AUD
🇬🇧انگلستان	£95,000	£125,000	£170,000	GBP
🇩🇪آلمان	€85,000	€110,000	€150,000	EUR

* ارقام سالانه و تقریبی هستند و بر اساس میانگین بازار در سال ۲۰۲۵ محاسبه شده‌اند.

چگونه از صفر شروع کنیم

برنامه گام‌به‌گام برای ورود به مهندسی هوش مصنوعی

ماه ۱: PyTorch و Hugging Face Basics

اگر PyTorch بلدید، مستقیم سراغ Hugging Face Transformers بروید. یک مدل کوچک را inference کنید و رفتارش را بفهمید.

Hugging Face NLP Course PyTorch Tutorials

ماه ۲: اولین LoRA Fine-tune

یک مدل ۷B را با LoRA روی Alpaca dataset Fine-tune کنید. هدف: فهمیدن چرخه کامل از داده تا checkpoint.

PEFT Documentation Axolotl Examples

ماه ۳: QLoRA و GPU مصرفی

همان پروژه را روی GPU مصرفی با QLoRA اجرا کنید. تفاوت کیفیت و سرعت را اندازه بگیرید.

QLoRA Paper

ماه ۴: ارزیابی و Benchmark

با lm-evaluation-harness مدل خود و baseline را ارزیابی کنید. یک benchmark سفارشی برای دامنه خودتان طراحی کنید.

lm-eval-harness

ماه ۵: DPO و Preference Tuning

یک مدل SFT شده را با DPO بهبود دهید. تفاوت رفتار قبل و بعد را با ارزیابی انسانی نشان دهید.

TRL Documentation RLHF Course - DeepLearning.AI

ماه ۶: پورتفولیو و Apply

یک مدل تنظیم‌شده فارسی روی Hugging Face Hub منتشر کنید. مقاله Medium درباره فرآیند بنویسید. شروع به apply کنید.

پروژه‌های پیشنهادی برای رزومه

Fine-tune کردن Llama 3 با LoRA روی یک دامنه تخصصی

مبتدی

یک مدل Llama 3 8B را با LoRA روی دیتاست حقوقی یا پزشکی فارسی تنظیم کنید. قبل و بعد را با چند سوال نمونه مقایسه و گزارش بنویسید.

PyTorchPEFTTransformersDatasets

زمان تخمینی: ۲ هفته

QLoRA روی GPU مصرفی (4090 یا کمتر)

متوسط

ثابت کنید که می‌توان مدل 7B را روی یک GPU مصرفی Fine-tune کرد. منابع، زمان آموزش و کیفیت خروجی را مستند کنید.

QLoRAbitsandbytesAccelerateWeights & Biases

زمان تخمینی: ۲ هفته

Instruction Tuning با دیتاست Synthetic

متوسط

با استفاده از GPT-4 یا Claude، چند هزار جفت Instruction-Response تولید کنید، با Argilla پاکسازی کنید و یک مدل Base را SFT کنید.

TRL (SFTTrainer)ArgillaOpenAI APIDatasets

زمان تخمینی: ۳ هفته

DPO برای بهبود کیفیت پاسخ

پیشرفته

روی یک مدل SFT شده، با دیتاست preference (chosen vs. rejected) از DPO استفاده کنید. تفاوت رفتار مدل را با ارزیابی انسانی نشان دهید.

TRL (DPOTrainer)PEFTCustom EvalvLLM

زمان تخمینی: ۴ هفته

استقرار مدل تنظیم‌شده با vLLM در Production

پیشرفته

مدل خود را با vLLM پشت یک API قرار دهید، latency و throughput را اندازه‌گیری کنید و یک dashboard مانیتورینگ بسازید.

vLLMFastAPIDockerPrometheusGrafana

زمان تخمینی: ۴ هفته

مثال‌های واقعی و Case Studies

داستان‌های واقعی از مهندسانی که در این حوزه تأثیرگذار بوده‌اند

Lewis Tunstall

پیشینه

دکترای فیزیک نظری از دانشگاه بِرن سوئیس. وارد ML شد بدون پیشینه CS رسمی. در Hugging Face به‌عنوان Senior ML Research Engineer در تیم alignment کار می‌کند.

دستاورد

هم‌نویسنده کتاب «Natural Language Processing with Transformers» (O'Reilly) که یکی از پرفروش‌ترین کتاب‌های NLP است. رهبر پروژه Zephyr — یکی از اولین مدل‌های open-source که با DPO به سطح GPT-3.5 رسید. مشارکت‌های گسترده در TRL و alignment-handbook.

درس کلیدی

پیشینه فیزیک به‌جای CS، نه‌تنها مانع نبوده، بلکه به دیدگاه ریاضی عمیق او در درک optimization کمک کرده. تغییر رشته به ML از حوزه‌های ریاضی-محور کاملاً قابل دسترس است.

Maxime Labonne

پیشینه

دکترای ML از دانشگاه پاریس-ساکلِی. سابقه کار به‌عنوان ML Engineer در JP Morgan و Airbus. اکنون Head of Post-Training در Liquid AI است.

دستاورد

خالق «LLM Course» در GitHub با ده‌ها هزار ستاره — یکی از کامل‌ترین مسیرهای یادگیری Fine-tuning. توسعه‌دهنده مدل‌های پرکاربرد مانند NeuralHermes و AlphaMonarch روی Hugging Face. نویسنده کتاب «Hands-On Graph Neural Networks» (Packt).

درس کلیدی

ساخت محتوای آموزشی open-source یکی از سریع‌ترین راه‌های ساخت برند شخصی در AI است. Labonne از Twitter و GitHub به‌عنوان رزومه استفاده کرد و مسیر خودش را به یکی از مرجع‌های اصلی Fine-tuning ساخت.

Sebastian Raschka

پیشینه

دکترای آمار محاسباتی از Michigan State. سال‌ها استاد در University of Wisconsin-Madison بود. اکنون Staff Research Engineer در Lightning AI است.

دستاورد

نویسنده «Build a Large Language Model From Scratch» (Manning) که نقشه راه دقیق ساخت LLM از صفر را ارائه می‌دهد. نویسنده «Machine Learning with PyTorch and Scikit-Learn» که میلیون‌ها نسخه فروخته. وبلاگ Ahead of AI یکی از معتبرترین منابع تحلیل paper های Fine-tuning است.

درس کلیدی

ترکیب آکادمی و صنعت قدرت زیادی دارد. Raschka نشان می‌دهد که می‌توان همزمان نویسنده، محقق و مهندس Production بود. تخصص در آموزش دیگران، خودش یک حرفه ارزشمند است.

نمونه آگهی استخدام واقعی + تحلیل

یک آگهی واقعی از شرکت فعال در حال استخدام، با تحلیل هر بخش

Machine Learning Engineer — Post-Training & Alignment

Hugging FaceRemote (Europe / Americas)2025-09

مشاهده آگهی اصلی

تحلیل نیازمندی‌ها

Strong experience training and fine-tuning large language models

این صورت کلی است؛ منظور تجربه عملی با SFT روی مدل‌های ۷B+ پارامتر و آشنایی با چالش‌های آموزش توزیع‌شده است. اگر فقط با مدل‌های کوچک کار کرده‌اید، با اشاره به Side Project های واقعی روی Hugging Face Hub می‌توانید فاصله را پر کنید.

ضروری

Hands-on experience with RLHF, DPO, or other preference optimization methods

بازار خیلی به این تخصص نیاز دارد و افراد کمی واقعاً تجربه عملی دارند. اگر یک پروژه نمونه با DPO روی Hugging Face دارید، شانس شما به‌شدت بالاتر از کسانی است که فقط paper خوانده‌اند.

ضروری

Proficiency in PyTorch and the Hugging Face ecosystem (Transformers, TRL, PEFT)

Hugging Face طبیعتاً انتظار دارد که ابزارهای خودش را بشناسید. مشارکت در GitHub این کتابخانه‌ها — حتی یک PR کوچک برای fix یک bug در docs — می‌تواند مسیر استخدام را عوض کند.

ضروری

Experience with distributed training (DeepSpeed, FSDP, or similar)

این مهم است اما نه deal-breaker. می‌توانید با اجرای یک آزمایش روی Modal یا RunPod با ۲ GPU و توضیح در رزومه خود این تجربه را نشان دهید.

مهم

Familiarity with LLM evaluation frameworks (lm-eval-harness, Open LLM Leaderboard)

ارزیابی یکی از مهم‌ترین مهارت‌های امروز است. سابمیت کردن یک مدل به Open LLM Leaderboard نشان قوی‌ای از مهارت شماست.

مهم

Strong communication skills and ability to write public-facing technical content

Hugging Face فرهنگ open و آموزش‌محور دارد. اگر بلاگ، Twitter یا talk دارید، حتماً در رزومه برجسته کنید. این برای Hugging Face بسیار جذاب است.

مهم

تحلیل مسئولیت‌ها

Training and aligning open-source LLMs at scale

این یعنی شما در پروژه‌هایی مثل Zephyr و StarChat مشارکت خواهید کرد. کار شما به صورت عمومی منتشر می‌شود — هم فرصت برند، هم فشار کیفیت.

Developing tools and recipes for the community

بخشی از کار شما ساخت ابزارهایی است که دیگران از آن استفاده می‌کنند. این یعنی نیاز به نگاه developer experience علاوه بر مهارت ML.

Contributing to open-source libraries (TRL, alignment-handbook)

مشارکت در PR، code review و طراحی API. اگر تجربه open-source در رزومه ندارید، شروع کنید — حتی قبل از apply.

Publishing research blog posts and technical reports

نوشتن بخش جدی کار است. اگر از نوشتن می‌ترسید، این نقش مناسب شما نیست. اگر دوست دارید، فرصت عالی برای ساخت برند شخصی است.

نتیجه‌گیری کلی

Hugging Face نقش نادری است که در آن تخصص فنی، نوشتن عمومی و مشارکت در open-source همگی به یک اندازه مهم‌اند. اگر در GitHub کم‌حضور هستید، حتی قبل از apply، یک پروژه عمومی شروع کنید. این بهترین «test prep» برای این جور شرکت‌هاست.

آینده و روندها

پیش‌بینی ۵–۱۰ ساله و مهارت‌هایی که باید یاد بگیرید

رشد بازار LLM Fine-tuning از ۱.۲ میلیارد دلار در ۲۰۲۴ به ۱۸ میلیارد دلار در ۲۰۳۰ — CAGR حدود ۴۸٪

منبع: MarketsandMarkets — LLM Fine-tuning Market Report 2025

مهارت‌های نوظهور که باید یاد بگیرید

DPO، KTO و ORPO به‌عنوان جایگزین RLHFSynthetic Data Generation در مقیاسMultimodal Fine-tuning (Vision + Audio + Text)Continual Learning بدون Catastrophic ForgettingOn-device Fine-tuning روی موبایلModel Merging و SLERP

پیش‌بینی‌های آینده

2026

هر شرکت متوسط به بالا حداقل یک مدل اختصاصی Fine-tune شده خواهد داشت — تقاضا بسیار بیشتر از عرضه

2027

On-device Fine-tuning روی iPhone و Android رایج می‌شود — مدل‌های personalized روی دستگاه شخصی

2028

Synthetic Data بیش از ۷۰٪ دیتای آموزش مدل‌های تنظیم‌شده را تشکیل می‌دهد

2030

نقش‌های Post-Training Specialist و Alignment Engineer از Fine-tuning Engineer عمومی جدا می‌شوند — تخصصی‌سازی عمیق‌تر

ریسک‌های واقعی

اصلی‌ترین ریسک: ابزارهای no-code Fine-tuning مثل Hugging Face AutoTrain یا OpenAI Fine-tuning API ممکن است بخشی از کار را اتوماتیک کنند. اما متخصصانی که می‌توانند تشخیص دهند چرا یک run شکست خورده، چرا یک loss curve عجیب است، یا کی باید استراتژی را عوض کرد، همچنان حیاتی خواهند بود. آینده برای کسانی است که عمق فنی دارند و فقط button-clicker نیستند.

ویدیوهای آموزشی

یک روز در زندگی یک Fine-tuning Engineer

ویدیوهای واقعی از متخصصان این حوزه که روزانه چه کارهایی انجام می‌دهند

RAG Explained For Beginners

KodeKloud

LLMs — How ChatGPT works & What is RAG? | Retrieval-Augmented Generation Explained 🔥

CodeWithHarry

برای راهنمایی شخصی‌سازی‌شده مشاوره بگیرید

مهندس تنظیم دقیق مدل

مقدمه و تعریف شغل

چه چیزی می‌سازید؟

تخصص‌های مختلف مهندس تنظیم دقیق مدل

تفاوت با شغل‌های مشابه

تأثیر در صنایع مختلف

تصورات غلط رایج

یک روز کاری واقعی

مسئولیت‌ها و وظایف

مسئولیت‌های اصلی

مهارت‌های مورد نیاز

مهارت‌های فنی

مهارت‌های نرم

دانش حوزه‌ای

نقشه راه و مسیر آموزشی

نقشه راه تبدیل شدن به مهندس تنظیم دقیق مدل

پایه‌های یادگیری عمیق و PyTorch

اکوسیستم Hugging Face و کار با مدل‌های از پیش آموزش‌دیده

Parameter-Efficient Fine-tuning: LoRA و QLoRA

Instruction Tuning و Preference Optimization

Data Curation، ارزیابی و استقرار تولیدی

ابزارها و استک فنی

فریم‌ورک‌های Fine-tuning

بهینه‌سازی و توزیع

ارزیابی و دیتاست

استقرار و سرویس‌دهی

مسیر پیشرفت شغلی

مهندس Fine-tuning جونیور

مهندس Fine-tuning میانی

مهندس ارشد Fine-tuning

Staff / Principal Fine-tuning Engineer

چالش‌ها و جنبه‌های منفی

Catastrophic Forgetting

هزینه GPU و زمان آموزش

ارزیابی subjective

Data Drift و نیاز به retrain

Reproducibility ضعیف

محرمانگی دیتا برای enterprise

حقوق و بازار کار جهانی

حقوق جهانی مهندس تنظیم دقیق مدل

چگونه از صفر شروع کنیم

ماه ۱: PyTorch و Hugging Face Basics

ماه ۲: اولین LoRA Fine-tune

ماه ۳: QLoRA و GPU مصرفی

ماه ۴: ارزیابی و Benchmark

ماه ۵: DPO و Preference Tuning

ماه ۶: پورتفولیو و Apply

پروژه‌های پیشنهادی برای رزومه

Fine-tune کردن Llama 3 با LoRA روی یک دامنه تخصصی

QLoRA روی GPU مصرفی (4090 یا کمتر)

Instruction Tuning با دیتاست Synthetic

DPO برای بهبود کیفیت پاسخ

استقرار مدل تنظیم‌شده با vLLM در Production

مثال‌های واقعی و Case Studies

Lewis Tunstall

Maxime Labonne

Sebastian Raschka

نمونه آگهی استخدام واقعی + تحلیل

Machine Learning Engineer — Post-Training & Alignment

تحلیل نیازمندی‌ها

تحلیل مسئولیت‌ها

آینده و روندها

مهارت‌های نوظهور که باید یاد بگیرید

پیش‌بینی‌های آینده

ویدیوهای آموزشی

یک روز در زندگی یک Fine-tuning Engineer

RAG Explained For Beginners

LLMs — How ChatGPT works &amp; What is RAG? | Retrieval-Augmented Generation Explained 🔥

LLMs — How ChatGPT works & What is RAG? | Retrieval-Augmented Generation Explained 🔥