📡
رتبه ۴۲ از ۱۰رشد ۳۸% سالانه

متخصص هوش مصنوعی لبه

Edge AI Specialist

Edge AI Specialist (متخصص هوش مصنوعی لبه) متخصصی است در تقاطع embedded systems، model optimization و AI deployment که کارش اجرای مدل‌های AI روی دستگاه‌های با محدودیت‌های شدید — تلفن همراه، دوربین، خودرو، روبات، پوشیدنی — است. تفاوت کلیدی این نقش با AI engineer در cloud این است که شما با memory در حد مگابایت، compute در حد TOPS (نه TFLOPS) و power budget در حد میلی‌وات کار می‌کنید — هر بایت و هر نانوژول اهمیت دارد. در ۲۰۲۶ با ظهور Apple Intelligence، Google Gemini Nano، on-device LLM (Phi-3، Llama 3.2 1B/3B)، و رشد انفجاری autonomous vehicle و robotics، Edge AI Specialist یکی از پرتقاضاترین تخصص‌های AI شده — Senior position در Apple، Tesla، Qualcomm، NVIDIA و Anduril با total comp ۳۵۰هزار+ دلار، و talent shortage جدی به دلیل ترکیب نادر مهارت‌های embedded + ML.

Model Quantization (INT8/INT4)TensorFlow Lite / Core MLEmbedded C++ARM/NPU ArchitectureOn-Device LLM

مقدمه و تعریف شغل

Edge AI Specialist متخصصی است که چالش‌های منحصر به فرد اجرای AI روی device با محدودیت‌های شدید را حل می‌کند. در cloud یک LLM می‌تواند ۸۰ گیگابایت VRAM داشته باشد و ۷۰۰ وات مصرف کند. اما در iPhone شما ۸ گیگابایت RAM دارید (که OS، apps دیگر و model همگی share می‌کنند)، CPU با چند کور، یک NPU با ~۳۵ TOPS، و total power budget چند وات. در این محیط، هر بایت، هر cycle و هر میلی‌ژول اهمیت دارد. Edge AI Specialist با ابزارهای quantization (INT8، INT4، حتی INT2)، sparsity، knowledge distillation، و compiler optimization مدل را به این محیط تطبیق می‌دهد. علاوه بر آن، توسعه‌دهنده edge باید بفهمد چطور NPU خاص (Apple Neural Engine، Qualcomm Hexagon، Google Edge TPU) operation ها را اجرا می‌کند و چه operator هایی fall-back به CPU می‌شوند.

تاریخچه Edge AI به DSP در دهه ۱۹۸۰ برمی‌گردد — Texas Instruments و Qualcomm chip های specialized برای signal processing می‌ساختند که در phone استفاده می‌شد. در ۲۰۱۲ که AlexNet revolution یادگیری عمیق را شروع کرد، model ها برای edge بسیار بزرگ بودند. در ۲۰۱۷ Google MobileNet را معرفی کرد — اولین architecture explicitly designed برای mobile. در ۲۰۱۸ Apple Neural Engine را در A11 chip معرفی کرد. در ۲۰۲۰s، NPU به همه SoC اضافه شد. در ۲۰۲۳، llama.cpp نشان داد که LLM ۷B می‌تواند روی Mac یا حتی Raspberry Pi 5 اجرا شود. در ۲۰۲۴، Apple Intelligence معرفی شد که LLM های ۳B روی iPhone اجرا می‌کند. در ۲۰۲۵، Google Gemini Nano روی Pixel و Samsung به‌طور default deploy شد. در ۲۰۲۶، expectation در صنعت این است که هر مدل foundation با versionی edge همراه باشد. talent shortage جدی — Apple، Qualcomm، Google، Tesla هر کدام صدها Edge AI Specialist استخدام می‌کنند اما تعداد kandidate صلاحیتدار کم است. مزیت این تخصص: cost ندارد به scale GPU cluster؛ هر engineer ارزش زیادی برای محصول دارد.

چه چیزی می‌سازید؟

مثال‌های واقعی از خروجی کار یک متخصص هوش مصنوعی لبه

🍎

Apple Intelligence Pipeline

Apple یک LLM ۳B روی iPhone deploy می‌کند که با Apple Neural Engine اجرا می‌شود — Mail summarization، Writing Tools، Genmoji همه روی device. این requires quantization deep، model compression و co-design عمیق با hardware.

🚗

Tesla FSD Computer

Tesla HW4 chip دارد با ۲۵۰ TOPS که vision pipeline برای autopilot را real-time اجرا می‌کند — ۸ camera، ۳۶ FPS، latency <۱۰۰ms. Edge AI Specialist مدل را برای این constraint optimize می‌کند.

👻

Snapchat AR Lens

Snapchat یک vision model کوچک (few MB) که face landmark detect می‌کند و real-time روی iPhone و Android اجرا می‌شود. این experience میلیاردها بار در روز اجرا می‌شود — هر میلی‌وات battery حیاتی است.

📸

Google Pixel Camera AI

Google Pixel یک vision pipeline روی Tensor SoC اجرا می‌کند — Magic Eraser، Night Sight، Portrait Mode همه با AI on-device. این feature ها advantage مزیت رقابتی Pixel در برابر iPhone هستند.

Wearable AI (Apple Watch, Whoop)

Apple Watch با Neural Engine کوچک خودش، AFib detection، fall detection و workout classification را روی wrist اجرا می‌کند — power budget ۱۰۰ میلی‌وات. این چالش extreme است.

🚁

Drone & Robot Perception

Skydio drone با Jetson Orin، vision-based obstacle avoidance و subject tracking real-time اجرا می‌کند. این workload روی drone باطری‌دار با constraint power شدید.

تخصص‌های مختلف متخصص هوش مصنوعی لبه

این شغل یک عنوان واحد نیست — مسیرهای تخصصی متعددی دارد

📱

Mobile AI (iOS / Android)

Mobile AI (iOS / Android)

تخصص در deploy کردن AI روی phone — Core ML، TF Lite، NNAPI. کارفرماهای اصلی: Apple، Google، Samsung، Snapchat، Meta.

🚗

Automotive و ADAS

Automotive & ADAS

تخصص در vision و sensor fusion روی automotive SoC — Tesla HW4، NVIDIA DRIVE، Mobileye EyeQ. کارفرماهای اصلی: Tesla، Waymo، Mercedes، Bosch.

🤖

Robotics و Drones

Robotics & Drones

تخصص در perception و control روی robotic platform — Jetson، ROS. کارفرماهای اصلی: Boston Dynamics، Skydio، Anduril، Figure.

Wearables و IoT

Wearables & IoT

تخصص در ML روی device با microwatt budget — Apple Watch، Oura، Whoop، Amazon Echo. کارفرماهای اصلی: Apple، Amazon، Garmin، Whoop.

🔧

NPU Compiler و Toolchain

NPU Compiler / Toolchain

تخصص در compiler، runtime و SDK برای NPU — MLIR، IREE، vendor SDK. کارفرماهای اصلی: NVIDIA، Qualcomm، Apple، MediaTek، Tenstorrent.

تفاوت با شغل‌های مشابه

کجا این شغل تمام می‌شود و شغل دیگری شروع می‌شود؟

توسعه‌دهنده موبایلMobile Developer

Mobile Developer روی app logic، UI و platform API کار می‌کند. Edge AI Specialist روی model و inference engine. اکثر mobile developer ها از TensorFlow Lite استفاده می‌کنند بدون اینکه عمق quantization یا NPU architecture را بدانند. Edge AI Specialist این عمق را دارد.

مهندس EmbeddedEmbedded Engineer

Embedded Engineer روی firmware، driver، RTOS کار می‌کند بدون focus خاص روی AI. Edge AI Specialist بر سر AI workload متمرکز است اما باید embedded fundamentals را بفهمد. overlap قابل توجه — اکثر Edge AI Specialist ها از embedded background می‌آیند.

Inference Engineer (Cloud)Inference Engineer (Cloud)

Inference Engineer cloud با GPU شدید قوی (H100، Blackwell) کار می‌کند. Edge AI Specialist با hardware بسیار محدودتر (NPU < 100 TOPS، RAM چند گیگابایت) کار می‌کند. مهارت ها overlap دارد (quantization، profiling) اما scale و constraint متفاوت است.

مهندس MLML Engineer

ML Engineer روی training و model architecture کار می‌کند. Edge AI Specialist روی deploy کردن آن model روی edge. در شرکت‌های کوچک یک نفر هر دو نقش را دارد. در big tech، Edge AI Specialist تخصصی است که با ML Engineer collaborate می‌کند.

تأثیر در صنایع مختلف

متخصص هوش مصنوعی لبه در همه صنایع مشغول به کار است — نه فقط شرکت‌های فناوری

📱

Smartphone Manufacturers

Apple، Samsung، Google Pixel، Xiaomi — همه در حال race برای on-device AI superiority. AI features تبدیل به key differentiator خرید phone شده.

🚗

Automotive (ADAS, Autonomous)

Tesla، Waymo، Cruise، Mercedes، BMW — vision و sensor fusion روی automotive SoC. industry در حال investment $100B+ در L2-L4 autonomy.

🤖

Robotics & Defense

Boston Dynamics، Anduril، Skydio، Figure، Tesla Optimus — همگی نیاز شدید به Edge AI specialist برای perception و planning روی robot.

🔌

Hardware Vendors

Qualcomm، NVIDIA، MediaTek، Hailo، Sima.ai — همه در race برای build کردن بهترین NPU برای edge AI workload.

Wearables & Health

Apple Watch، Whoop، Oura، Garmin — health AI روی wrist با battery extreme constraint.

🏠

Smart Home & IoT

Amazon Echo، Google Nest، Ring، Arlo — voice و vision AI روی device برای privacy و responsiveness.

🥽

AR/VR Devices

Meta Quest، Apple Vision Pro، Snap Spectacles — تمام AI workload روی headset، با constraint extreme thermal و weight.

🏭

Industrial IoT

Siemens، GE، Honeywell، Bosch — edge AI در factory floor، predictive maintenance، quality control.

تصورات غلط رایج

قبل از تصمیم‌گیری، این باورهای اشتباه را بشناسید

Edge AI همان cloud AI است که کوچک‌تر شده

نه. Edge AI requires expertise در embedded systems، hardware architecture و compiler که cloud engineer ندارد. یک Edge AI Specialist باید بداند چطور یک operator خاص روی Apple Neural Engine اجرا می‌شود vs CPU — knowledge که در cloud استفاده نمی‌شود.

quantization فقط mobile inference را slow می‌کند

برعکس. NPU های مدرن INT8 و INT4 native support دارند و سریع‌تر از FP16 اجرا می‌کنند. Apple Neural Engine ۱۰x سریع‌تر در INT8 vs FP32. quantization در edge ضروری است، نه optional.

هر مدلی که در PyTorch کار می‌کند می‌تواند به Core ML تبدیل شود

اشتباه. Core ML subset محدودی از PyTorch operator ها را support می‌کند. اگر مدل از operator رایج (مثل scatter advanced) استفاده می‌کند، conversion fail می‌شود یا fallback به CPU می‌رود. باید مدل را با constraint های NPU در نظر design کنید.

Apple Neural Engine یک black box است

بله، تا حد زیادی — Apple architecture ANE را public نکرده. اما با reverse engineering و profiling، می‌توان understanding خوبی به دست آورد. ابزار Espresso framework و coremltools profiler کمک می‌کنند. edge AI specialist های experienced empirically می‌دانند چه operator هایی روی ANE سریع هستند.

LLM روی phone فقط gimmick است

نه. Apple Intelligence (۲۰۲۴) ثابت کرد که LLM ۳B روی iPhone می‌تواند مفید باشد — privacy، latency، offline. در ۲۰۲۶ on-device LLM یک expectation در flagship phone است. Edge AI Specialist های که این تخصص را دارند بسیار demanded هستند.

یک روز کاری واقعی

در هر سطح روز کاری چه شکلی است؟

جونیور (۰–۲ سال)

بیشتر روز را روی convert مدل با coremltools یا TF Lite Converter، benchmark روی device، و debug numerical accuracy issue می‌گذرانید. شروع به فهمیدن NPU architecture و mobile profiling.

  • صبح: مرور metric های benchmark شب قبل روی device test farm
  • بلاک اول: convert یک model PyTorch به Core ML با coremltools، fix کردن یک operator unsupported
  • بعد از ناهار: profiling مدل با Xcode Instruments روی iPhone، identify bottleneck
  • عصر: pairing با senior روی debug کردن یک accuracy regression بعد از INT8 quantization
  • پایان روز: مطالعه paper جدید (MobileLLM یا مشابه)

Mid-Level Edge AI Specialist (۲–۵ سال)

ownership از یک model pipeline (vision یا speech). نوشتن C++ code production-quality، co-design با hardware team، و mentor کردن junior ها.

  • صبح: مرور device farm metric ها — هر regression در FPS یا power را diagnose کنید
  • بلاک کدنویسی: implement یک custom Core ML operator برای attention variant جدید
  • جلسه: review feature request یک product team — تخمین feasibility روی current hardware
  • بعد از ناهار: profiling یک LLM روی Snapdragon Hexagon DSP
  • عصر: نوشتن technical report برای team meeting هفتگی

Senior / Principal Edge AI Engineer (۵+ سال)

owner architecture edge AI کل organization. تصمیم‌گیری strategic در hardware-software co-design، influence cross-team، و representation در industry standard.

  • صبح: مرور reliability metric ها و حضور در platform sync با VP
  • جلسه با hardware team: discussion روی NPU generation بعدی feature set
  • تصمیم: prioritize کردن سه feature platform برای quarter آینده
  • بعد از ناهار: interview یک staff candidate — focus روی system architecture و hardware expertise
  • عصر: نوشتن RFC برای migration به یک compiler infrastructure جدید (MLIR-based)

مسئولیت‌ها و وظایف

مسئولیت‌های اصلی

وظایف روزانه و مهارت‌های مورد نیاز در این شغل

فنی
  • convert و optimize مدل برای target hardware (mobile، embedded، NPU)
  • quantization و pruning مدل تا fit در memory و power budget دستگاه
  • نوشتن inference code C++/Objective-C/Swift برای deploy روی device
  • benchmarking model روی hardware واقعی — latency، throughput، power
  • co-design با hardware team برای feature های NPU/DSP جدید
  • debug numerical accuracy issue ها بین مدل cloud و edge
مهارت نرم
  • نوشتن documentation و sample code برای developer ها
  • همکاری با product team برای trade-off بین quality و performance

مهارت‌های مورد نیاز

مهارت‌های فنی، نرم و حوزه‌ای که یک متخصص هوش مصنوعی لبه موفق به آن‌ها نیاز دارد

Embedded و Systems

Modern C++ضروری

C++17/20، RAII، template، memory management دستی

ARM Architectureضروری

Cortex-A، Cortex-M، NEON SIMD، SVE

Linux Embeddedمهم

Yocto، Buildroot، kernel module، device tree

RTOSمفید

FreeRTOS، Zephyr، scheduling، interrupt

Cross-Compilationضروری

CMake، Bazel، toolchain برای ARM، RISC-V

Power Profilingمهم

اندازه‌گیری energy، thermal throttling، DVFS

Driver & Kernelمفید

DMA، interrupt، MMIO — برای NPU integration

ML و Optimization

Quantization Deepضروری

PTQ، QAT، GPTQ، AWQ، INT8/INT4/INT2

Model Pruningضروری

magnitude pruning، structured 2:4، channel pruning

Knowledge Distillationمهم

teacher-student، soft labels، intermediate matching

Mobile Frameworksضروری

TF Lite، Core ML، ONNX Runtime، ExecuTorch

NPU Programmingضروری

Hexagon DSP، Apple Neural Engine، Edge TPU

Compiler Optimizationمهم

MLIR، IREE، TVM — operator fusion، scheduling

Profiling Toolsضروری

Xcode Instruments، Android Profiler، Jetson Power

Mobile Platforms و Soft Skills

Swift / Objective-Cضروری

برای deploy روی iOS و macOS

Kotlin / Java Androidضروری

برای deploy روی Android، JNI integration

Pythonضروری

برای model conversion و automation pipeline

On-Device LLMضروری

llama.cpp، MLX، MLC-LLM — frontier جدید

Cross-Platform Designمهم

design API که روی iOS، Android، embedded کار کند

Technical Writingمهم

نوشتن SDK docs، API reference، sample code

ضروری — بدون آن نمی‌توان وارد بازار کار شدمهم — تفاوت بین جونیور و میانیمفید — مزیت رقابتی

نقشه راه و مسیر آموزشی

نقشه راه تبدیل شدن به متخصص هوش مصنوعی لبه

این مسیر گام به گام شما را از صفر تا حرفه‌ای هدایت می‌کند.

1

Embedded Systems و C/C++

⏱️ ۳ تا ۴ ماه

پایه قوی embedded — C/C++، memory management، interrupt، driver — اساس Edge AI

Modern C++ (C++17/20)Memory Management (no GC)RTOS BasicsARM ArchitectureLinux Kernel BasicsCross-Compilation Toolchains
2

Deep Learning و Mobile Frameworks

⏱️ ۳ تا ۴ ماه

تسلط بر deep learning و frameworks edge — TensorFlow Lite، Core ML، ONNX Runtime، ExecuTorch

PyTorch & TensorFlowTensorFlow LiteCore ML (Apple)ONNX & ONNX RuntimeExecuTorch (Meta)MediaPipe
3

Model Optimization و Quantization

⏱️ ۳ تا ۴ ماه

هنر فشرده‌سازی مدل — quantization، pruning، knowledge distillation، NAS

INT8 / INT4 QuantizationPost-Training Quantization (PTQ)Quantization-Aware Training (QAT)Pruning (Magnitude, Structured)Knowledge DistillationNeural Architecture Search (NAS)
4

Hardware Accelerator و NPU

⏱️ ۲ تا ۳ ماه

آشنایی با NPU، DSP، GPU mobile — Apple Neural Engine، Qualcomm Hexagon، Google Edge TPU

Apple Neural Engine (ANE)Qualcomm Hexagon DSPGoogle Edge TPU & CoralNVIDIA JetsonARM Mali GPUARM Ethos NPU
5

On-Device LLM و Production

⏱️ مداوم

frontier جدید — اجرای LLM روی edge با MLX، llama.cpp، MLC-LLM و چالش‌های production

llama.cpp (GGUF Format)MLX (Apple Silicon)MLC-LLMOn-Device Fine-Tuning (LoRA)Privacy-Preserving InferenceOTA Model Updates

ابزارها و استک فنی

ابزارهایی که هر مهندس AI باید بشناسد، دسته‌بندی‌شده بر اساس اولویت

Mobile Inference Frameworks

TensorFlow Lite

framework غالب edge inference Google — Android و embedded Linux

ضروری
Core ML (Apple)

framework Apple برای iOS، iPadOS، macOS — متصل به Apple Neural Engine

ضروری
ONNX Runtime

cross-platform inference runtime — Microsoft، support وسیع hardware

ضروری
ExecuTorch (Meta)

PyTorch-native edge inference — جدید اما در حال رشد سریع

مفید

On-Device LLM

llama.cpp

implementation C++ سبک برای LLM روی CPU و edge — استاندارد open-source

ضروری
MLX (Apple)

framework Apple برای ML روی Apple Silicon — unified memory architecture

ضروری
MLC-LLM

TVM-based compiler برای LLM روی هر hardware (mobile، WebGPU، embedded)

مفید
Ollama

wrapper user-friendly روی llama.cpp — popular در local LLM community

مفید

Hardware Platforms

NVIDIA Jetson

platform غالب edge AI با GPU — Jetson Orin Nano تا AGX Orin

ضروری
Qualcomm Snapdragon

SoC غالب Android phones — با Hexagon NPU و Adreno GPU

ضروری
Apple Silicon (A/M Series)

SoC Apple با Neural Engine 16-core — iPhone، iPad، Mac

ضروری
Google Coral Edge TPU

ASIC پایین مصرف Google برای edge inference — popular در IoT

مفید

Optimization و Profiling

TensorFlow Lite Model Maker

ابزار automated برای quantization و conversion

ضروری
Core ML Tools (coremltools)

Python library برای convert کردن PyTorch/TF به Core ML

ضروری
NNAPI Benchmark

Android Neural Networks API برای benchmark mobile inference

مفید
Qualcomm SNPE

Snapdragon Neural Processing Engine SDK — optimization مدل برای Hexagon

مفید
ضروری — باید یاد بگیریدمفید — ارزش یادگیری داردپیشرفته — برای سطوح ارشد

مسیر پیشرفت شغلی

از جونیور تا Staff Engineer — چه مهارت‌هایی نیاز دارید و چه درآمدی انتظار داشته باشید

Junior Edge AI Engineer

۰ تا ۲ سال

~$140K

میانگین سالانه (آمریکا)

convert کردن مدل به TF Lite/Core ML، benchmark روی device، یادگیری hardware-specific quirks

PythonPyTorch/TFTF LiteMobile SDK BasicsLinux

Mid-Level Edge AI Specialist

۲ تا ۵ سال

~$215K

میانگین سالانه (آمریکا)

ownership از یک model pipeline، quantization advanced، optimization NPU، debug performance issue

C++ EmbeddedINT8/INT4 QuantizationNPU ProgrammingProfilingModel Compression

Senior Edge AI Engineer

۵ تا ۹ سال

~$360K

میانگین سالانه (آمریکا)

طراحی architecture model برای edge، co-design با hardware team، mentor، influence cross-team

Hardware-Software Co-DesignOn-Device LLMSystem ArchitectureTechnical LeadershipCross-Platform

Principal Edge AI Architect

۹+ سال

~$580K

میانگین سالانه (آمریکا)

تعیین strategy AI edge برای سازمان، نوشتن RFC و paper، influence platform roadmap

AI Hardware ArchitectureIndustry Standard InfluencePlatform StrategyPatent PortfolioExecutive Communication

چالش‌ها و جنبه‌های منفی

واقعیت‌هایی که کمتر در آگهی‌های شغلی می‌بینید — قبل از ورود بدانید

Memory Footprint محدود

تحقیقاتی

phone با ۶-۸ گیگابایت RAM، watch با ۱ گیگابایت، microcontroller با KB. fit کردن یک مدل ۳B در iPhone (با INT4 = ~۱.۵GB) چالش بزرگ است — هر megabyte اهمیت دارد. باید با OS و apps دیگر شریک باشید.

Power Budget و Thermal

عمومی

phone می‌تواند ۲-۴ وات sustained مصرف کند. اگر بیش از این باشید، throttle می‌شود (slow) یا hot می‌شود (user complaint). watch با ۱۰۰mW. Edge AI Specialist باید هر inference را برای minimum energy optimize کند.

Operator Fragmentation

تحقیقاتی

Core ML، TF Lite، NNAPI، Hexagon هر کدام subset متفاوت operator ها را support می‌کنند. یک مدل خاص ممکن است fully optimized روی ANE اجرا شود اما روی Hexagon fall-back به CPU شود. این یعنی testing extensive روی هر hardware target.

Numerical Accuracy Debug

تحقیقاتی

quantization می‌تواند subtle bug ایجاد کند که فقط روی certain input ها ظاهر شود. مثلاً FP16 overflow در یک activation map. debug این bug روی device بسیار سخت است — نیاز به test suite extensive و logging careful.

Vendor SDK Quality

شرکت بزرگ

Apple، Qualcomm، MediaTek هر کدام SDK خودشان دارند که کیفیت آن‌ها متفاوت است. اغلب با bug، documentation ضعیف یا undocumented behavior روبرو می‌شوید. باید patience و troubleshooting capability داشته باشید.

Hardware Evolution سریع

شرکت بزرگ

هر سال generation جدید NPU با feature های جدید. iPhone 15 ANE با INT8 native، iPhone 17 احتمالاً با INT4. Edge AI Specialist باید روی این evolution سوار بماند و migration plan برای software stack داشته باشد.

حقوق و بازار کار جهانی

حقوق جهانی متخصص هوش مصنوعی لبه

میانگین حقوق سالانه بر اساس تجربه در کشورهای مختلف

کشورمیانهارز
🇰🇷کره جنوبی
₩175,000,000KRW
🇯🇵ژاپن
¥18,000,000JPY
🇮🇳هند
₹6,500,000INR
🇺🇸آمریکا
$360,000USD
🇸🇬سنگاپور
SGD 250,000SGD
🇨🇦کانادا
CA$240,000CAD
🇬🇧انگلستان
£175,000GBP
🇩🇪آلمان
€145,000EUR

* ارقام سالانه و تقریبی هستند و بر اساس میانگین بازار در سال ۲۰۲۵ محاسبه شده‌اند.

چگونه از صفر شروع کنیم

برنامه گام‌به‌گام برای ورود به مهندسی هوش مصنوعی

ماه ۱: Mobile AI Basics

TensorFlow Lite tutorial، convert یک مدل MobileNet و deploy روی Raspberry Pi.

ماه ۲: Quantization Hands-On

INT8 PTQ روی MobileNetV3، measure accuracy degradation و speedup.

ماه ۳: iOS Core ML

coremltools tutorial، deploy یک vision model روی iPhone، profile با Xcode Instruments.

ماه ۴: Jetson و Robotics

Jetson Nano setup، deploy YOLOv8 با TensorRT، real-time camera inference.

ماه ۵: On-Device LLM

llama.cpp تجربه با Phi-3 یا Llama-3.2-1B روی Mac یا phone.

ماه ۶: Portfolio و Apply

GitHub با ۳ پروژه strong، blog post، apply Junior Edge AI roles.

پروژه‌های پیشنهادی برای رزومه

Image Classification روی Raspberry Pi

مبتدی

یک مدل MobileNetV3 train کنید، با TensorFlow Lite به INT8 quantize کنید، روی Raspberry Pi 4 deploy کنید. throughput (FPS) و accuracy degradation را measure کنید.

TensorFlow LiteRaspberry PiMobileNetPython
زمان تخمینی: ۳ هفته

Object Detection روی Jetson Nano

متوسط

YOLOv8 را با TensorRT optimize کنید و روی Jetson Nano deploy کنید. real-time inference (>30 FPS) از یک USB camera. metric مهم: mAP، FPS، power consumption.

TensorRTJetson NanoYOLOv8DeepStream
زمان تخمینی: ۵ هفته

On-Device Speech Recognition iOS

متوسط

Whisper-tiny را با coremltools convert کنید، یک iOS app بسازید که real-time speech-to-text روی iPhone اجرا کند. Apple Neural Engine را به‌طور بهینه استفاده کنید.

Core MLWhisperSwiftXcode
زمان تخمینی: ۶ هفته

LLM روی Phone با MLC-LLM

پیشرفته

یک مدل ۱-۳B (Phi-3-mini یا Llama-3.2-1B) را با MLC-LLM به یک Android یا iOS phone deploy کنید. throughput (token/sec) و memory footprint را measure کنید. در blog post متد را share کنید.

MLC-LLMTVMAndroid/iOSLLM Quantization
زمان تخمینی: ۸ هفته

Custom NPU Compiler با MLIR

پیشرفته

یک کامپایلر کوچک با MLIR/IREE بسازید که یک operator graph را به code برای یک fake NPU compile کند. این پروژه publication-level است و برای hardware vendor ها valuable.

MLIRLLVMIREEC++
زمان تخمینی: ۱۲ هفته

مثال‌های واقعی و Case Studies

داستان‌های واقعی از مهندسانی که در این حوزه تأثیرگذار بوده‌اند

S

Song Han

پیشینه

Associate Professor در MIT EECS، PhD از Stanford زیر نظر Bill Dally (VP NVIDIA). متخصص efficient deep learning و co-founder Deep Compression startup ها.

دستاورد

Song Han در ۲۰۱۵ paper Deep Compression را معرفی کرد که با ترکیب pruning، quantization و Huffman coding مدل ها را ۳۵-۴۹x کوچک کرد. این paper Best Paper Award در ICLR 2016 گرفت و حالا یکی از پر-cite شده‌ترین paper های efficient ML است. در MIT یک گروه ساخت که قبل از همه روی AWQ، SmoothQuant، StreamingLLM و دیگر technique های فشرده‌سازی LLM کار کرد. course MIT 6.5940 'TinyML and Efficient Deep Learning' که او درس می‌دهد یکی از مهم‌ترین منابع آموزشی edge AI است. در ۲۰۱۸ co-founder DeePhi Tech بود که در ۲۰۱۸ توسط Xilinx (و بعداً AMD) acquired شد. در ۲۰۲۲ NVIDIA Distinguished Engineer شد و در ۲۰۲۴ MacArthur Fellowship گرفت.

درس کلیدی

edge AI نیاز به ترکیب academic depth و practical engineering دارد. Song Han نشان می‌دهد که paper publication، startup founder شدن و teaching می‌توانند با هم coexist کنند. توصیه برای Edge AI Specialist جوان: course MIT 6.5940 را تماشا کنید و paper های گروه Han را بخوانید — این بهترین foundation theoretical است.

P

Pete Warden

پیشینه

Founder Useful Sensors، former Tech Lead TensorFlow Mobile و TensorFlow Lite در Google. متخصص on-device ML و یکی از پایه‌گذاران TinyML community.

دستاورد

Warden در Google از ۲۰۱۴ تا ۲۰۲۲ روی TensorFlow Mobile و سپس TensorFlow Lite کار کرد — همان framework که حالا روی میلیاردها Android device اجرا می‌شود. کتاب 'TinyML: Machine Learning with TensorFlow Lite on Arduino and Ultra-Low-Power Microcontrollers' (۲۰۱۹) با Daniel Situnayake استاندارد آموزشی شد. در ۲۰۲۲ Useful Sensors را تأسیس کرد — یک startup که AI-on-chip module های ۱$ می‌سازد که در smart home و IoT استفاده می‌شوند. به‌طور پیوسته در blog و Twitter درباره edge AI می‌نویسد و یکی از مهم‌ترین صداهای community است.

درس کلیدی

TinyML یک niche بسیار interesting است — AI روی microcontroller با KB memory. Warden نشان می‌دهد که با focus روی این niche می‌توان business سرگرم‌کننده ساخت. توصیه: کتابش را بخوانید و یک پروژه TinyML با Arduino یا ESP32 شروع کنید — این یک differentiator حرفه‌ای خوب است.

A

Awni Hannun

پیشینه

Research Scientist در Apple و قبل از آن در Facebook AI Research. PhD از Stanford زیر نظر Andrew Ng. lead developer MLX، framework Apple Silicon ML.

دستاورد

Hannun در ۲۰۲۳ به Apple پیوست و در ۲۰۲۳ پروژه MLX را معرفی کرد — یک framework ML native برای Apple Silicon که از unified memory architecture استفاده می‌کند. MLX به‌سرعت در researcher و developer community popular شد و در ۲۰۲۴-۲۰۲۵ به maturity production-grade رسید. در Facebook AI، Hannun co-author paper Deep Speech بود (یکی از مهم‌ترین paper های speech recognition با deep learning). در Apple، روی Apple Intelligence و on-device LLM کار کرده. در Twitter یکی از صداهای influential در Apple Silicon ML community است.

درس کلیدی

framework جدید می‌تواند یک niche بسیار rewarding باشد. MLX از صفر طراحی شد برای Apple Silicon — هیچ legacy از CUDA. این فلسفه fresh یک مزیت بزرگ بود. توصیه برای Edge AI Specialist: یاد بگیرید MLX را، PR contribute کنید، و در community visible باشید — این یک fast path برای جوب در Apple است.

نمونه آگهی استخدام واقعی + تحلیل

یک آگهی واقعی از شرکت فعال در حال استخدام، با تحلیل هر بخش

Machine Learning Engineer - On-Device Intelligence

Appleکوپرتینو / سیاتل / زوریخ2026-02
مشاهده آگهی اصلی

تحلیل نیازمندی‌ها

EN

MS or PhD in Computer Science, Electrical Engineering, or related field

Apple education academic strong را value می‌کند، اما PhD ضروری نیست. اگر MS با تجربه strong industry دارید، competitive هستید. expectations از candidate ها بسیار بالاست — به‌خصوص در عمق technical.

مهم
EN

Strong programming skills in C++, Python, and Swift

Apple stack ترکیبی است — Core ML در C++ و Swift، model conversion در Python. باید در هر سه comfortable باشید. این متفاوت از cloud ML است که فقط Python غالب است.

ضروری
EN

Experience with on-device ML frameworks (Core ML, TensorFlow Lite, PyTorch Mobile)

knowledge عمیق Core ML اولویت دارد چون Apple internal است. tutorial و WWDC session ها را تماشا کنید. apply کسانی که فقط TF Lite بلدند بدون Core ML challenge بزرگ‌تری در interview دارند.

ضروری
EN

Experience with model optimization techniques (quantization, pruning, distillation)

Apple expectation عمق در quantization دارد — نه فقط استفاده از tooling، بلکه understanding theoretical. در interview سؤالات detailed درباره quantization scheme، calibration data، numerical stability خواهد بود.

ضروری
EN

Familiarity with Apple Silicon and Apple Neural Engine architecture

Apple Neural Engine architecture proprietary است، اما با reading documentation، WWDC session ها و reverse engineering، می‌توان knowledge قابل توجه کسب کرد. apply candidates با experience قبلی ANE برتری دارند.

ضروری
EN

Strong communication and cross-functional collaboration skills

Apple با hardware team، product team و research team close work می‌کند. باید بتوانید technical detail را به non-technical stakeholders explain کنید. interview شامل cross-functional scenario است.

ضروری

تحلیل مسئولیت‌ها

EN

Develop and optimize ML models for deployment on Apple devices

این کار اصلی است. شما مدل را از research convert می‌کنید به production-ready Core ML model، با quantization و pruning، و deploy روی iOS/macOS/watchOS.

EN

Collaborate with hardware teams to enable new on-device features

Apple unique است در hardware-software integration. شما با hardware team در یک iteration close work می‌کنید — feedback روی NPU generation بعدی، co-design feature.

EN

Improve inference performance, memory footprint, and power efficiency

metric مهم Apple: latency، memory، power. هر improvement ۱۰٪ در یکی از این‌ها می‌تواند billions of device user experience را تغییر دهد. focus extreme روی efficiency.

EN

Research and integrate cutting-edge techniques from academia and industry

Apple فرهنگ secretive دارد اما به paper publication value می‌دهد. شما arXiv را پیگیری می‌کنید، technique جدید را prototype می‌کنید، و در صورت موفقیت ship می‌کنید (که گاهی ماه‌ها بعد به user می‌رسد).

نتیجه‌گیری کلی

Apple یکی از top destination ها برای Edge AI Specialist است. compensation strong (Senior $300-450K total با RSU)، impact billions of user، و challenge های منحصر به فرد (Apple Silicon، ANE، Apple Intelligence). فرهنگ Apple unique است — secretive، detail-oriented، perfectionist. apply کسانی که flexibility و workflow غیررسمی می‌خواهند، Apple ممکن است نگیرد. توصیه: deep dive Core ML، WWDC video ها، contribution به coremltools، GitHub portfolio با iOS demo. آماده شدن ۳-۶ ماه طول می‌کشد.

آینده و روندها

پیش‌بینی ۵–۱۰ ساله و مهارت‌هایی که باید یاد بگیرید

رشد ۳۸٪ سالانه (CAGR) تا ۲۰۳۰ — تقاضا برای Edge AI Specialist از ۶۰ هزار به ۲۸۰ هزار شغل در جهان می‌رسد

منبع: Gartner AI Edge Computing Forecast 2025 / IDC Worldwide AI on Device Spending Guide

مهارت‌های نوظهور که باید یاد بگیرید

On-Device LLM Deployment (Phi-3، Llama 3.2، Gemini Nano)Federated Learning و Privacy-Preserving TrainingOn-Device LoRA و Fine-TuningMulti-Modal Edge AI (Vision-Language-Action)Sub-INT8 Quantization (INT4، INT2، Binary)Neuromorphic Computing (Loihi، Akida)RISC-V NPU Architecture (با ecosystem جدید open)

پیش‌بینی‌های آینده

2026

On-device LLM به default feature flagship phone می‌شود — هر phone با NPU ≥ 30 TOPS و LLM ۳B+ ship خواهد شد

2027

Federated learning به mainstream می‌رسد با Apple، Google، Meta روی device collaborative training — privacy-preserving یک differentiator می‌شود

2028

Sub-INT8 quantization (INT4، INT2) به استاندارد می‌رسد — Edge AI Specialist های آشنا با theoretical foundations premium می‌گیرند

2030

Edge AI compute share از inference total از ۲۵٪ به ۵۰٪+ می‌رسد — این shift صنعت GPU را تغییر می‌دهد و talent demand را بالا می‌برد

ریسک‌های واقعی

ریسک اصلی commoditization در low-end است — task های routine model conversion قابل automation با tooling مدرن (TensorFlow Lite Model Maker، Apple Create ML) شده. کسانی که فقط basic conversion می‌دانند آسیب‌پذیرند. کسانی که در hardware-software co-design، compiler engineering و research-level optimization قوی هستند، demand بسیار بیشتر می‌شوند. ریسک دیگر: vendor lock-in. اگر فقط Core ML بلدید و Android NNAPI نمی‌دانید، vulnerable هستید در recruitment outside Apple. توصیه: cross-platform experience build کنید و یک layer abstraction روی vendor SDK بفهمید.

ویدیوهای آموزشی

برای راهنمایی شخصی‌سازی‌شده مشاوره بگیرید