🏛️
رتبه ۱۱ از ۱۰رشد ۹% سالانه

معمار داده

Data Architect

معمار داده طراح بلندمدت ساختار داده‌ها در سازمان است. این متخصص تصمیم می‌گیرد داده‌ها کجا ذخیره شوند، چگونه میان سیستم‌ها جریان یابند، چه استانداردهایی برای کیفیت و امنیت داشته باشند، و چطور پایگاه داده‌های عملیاتی، انبارهای داده و دریاچه‌های داده در کنار هم به یک پلتفرم منسجم تبدیل شوند. در عصر AI که سوخت اصلی مدل‌ها داده است، نقش معمار داده از یک تخصص فنی پشت‌صحنه به یکی از تأثیرگذارترین مشاغل استراتژیک سازمان تبدیل شده است.

Data ModelingSQLCloud WarehousingData GovernanceETL/ELT

مقدمه و تعریف شغل

معمار داده (Data Architect) متخصصی است که ساختار کلان داده‌ها در یک سازمان را طراحی می‌کند. اگر مهندس داده ساختمان را می‌سازد، معمار داده نقشه ساختمان را می‌کشد. این فرد تصمیم می‌گیرد چه پایگاه داده‌ای، چه انبار داده‌ای، چه فرمت ذخیره‌سازی، چه استانداردی برای نام‌گذاری و چه سیاستی برای دسترسی استفاده شود — تصمیماتی که سال‌ها روی توانایی شرکت برای تحلیل، گزارش‌گیری و آموزش مدل‌های AI اثر می‌گذارند.

تا یک دهه پیش، Data Architect معمولاً در گوشه‌ای از تیم IT می‌نشست و schema های Oracle/Teradata را طراحی می‌کرد. اما با ظهور cloud warehouses (Snowflake، BigQuery)، انفجار حجم داده، و مهم‌تر از همه، تبدیل شدن داده به سوخت اصلی AI، این نقش به یکی از تأثیرگذارترین مشاغل سازمان تبدیل شده است. طبق گزارش Glassdoor 2025، میانگین حقوق در آمریکا ۱۴۹,۰۰۰ دلار است و بر اساس BLS، رشد تقاضا تا ۲۰۳۲ حدود ۹٪ پیش‌بینی می‌شود — بسیار بالاتر از میانگین کل مشاغل. حالا یک معمار داده خوب هم به مدل ابعادی، هم به Data Mesh، هم به Feature Store برای ML، و هم به الزامات GDPR/CCPA باید مسلط باشد.

چه چیزی می‌سازید؟

مثال‌های واقعی از خروجی کار یک معمار داده

🏬

Enterprise Data Warehouse

یک شرکت خرده‌فروشی می‌خواهد ۸۰۰ فروشگاه را در یک گزارش روزانه ببیند. شما star schema با Sales fact + ۶ بُعد طراحی می‌کنید، روی Snowflake پیاده می‌شود و کوئری‌های ۲۰ گیگابایتی در چند ثانیه پاسخ می‌گیرند.

🌊

Data Lakehouse برای AI

تیم ML نیاز به دسترسی به ۵ سال داده خام رفتار کاربر دارد، اما تیم BI به aggregations سریع. شما یک Lakehouse با Iceberg طراحی می‌کنید که هر دو نیاز را با یک layer پاسخ می‌دهد.

Real-time Streaming Architecture

اپ تاکسی می‌خواهد قیمت پویا را در زمان واقعی محاسبه کند. شما معماری Kafka + Flink + materialized views طراحی می‌کنید که latency کمتر از ۲ ثانیه دارد.

🕸️

Data Mesh برای سازمان‌های بزرگ

یک بانک ۲۰ تیم محصول دارد و central data team گلوگاه شده. شما Data Mesh طراحی می‌کنید: هر تیم مالک data product خودش، یک catalog مشترک، قراردادهای داده استاندارد.

🤖

Feature Store برای ML

تیم ML شکایت می‌کند که هر مدل feature خودش را دوباره می‌نویسد. شما Feature Store طراحی می‌کنید که هم online (real-time) و هم offline (training) سرویس می‌دهد، با versioning و lineage.

📚

Data Catalog و Governance Platform

هیچ‌کس در شرکت نمی‌داند `revenue` در کدام جدول معتبر است. شما Catalog با Atlan راه‌اندازی می‌کنید، KPI ها را owner دار می‌کنید و lineage از منبع تا dashboard شفاف می‌شود.

تخصص‌های مختلف معمار داده

این شغل یک عنوان واحد نیست — مسیرهای تخصصی متعددی دارد

☁️

معمار انبار داده ابری

Cloud Data Warehouse Architect

تخصص در Snowflake/BigQuery/Redshift، مهاجرت از سیستم‌های legacy، بهینه‌سازی هزینه. پرتقاضاترین تخصص در ۲۰۲۵.

🕸️

معمار دیتا مش

Data Mesh Architect

طراحی دامنه‌محور برای سازمان‌های بزرگ، تعریف data products و قراردادهای داده میان تیم‌ها.

معمار سیستم‌های Real-time

Real-time / Streaming Architect

تخصص در Kafka، Flink، Materialized Views. مناسب برای fintech، ride-hailing و IoT.

🤖

معمار داده ML

ML Data Architect

طراحی Feature Store، training data pipelines و infrastructure داده برای تیم‌های AI/ML.

🛡️

معمار حاکمیت داده

Data Governance Architect

تمرکز روی catalog، lineage، privacy، compliance. در صنایع تنظیم‌شده مثل بانک و بیمه حیاتی.

تفاوت با شغل‌های مشابه

کجا این شغل تمام می‌شود و شغل دیگری شروع می‌شود؟

مهندس دادهData Engineer

Data Engineer روی پیاده‌سازی تمرکز دارد — کد می‌نویسد، Airflow DAG می‌سازد، dbt model اضافه می‌کند. Data Architect روی طراحی و استاندارد تمرکز دارد — تصمیم می‌گیرد چه ابزاری، چه معماری، چه استانداردی. در تیم‌های کوچک یک نفر هر دو نقش را دارد؛ از حدود ۳۰ مهندس به بالا این دو نقش جدا می‌شود.

مدیر پایگاه دادهDatabase Administrator (DBA)

DBA مسئول سلامت یک یا چند instance خاص است: backup، performance tuning، patching. Data Architect در سطح بالاتر فکر می‌کند: کدام دیتابیس انتخاب شود، چطور با بقیه ادغام شود، استانداردها چه باشند. در عصر cloud DW، نقش DBA کوچک‌تر شده اما Data Architect مهم‌تر.

معمار راهکارSolutions Architect

Solutions Architect در سطح کل سیستم (back-end، front-end، messaging، DB) طراحی می‌کند. Data Architect تخصصی روی لایه داده تمرکز دارد. اغلب در پروژه‌های بزرگ این دو با هم کار می‌کنند: Solutions Architect معماری کلی را طراحی می‌کند و Data Architect لایه داده آن را عمیق می‌سازد.

مهندس آنالیتیکسAnalytics Engineer

Analytics Engineer نقش جدیدی است که با ظهور dbt شکل گرفت — کسی که SQL/dbt می‌نویسد و مدل‌های تحلیلی می‌سازد، اما معماری زیربنایی را نمی‌چیند. می‌شود گفت Analytics Engineer مصرف‌کننده طراحی‌های Data Architect است.

تأثیر در صنایع مختلف

معمار داده در همه صنایع مشغول به کار است — نه فقط شرکت‌های فناوری

🏦

بانک و خدمات مالی

ساخت پلتفرم تک‌منبع برای Risk، Compliance و Anti-Fraud؛ پشتیبانی از گزارش‌های BCBS 239 و Basel III

🛒

خرده‌فروشی و E-commerce

معماری برای ۳۶۰-degree view مشتری، personalization در real-time و forecasting موجودی

🛡️

بیمه

پلتفرم داده برای underwriting مبتنی بر AI، تشخیص تقلب و actuarial modeling

🏥

بهداشت و درمان

معماری clinical data warehouse با HIPAA، یکپارچه‌سازی EHR ها و آماده‌سازی داده برای AI تشخیصی

📡

مخابرات

پلتفرم برای میلیاردها CDR در روز، شخصی‌سازی tariff و پیش‌بینی churn

🏭

صنعت و تولید

یکپارچه‌سازی داده‌های MES، ERP و IoT برای Predictive Maintenance و Digital Twin

📺

تبلیغات و رسانه

Clean room ها برای مبادله داده با شرکا، attribution در multi-touch و real-time bidding

🚚

حمل‌ونقل و لجستیک

Streaming architecture برای telematics، بهینه‌سازی مسیر و ETA پیش‌بینی‌شده

تصورات غلط رایج

قبل از تصمیم‌گیری، این باورهای اشتباه را بشناسید

Data Architect یعنی فقط ERD کشیدن

ERD بخش کوچکی از کار است. بیشتر وقت معمار داده صرف انتخاب فناوری، طراحی حاکمیت، مذاکره با تیم‌ها و ارزیابی trade-off های هزینه/عملکرد می‌شود.

با ظهور Cloud DW، Data Architect منسوخ می‌شود

برعکس. هر چه ابزار بیشتر می‌شود، تصمیم‌گیری بین آن‌ها سخت‌تر می‌شود. Snowflake و Databricks خود به خود معماری خوب نمی‌سازند — به کسی نیاز است که trade-off ها را بشناسد.

Data Mesh جایگزین Data Warehouse است

Data Mesh یک رویکرد سازمانی است، نه یک فناوری. در عمل، هر Data Product در Data Mesh معمولاً از همان warehouse یا lakehouse استفاده می‌کند. این دو رقیب نیستند.

Data Architect باید کد ننویسد

معمار خوب همچنان SQL می‌نویسد، dbt model می‌سازد و گاهی Python اسکریپت می‌زند. کسی که سال‌هاست hands-on نیست، طرح‌های ناممکن می‌کشد.

این نقش فقط برای دانش‌آموختگان CS است

بسیاری از معمارهای داده برتر از مسیرهای DBA، BI، یا حتی business analyst آمده‌اند. مهم درک عمیق از مدل داده و کسب‌وکار است، نه مدرک خاص.

یک روز کاری واقعی

در هر سطح روز کاری چه شکلی است؟

میانی (۳–۶ سال)

تعادل بین طراحی و پیاده‌سازی. حدود ۴۰٪ وقت روی کد و SQL، ۴۰٪ روی طراحی و مستند، ۲۰٪ جلسات با stakeholderها.

  • صبح: بررسی PR های dbt تیم و کامنت‌گذاری روی مدل‌های ابعادی
  • جلسه ۱ ساعته با تیم محصول: نیاز جدید به یک KPI پیچیده، طراحی fact table مناسب
  • بلاک طراحی: نوشتن ADR (Architecture Decision Record) برای انتخاب Iceberg در پروژه جدید
  • بعد از ناهار: pair با Data Engineer روی refactor یک pipeline بحرانی
  • عصر: workshop کوتاه با تیم تحلیل درباره استاندارد نام‌گذاری ستون‌ها

ارشد (۶–۱۰ سال)

تمرکز روی طراحی و استانداردسازی در سطح چند تیم. ۲۰٪ کد، ۵۰٪ معماری و مستند، ۳۰٪ ارتباط با مدیران و مشاوره با تیم‌های دیگر.

  • صبح: review طراحی Data Mesh یک دامنه جدید و نوشتن feedback مفصل
  • جلسه با CDO: ارائه نقشه ۱۸ ماهه مهاجرت از Teradata به Lakehouse
  • بلاک معماری: طراحی Feature Store مشترک بین ۳ تیم ML
  • بعد از ناهار: deep dive روی هزینه‌های Snowflake و طرح بهینه‌سازی برای کاهش ۳۰٪
  • عصر: مصاحبه فنی با کاندیدای Senior Data Engineer + 1:1 با عضو جدید تیم

Principal / Chief (۱۰+ سال)

تقریباً بدون کدنویسی روزمره. تمرکز روی استراتژی داده شرکت، مذاکره با vendor ها، نمایندگی فنی در سطح C-suite و گاهی هیئت‌مدیره.

  • صبح: تهیه deck برای Board meeting: تأثیر استراتژی AI روی پلتفرم داده ۳ سال آینده
  • جلسه با تیم Legal و DPO: ارزیابی ریسک GDPR در پروژه AI جدید
  • مذاکره با Snowflake/Databricks برای قرارداد ۳ ساله enterprise
  • بعد از ناهار: مرور architecture review board و رای روی ۲ طرح کلیدی
  • عصر: نوشتن مقاله داخلی درباره data strategy برای تمام تیم‌های engineering

مسئولیت‌ها و وظایف

مسئولیت‌های اصلی

وظایف روزانه و مهارت‌های مورد نیاز در این شغل

فنی
  • طراحی مدل داده مفهومی، منطقی و فیزیکی برای سیستم‌های جدید
  • انتخاب فناوری‌های پلتفرم داده (DW، Lake، Streaming) بر اساس نیازها و بودجه
  • تعریف استانداردهای نام‌گذاری، نسخه‌بندی و قراردادهای داده در سطح شرکت
  • بازنگری معماری پایپ‌لاین‌ها و سیستم‌های BI برای بهینه‌سازی هزینه و عملکرد
  • طراحی سیاست‌های حاکمیت داده، Lineage و Catalog در همکاری با تیم Compliance
  • همکاری با تیم ML برای طراحی Feature Store و pipeline های آماده‌سازی داده مدل‌ها
مهارت نرم
  • ترجمه نیازهای کسب‌وکار (KPIs، گزارش‌ها، AI use cases) به ساختار داده مناسب
  • ارائه طراحی‌ها در architecture review board و گرفتن buy-in از stakeholderها

مهارت‌های مورد نیاز

مهارت‌های فنی، نرم و حوزه‌ای که یک معمار داده موفق به آن‌ها نیاز دارد

مهارت‌های فنی

SQL پیشرفتهضروری

Window functions، CTE های بازگشتی، query plan reading و بهینه‌سازی کوئری‌های پیچیده

Dimensional Modelingضروری

Star/Snowflake schema، SCD انواع 1/2/3، طراحی fact ها (transactional, periodic snapshot, accumulating snapshot)

Cloud Data Warehousesضروری

تسلط عملی بر حداقل یکی از Snowflake، BigQuery یا Redshift — معماری، billing و tuning

dbt و Analytics Engineeringضروری

طراحی پروژه dbt مدولار، تست‌ها، مستندسازی و exposures برای BI

ETL/ELT و ارکستراسیونمهم

Airflow، Prefect یا Dagster — طراحی DAG های ایمن، retry strategy، SLA و observability

Data Governanceمهم

Cataloging، Data Lineage، Master Data Management، ownership و data contracts

Streaming Architectureمهم

Kafka، Flink، Kinesis — درک trade-off بین batch و stream و معماری Lambda/Kappa

Privacy و Complianceمهم

GDPR، CCPA، HIPAA، Tokenization، Differential Privacy و data residency

Cost & Performance Optimizationمهم

Partitioning، Clustering، Materialized Views، Caching و budget management در cloud DW

Data Mesh / Domain-Driven Designمفید

طراحی سازمانی دامنه‌محور برای مقیاس‌پذیری تیم‌های داده

مهارت‌های نرم

ارتباط با کسب‌وکارضروری

ترجمه نیازهای مالی، مارکتینگ و عملیات به مدل داده — بدون نیاز به جزئیات فنی

Stakeholder Managementضروری

هم‌راستا کردن تیم محصول، مهندسی، تحلیل و رهبری — هرکدام علایق متضاد دارند

Architecture Storytellingضروری

ارائه طرح به مدیران ارشد با diagram های روشن و trade-off های شفاف

Long-term Thinkingمهم

توانایی فکر کردن به نتایج تصمیم در افق ۳–۵ ساله، نه فقط sprint بعدی

Mentoringمهم

تربیت data engineers تیم برای تفکر معمارانه، نه فقط پیاده‌سازی سریع

دانش حوزه‌ای

Domain Modeling صنعت هدفمهم

آشنایی عمیق با مدل داده استاندارد یک صنعت (مثلاً FIBO در مالی، HL7 در درمان)

AI/ML Data Readinessمهم

درک نیازهای داده تیم‌های ML: training data، feature engineering، monitoring drift

Regulatory Reportingمهم

در صنایع تنظیم‌شده: ساخت data lineage که audit ها را پاس کند

TOGAF / Enterprise Architectureمفید

چارچوب رسمی architecture برای ارتباط با enterprise architect های دیگر

ضروری — بدون آن نمی‌توان وارد بازار کار شدمهم — تفاوت بین جونیور و میانیمفید — مزیت رقابتی

نقشه راه و مسیر آموزشی

نقشه راه تبدیل شدن به معمار داده

این مسیر گام به گام شما را از صفر تا حرفه‌ای هدایت می‌کند.

1

پایه‌های پایگاه داده و SQL پیشرفته

⏱️ ۳ تا ۴ ماه

تسلط بر مدل رابطه‌ای، نرمال‌سازی، SQL پیشرفته و طراحی شِما در سطح کاربردی — این پایه‌ای است که بدون آن هیچ معماری سالم ساخته نمی‌شود.

SQL پیشرفته (Window Functions, CTE)Normalization تا 3NF/BCNFIndexing و Query PlanPostgreSQL یا SQL ServerERD و طراحی شِماTransactions و ACIDStored Procedures
2

مدل‌سازی داده و انبار داده

⏱️ ۳ تا ۴ ماه

یادگیری مدل‌های ابعادی (Kimball)، مدل‌های نرمال‌سازی‌شده برای انبار داده (Inmon)، و رویکردهای مدرن مثل Data Vault. تمرکز روی این‌که چرا هر مدل کجا مناسب است.

Dimensional Modeling (Star/Snowflake)Slowly Changing DimensionsFact & Dimension TablesData Vault 2.0OLAP vs OLTPTime-series ModelingConformed Dimensions
3

پلتفرم‌های ابری و انبارهای داده مدرن

⏱️ ۳ تا ۴ ماه

آشنایی عملی با Snowflake، BigQuery، Redshift و Databricks. درک معماری Lakehouse، فرمت‌های جدول (Iceberg/Delta) و طراحی هزینه-آگاه روی Cloud.

SnowflakeBigQueryDatabricks LakehouseApache Iceberg / Delta LakeS3 / GCS / ADLSPartitioning و ClusteringCost Optimization در Cloud DW
4

خطوط داده، ELT و ابزارهای پایپ‌لاین

⏱️ ۲ تا ۳ ماه

ساخت پایپ‌لاین‌های پایدار با dbt، Airflow و ابزارهای مدرن ingestion. تمرکز بر این‌که پایپ‌لاین فقط «داده را جابه‌جا نمی‌کند» — بلکه قراردادهای داده را اجرا می‌کند.

dbtApache AirflowFivetran / AirbyteChange Data Capture (CDC)Streaming با KafkaData ContractsTesting با dbt و Great Expectations
5

حاکمیت، Data Mesh و معماری در سطح سازمان

⏱️ مداوم

ورود به لایه استراتژیک: طراحی Data Mesh یا Data Fabric، تعریف خط‌مشی حاکمیت داده، Catalog، Lineage و معماری برای AI/ML در مقیاس سازمان.

Data Mesh و Domain-Driven DesignData Governance (Collibra/Alation)Data Catalog و LineagePrivacy by Design (GDPR/CCPA)Master Data ManagementReal-time Architecture (Lambda/Kappa)Feature Store برای ML

ابزارها و استک فنی

ابزارهایی که هر مهندس AI باید بشناسد، دسته‌بندی‌شده بر اساس اولویت

پایگاه داده و انبار داده

Snowflake

انبار داده ابری پیشرو با جداسازی محاسبه و ذخیره‌سازی

ضروری
BigQuery

انبار داده Google با موتور تحلیلی serverless

ضروری
PostgreSQL

پایگاه داده رابطه‌ای متن‌باز، استاندارد طلایی OLTP

ضروری
Databricks

پلتفرم Lakehouse برای داده ساختاریافته و نیمه‌ساختاریافته در مقیاس

مفید

مدل‌سازی و ETL/ELT

dbt

استاندارد صنعتی برای تبدیل داده در انبار با SQL مدولار

ضروری
Apache Airflow

ارکستراتور وظایف داده با DAG های قابل اعتماد

ضروری
Fivetran

ابزار managed ingestion از صدها منبع SaaS و دیتابیس

مفید
Erwin / SqlDBM

ابزار طراحی بصری مدل داده و ERD

مفید

حاکمیت و کاتالوگ

Collibra

پلتفرم سازمانی حاکمیت داده، استاندارد در بانک‌ها

مفید
Atlan

Data Catalog مدرن با تجربه کاربری collaboration-first

مفید
Apache Atlas

ابزار متن‌باز metadata management و lineage

پیشرفته
Great Expectations

فریم‌ورک تست کیفیت داده برای پایپ‌لاین‌ها

مفید

Streaming و فرمت‌های مدرن

Apache Kafka

ستون فقرات استریمینگ داده در اکثر معماری‌های real-time

مفید
Apache Iceberg

فرمت جدول باز برای Lakehouse، استاندارد در حال ظهور

مفید
Delta Lake

فرمت جدول ACID روی data lake، توسعه‌یافته توسط Databricks

مفید
Debezium

ابزار CDC متن‌باز برای استریم تغییرات دیتابیس

پیشرفته
ضروری — باید یاد بگیریدمفید — ارزش یادگیری داردپیشرفته — برای سطوح ارشد

مسیر پیشرفت شغلی

از جونیور تا Staff Engineer — چه مهارت‌هایی نیاز دارید و چه درآمدی انتظار داشته باشید

مهندس داده / تحلیل‌گر داده

۰ تا ۳ سال

~$90K

میانگین سالانه (آمریکا)

ساخت پایپ‌لاین‌های ETL، نوشتن کوئری برای تیم BI، نگهداری انبار داده موجود

SQLPythondbtAirflowCloud DW basics

معمار داده میانی

۳ تا ۶ سال

~$145K

میانگین سالانه (آمریکا)

طراحی مدل داده برای یک دامنه (مثلاً مالی یا فروش)، رهبری مهاجرت به cloud DW، تدوین استانداردهای تیم

Dimensional ModelingSnowflake/BigQueryData GovernanceStakeholder Mgmt

معمار ارشد داده

۶ تا ۱۰ سال

~$195K

میانگین سالانه (آمریکا)

معماری کل پلتفرم داده شرکت، انتخاب فناوری‌های استراتژیک، رهبری مهاجرت‌های بزرگ، مشاوره به C-suite

Enterprise ArchitectureData MeshCost OptimizationCross-team Leadership

معمار اصلی / Chief Data Architect

۱۰+ سال

~$260K

میانگین سالانه (آمریکا)

تعریف استراتژی داده در سطح شرکت، نماینده فنی در هیئت‌مدیره، طراحی برای M&A و الزامات نظارتی

Tech StrategyRegulatory KnowledgeM&A Data IntegrationExecutive Communication

چالش‌ها و جنبه‌های منفی

واقعیت‌هایی که کمتر در آگهی‌های شغلی می‌بینید — قبل از ورود بدانید

Trade-off دائمی هزینه/سرعت/انعطاف

عمومی

هر تصمیم معماری یک trade-off است: انبار داده گران‌تر اما تمیزتر، یا lake ارزان‌تر اما پر از قطعات شکسته. معمار باید بدون اطلاعات کامل تصمیم بگیرد و سال‌ها با نتایج آن زندگی کند.

میراث سیستم‌های قدیمی (Legacy)

شرکت بزرگ

اکثر شرکت‌های بزرگ روی Oracle، Teradata یا SQL Server با ۱۵ سال code on top نشسته‌اند. طراحی معماری جدید یعنی مذاکره با کسانی که سیستم قبلی را ساخته‌اند و سیاست‌گذاری برای مهاجرت تدریجی.

Data Mesh مد روز است، اما همه‌جا جواب نمی‌دهد

استارتاپ

Data Mesh برای شرکت‌های با ۱۵+ تیم داده طراحی شده. اگر روی استارتاپی با ۵ مهندس آن را پیاده کنید، فقط overhead اضافه می‌کنید. اما مدیران اغلب اصرار دارند که «ما هم باید Mesh داشته باشیم».

فشار AI Hype روی پلتفرم داده

عمومی

مدیران از کنفرانس‌ها برمی‌گردند و می‌خواهند فردا یک vector database و feature store داشته باشند. وظیفه معمار، توضیح این است که این ابزارها فقط وقتی ارزش دارند که data quality زیربنایی حل شده باشد.

حاکمیت داده در برابر سرعت تیم‌ها

شرکت بزرگ

تیم‌های محصول می‌خواهند سریع iterate کنند. تیم Compliance می‌خواهد همه چیز approved باشد. معمار باید فرآیندی طراحی کند که هم compliant باشد، هم سرعت تیم‌ها را نکُشد.

نبود وضوح در ownership داده‌ها

عمومی

در اکثر شرکت‌ها هیچ‌کس نمی‌داند `customer_id` در ۸ سیستم مختلف چه ربطی به هم دارند. معمار باید این آشفتگی را به ساختار تبدیل کند — کاری که اغلب با مقاومت سیاسی سازمانی روبه‌رو می‌شود.

حقوق و بازار کار جهانی

حقوق جهانی معمار داده

میانگین حقوق سالانه بر اساس تجربه در کشورهای مختلف

کشورمیانهارز
🇮🇳هند
₹4,000,000INR
🇦🇪امارات
AED 320,000AED
🇺🇸آمریکا
$195,000USD
🇸🇬سنگاپور
SGD 170,000SGD
🇦🇺استرالیا
A$170,000AUD
🇨🇦کانادا
CA$160,000CAD
🇬🇧انگلستان
£110,000GBP
🇩🇪آلمان
€100,000EUR

* ارقام سالانه و تقریبی هستند و بر اساس میانگین بازار در سال ۲۰۲۵ محاسبه شده‌اند.

چگونه از صفر شروع کنیم

برنامه گام‌به‌گام برای ورود به مهندسی هوش مصنوعی

ماه ۱–۲: تثبیت SQL و طراحی دیتابیس

SQL تا سطح Window function، طراحی ERD برای ۳ سناریوی واقعی، خواندن «Database Internals» تا فصل storage.

ماه ۳: Dimensional Modeling

خواندن Kimball Toolkit، طراحی star schema برای یک کسب‌وکار فرضی (مثلاً Uber)، تمرین SCD Type 2 با مثال واقعی.

ماه ۴: Cloud DW + dbt

Snowflake یا BigQuery trial، dbt Fundamentals، ساخت یک پروژه end-to-end از CSV تا داشبورد.

ماه ۵: Governance و Lineage

خواندن DAMA-DMBOK (فصل‌های Governance و Master Data)، تجربه ابزارهایی مثل Atlan trial.

ماه ۶: پورتفولیو و مصاحبه

نوشتن ۲ پست بلاگ درباره طراحی‌هایتان، آماده‌سازی برای مصاحبه‌های system design داده، apply به جایگاه Senior Data Engineer با مسیر Data Architect.

پروژه‌های پیشنهادی برای رزومه

طراحی شِمای ابعادی برای فروشگاه آنلاین

مبتدی

یک ERD برای فروشگاه نمونه طراحی کنید: مشتری، سفارش، محصول، انبار. سپس آن را به star schema با SCD Type 2 برای Customer تبدیل کنید.

PostgreSQLdbdiagram.ioSQL
زمان تخمینی: ۱ هفته

انبار داده تحلیلی روی Snowflake

متوسط

یک dataset عمومی (مثلاً NYC Taxi) را ingest کنید، با dbt مدل ابعادی بسازید و در Looker Studio داشبورد بسازید.

SnowflakedbtFivetran/AirbyteLooker Studio
زمان تخمینی: ۳ هفته

پایپ‌لاین CDC با Kafka و Debezium

پیشرفته

تغییرات یک Postgres operational را با Debezium به Kafka استریم کنید، در یک staging warehouse ذخیره کنید و با dbt مدل کنید.

PostgresDebeziumKafkaSnowflake/BigQuerydbt
زمان تخمینی: ۵ هفته

Data Mesh نمونه برای دو دامنه کسب‌وکار

پیشرفته

برای دو دامنه (مثلاً Marketing و Finance) دیتاپروداکت‌های مستقل با قراردادهای داده طراحی کنید و یک Catalog مشترک بسازید.

dbtDataHub/AtlanBigQueryData Contracts
زمان تخمینی: ۶ هفته

ارزیابی هزینه و بهینه‌سازی DW

متوسط

یک گزارش تحلیلی بنویسید که چگونه با partitioning، clustering و materialized views می‌توان ۳۰–۵۰٪ هزینه یک warehouse را کاهش داد، با اعداد واقعی.

BigQuery/SnowflakeSQLINFORMATION_SCHEMA
زمان تخمینی: ۲ هفته

مثال‌های واقعی و Case Studies

داستان‌های واقعی از مهندسانی که در این حوزه تأثیرگذار بوده‌اند

B

Bill Inmon

پیشینه

متولد ۱۹۴۵، فارغ‌التحصیل ریاضیات از Yale و دارای کارشناسی ارشد از New Mexico State. از دهه ۱۹۷۰ روی پایگاه داده‌های تحلیلی کار کرد و در ۱۹۹۲ کتاب «Building the Data Warehouse» را منتشر کرد که بنیان صنعت data warehouse را گذاشت.

دستاورد

به‌عنوان «پدر Data Warehouse» شناخته می‌شود. تعریف رسمی او از انبار داده (subject-oriented، integrated، non-volatile، time-variant) هنوز در DAMA-DMBOK و اکثر کتاب‌های مرجع استفاده می‌شود. در ۲۰۲۱ کتاب «Building the Data Lakehouse» را با Databricks نوشت و نشان داد که در ۷۵ سالگی هم می‌توان مفاهیم جدید را پذیرفت.

درس کلیدی

تخصصی شدن در یک حوزه عمیق (در مورد Inmon: مدل‌سازی داده برای تحلیل) می‌تواند کل صنعت را تعریف کند. Inmon هیچ‌گاه از تخصصش دور نشد اما با تکامل صنعت، مفاهیمش را تطبیق داد — درس مهمی برای معمارانی که نگران منسوخ شدن هستند.

R

Ralph Kimball

پیشینه

دکترای الکترونیک از Stanford، سپس کار در Xerox PARC. در ۱۹۹۲ گروه Kimball را تأسیس کرد و کتاب «The Data Warehouse Toolkit» را نوشت که محبوب‌ترین کتاب طراحی انبار داده در جهان شد.

دستاورد

روش‌شناسی Dimensional Modeling را با مفاهیم Star Schema، Fact/Dimension و SCD ابداع کرد. این روش، استاندارد عملی صنعت BI شد و امروز نیز در dbt، Looker و Power BI به‌عنوان best practice توصیه می‌شود. Kimball Group هزاران معمار را در ۳۰ سال گذشته آموزش داده است.

درس کلیدی

آموزش و نوشتن می‌توانند بیشتر از ساخت یک محصول، روی صنعت اثر بگذارند. Kimball کد نفروخت — او روش‌شناسی فروخت. برای معماران داده، نوشتن، ارائه و آموزش بخش جدایی‌ناپذیر از مسیر شغلی است.

Z

Zhamak Dehghani

پیشینه

مهندس نرم‌افزار با پیش‌زمینه consulting در ThoughtWorks، رهبر فنی در پروژه‌های enterprise. در ۲۰۱۹ مفهوم Data Mesh را منتشر کرد و سپس استارتاپ Nextdata را برای پیاده‌سازی این ایده تأسیس کرد.

دستاورد

با دو مقاله در Martin Fowler's blog (۲۰۱۹ و ۲۰۲۰) و کتاب «Data Mesh» در O'Reilly، یکی از تأثیرگذارترین تغییرات پارادایم در ۱۰ سال اخیر را شکل داد. Data Mesh حالا توسط Netflix، JPMorgan Chase، Zalando و صدها شرکت بزرگ پیاده شده است. در ۲۰۲۲ Nextdata را تأسیس کرد که در سال ۲۰۲۳ ۱۲ میلیون دلار Series A جذب کرد.

درس کلیدی

اگر یک مشکل سازمانی واقعی را که هزاران تیم تجربه می‌کنند فرموله کنید و راه‌حل ارائه دهید، می‌توانید یک ایده تبدیل به جنبش کنید — حتی بدون این‌که در ابتدا شرکت داشته باشید. Dehghani اول مقاله نوشت، بعد جنبش ساخت، بعد شرکت.

نمونه آگهی استخدام واقعی + تحلیل

یک آگهی واقعی از شرکت فعال در حال استخدام، با تحلیل هر بخش

Distinguished Data Architect

Capital Oneمک‌لین، ویرجینیا (هیبریدی)2025-02
مشاهده آگهی اصلی

تحلیل نیازمندی‌ها

EN

Bachelor's Degree (Computer Science, Engineering, Math) + 12+ years of experience in data architecture and engineering

این نقش Distinguished سطح Principal/Staff است. ۱۲ سال تجربه نیاز است اما در عمل، Capital One پروفایل‌های ۸–۱۰ ساله با impact قوی را هم می‌پذیرد. مدرک مشترک CS/Eng/Math است — یعنی پیش‌زمینه ریاضی هم پذیرفته می‌شود.

ضروری
EN

Deep experience with cloud-native data platforms (Snowflake, Databricks, AWS data services)

Capital One یکی از اولین بانک‌های all-in cloud (AWS) بود. تجربه با Redshift، EMR، Glue و حداقل یکی از Snowflake/Databricks ضروری است. اگر فقط on-prem تجربه دارید، باید قبل از apply یک پروژه cloud واقعی نشان دهید.

ضروری
EN

Experience designing data architectures for regulated industries (financial services preferred)

بانک یعنی SOX، GLBA، CCPA. اگر تجربه fintech ندارید، تجربه healthcare یا insurance هم پذیرفته است — مهم درک data residency، audit و encryption at rest/in transit است.

ضروری
EN

Track record leading large-scale data platform migrations or transformations

Capital One در سال‌های ۲۰۱۵–۲۰۲۰ کل data center خود را به AWS مهاجرت داد. این نقش به دنبال کسی است که تجربه واقعی «از سیستم A به سیستم B در مقیاس میلیارد رکورد» را داشته باشد.

ضروری
EN

Familiarity with Data Mesh principles and modern data product thinking

Capital One یکی از پیشگامان Data Mesh در صنعت بانکی است. شما لازم نیست خبره باشید، اما باید بتوانید توضیح دهید چه زمانی Data Mesh مناسب است و چه زمانی نه.

مهم
EN

Experience with AI/ML data infrastructure and feature stores

بخش بزرگی از Capital One روی ML برای fraud detection و credit risk بنا شده. آشنایی با Feature Store (مثل Feast یا Tecton) و طراحی training pipelines یک مزیت قوی است.

مهم

تحلیل مسئولیت‌ها

EN

Define enterprise data architecture strategy and standards across business units

این یعنی شما با ۱۰+ تیم محصول کار خواهید کرد و باید استانداردهایی بنویسید که هم برای fraud team کار کند و هم برای marketing. این کار ۸۰٪ communication و ۲۰٪ technical است.

EN

Partner with senior engineering leadership to evolve the bank's data platform

همکاری مستقیم با Director ها و VP ها. شما باید بتوانید معماری را به زبانی ارائه کنید که هم engineer متوجه شود و هم business sponsor.

EN

Lead architecture reviews for high-impact, multi-million dollar initiatives

Architecture Review Board حضور دارید و روی پروژه‌های ۵–۵۰ میلیون دلاری رای می‌دهید. مسئولیت زیادی است که نیاز به skill در trade-off analysis و risk management دارد.

EN

Mentor staff and principal-level engineers across the organization

Mentoring یک بخش رسمی این نقش است. Capital One از Distinguished Engineers انتظار دارد تا ۲۰–۳۰٪ وقتشان را روی develop کردن دیگران بگذارند.

نتیجه‌گیری کلی

Distinguished Data Architect در یک بانک یعنی ترکیب نادر: عمق فنی + درک regulatory + توانایی مذاکره با هیئت‌مدیره. اگر در همه این سه ضعف ندارید، یکی را با تجربه واقعی پر کنید و apply کنید. این نقش‌ها سال‌ها زمان می‌برد تا مهیا شوند و recruiterها به دنبال «pattern of growth» هستند نه چک‌لیست کامل.

آینده و روندها

پیش‌بینی ۵–۱۰ ساله و مهارت‌هایی که باید یاد بگیرید

رشد ۹٪ سالانه تا ۲۰۳۲ — افزودن حدود ۱۱,۵۰۰ شغل در سال در آمریکا، با میانگین حقوق سالانه ۱۳۳,۰۸۰ دلار (BLS)

منبع: U.S. Bureau of Labor Statistics 2024–2034 Occupational Outlook + Glassdoor 2025 salary data

مهارت‌های نوظهور که باید یاد بگیرید

Data Mesh و Domain-Driven ArchitectureLakehouse با Iceberg/DeltaFeature Store برای AI/MLPrivacy-Preserving Architecture (Differential Privacy، Confidential Computing)Real-time و Streaming-first designData Contracts و Shift-Left Quality

پیش‌بینی‌های آینده

2026

Iceberg به استاندارد رسمی Lakehouse تبدیل می‌شود؛ Snowflake، Databricks و BigQuery همگی پشتیبانی کامل می‌دهند

2027

نقش «AI Data Architect» (تخصصی برای Feature Store، vector DB و training pipelines) به‌عنوان شاخه‌ای جدا ظاهر می‌شود

2028

Data Contracts به استاندارد بین تیم‌ها تبدیل می‌شوند — مثل OpenAPI برای REST

2030

بیش از ۷۰٪ شرکت‌های Fortune 500 رویکرد ترکیبی Data Mesh + Lakehouse را پیاده می‌کنند

ریسک‌های واقعی

خطر اصلی، نه AI، بلکه ابزارهای no-code/low-code طراحی schema و auto-generation با LLMs است. اما این ابزارها فقط طراحی‌های ساده را خودکار می‌کنند — تصمیم‌گیری استراتژیک، governance و trade-off های هزینه/امنیت کاملاً انسانی باقی می‌ماند. خطر واقعی برای معمارهای داده این است که به ابزارهای legacy بچسبند و در تطبیق با Iceberg، Lakehouse و Data Mesh عقب بمانند.

ویدیوهای آموزشی

برای راهنمایی شخصی‌سازی‌شده مشاوره بگیرید