Microsoft DP-900 – Azure Data Fundamentals
Fiche de révision approfondie : içi
Cette fiche de révision présente les concepts essentiels pour réussir la certification DP-900.
Elle couvre les bases des données, les services de stockage relationnels et non relationnels, ainsi que les solutions analytiques d’Azure.
Concepts fondamentaux des données
- Données structurées : organisées en tables (ex : SQL Server). Idéal pour les transactions et requêtes SQL.
- Données semi-structurées : flexibles mais ordonnées (ex : JSON, XML). Utilisées dans les flux modernes et APIs.
- Données non structurées : aucun format prédéfini (images, vidéos, logs). Stockées dans des services comme Azure Blob Storage.
- OLTP vs OLAP :
- OLTP → nombreuses petites transactions rapides (paiement en ligne, commande e-commerce).
- OLAP → analyse massive de données pour rapports et tendances (ex : ventes mensuelles).
- Rôles data :
- DBA : administre la base et assure sécurité + performance.
- Data Engineer : conçoit les pipelines d’ingestion et de transformation.
- Data Analyst : exploite les données pour créer rapports et visualisations.
Bases de données relationnelles sur Azure
- SQL et modèle relationnel : données organisées en tables, relations entre entités, normalisation et requêtes via SQL.
- Azure SQL Database : base relationnelle managée, haute dispo, sauvegardes automatiques.
- Azure SQL Managed Instance : compatibilité totale SQL Server, adaptée aux migrations.
- SQL Server sur VM : plus de contrôle, mais administration manuelle.
- PostgreSQL/MySQL managés : alternatives open-source avec scalabilité intégrée.
Données non relationnelles sur Azure
- Azure Blob Storage : stockage d’objets pour fichiers massifs (images, vidéos, sauvegardes).
- Azure Files : partages de fichiers accessibles via SMB/NFS.
- Azure Table Storage : NoSQL clé-valeur, schéma flexible et économique.
- Azure Cosmos DB : NoSQL distribué globalement, multi-API (SQL, MongoDB, Cassandra, Gremlin, Table). Latence < 10 ms et SLA 99.999 %.
Solutions analytiques
- Azure Synapse Analytics : entrepôt de données cloud massivement parallèle (SQL + Spark intégrés).
- Azure Databricks : traitement big data et machine learning avec Apache Spark.
- Azure Data Factory : ingestion et orchestration (ETL/ELT).
- Azure Stream Analytics : analyse de flux en temps réel (IoT, logs).
- Power BI : outil de visualisation pour créer tableaux de bord interactifs et rapports métiers.
Détails de l’examen
- Code : DP-900
- Durée : ~60 minutes
- Questions : 40–60 QCM
- Score minimum : 700/1000
- Langues disponibles : Anglais, Français, Espagnol, Allemand, Japonais
- Prix : ~99 $ USD (variable selon la région)
Ressources utiles
- Documentation officielle DP-900 (Microsoft Learn)
- Modules gratuits Microsoft Learn
- Introduction à Azure Cosmos DB
- Découverte de Power BI
En résumé, la certification DP-900 établit une base solide dans l’univers de la data et du cloud Azure.
Elle est idéale pour les étudiants et débutants qui souhaitent se lancer dans la Data Science, l’Analyse ou l’Ingénierie de données.