Description
Cette formation présentera aux stagiaires comment implémenter une solution ETL (Extract Transform Load) d'entreprise avec Talend Open Studio. Le cours expliquera comment développer, déployer et gérer des jobs Talend.Pré-requis
- Être familier avec le langage SQL, l’architecture de tables de base de données, etc…
Publics
- Professionnels de l'IT
- Développeurs ayant besoin d'implémenter des flux de données inter-application ou à alimenter un entrepôt de données
Objectifs
- Comprendre l'environnement Talend et son fonctionnement
- Créer des jobs simples
- Gérer les erreurs et le déboggage
- Déployer vos jobs en production
- Gérer et sécuriser les déploiements
Plan de formation
Introduction
- Problématique
- EAI/ERP
- Installation
Découverte de l’environnement
- Premier pas avec TOS
- Vue d’ensemble des composants
Les premiers flux
- Le Business Model
- Le job
- Les bonnes pratiques
- Lecture/Ecriture de fichiers (tFileInput, tFileOutput)
- Type de liaisons entre composants
- Exécuter un job
Traiter les données
- Filtrage des données (tFilterRow)
- Test unicité des données (tUniqRow)
- Agrégation (tAggregateRow)
- Tri (tSortRow)
- Mapping (tMap)
Les métadonnées
- Vue d’ensemble
- Créer une métadonnée fichier
- Utiliser une métadonnée fichier
- Créer une métadonnée base de données
- Récupérer les tables d’une base de données
Travailler avec les bases de données
- Lecture (tMySQLInput, tMSSQLInput)
- Écriture (tMySQLOutput, tMSSQLOutput)
Autres composants et fonctionnalités
- Variables globales (tSetGlobalVar)
- Réplication des flux de données (tReplicate)
- Fusion des flux de données (tUnit)
Les itérations
- Boucles d’itération (tLoop, tInfiniteLoop, …)
- Itération sur une ou plusieurs colonnes d’un flux (tFlowToIterate)
- Itération sur des éléments d’un répertoire (tFileList)
Gestion des logs et des erreurs
- Gérer les erreurs (tDie, tLogCatcher)
- Gérer les avertissements (tWarn, tLogCatcher)
- Gérer les statistiques (tStatCatcher)
- Gérer les informations de volumétrie (tFlowMeter, tFlowMeterCatcher)
Fonctionnalités avancées
- Variables de contexte (tContextLoad)
- Créer une variable de contexte
- Utiliser une variable de contexte
- Modifier une variable de contexte
- Cascade de jobs (tRunJob)
- Les routines
Automatisation & Dcumentation
- Documenter ses jobs
- Générer des scripts