Talend Open Studio Maîtrise

 Description

Cette formation présentera aux stagiaires comment implémenter une solution ETL (Extract Transform Load) d'entreprise avec Talend Open Studio. Le cours expliquera comment développer, déployer et gérer des jobs Talend.

 Pré-requis

  • Être familier avec le langage SQL, l’architecture de tables de base de données, etc…

 Publics

  • Professionnels de l'IT
  • Développeurs ayant besoin d'implémenter des flux de données inter-application ou à alimenter un entrepôt de données

 Objectifs

  • Comprendre l'environnement Talend et son fonctionnement
  • Créer des jobs simples
  • Gérer les erreurs et le déboggage
  • Déployer vos jobs en production
  • Gérer et sécuriser les déploiements

 Plan de formation

Introduction

  • Problématique
  • EAI/ERP
  • Installation

Découverte de l’environnement

  • Premier pas avec TOS
  • Vue d’ensemble des composants

Les premiers flux

  • Le Business Model
  • Le job
  • Les bonnes pratiques
  • Lecture/Ecriture de fichiers (tFileInput, tFileOutput)
  • Type de liaisons entre composants
  • Exécuter un job

Traiter les données

  • Filtrage des données (tFilterRow)
  • Test unicité des données (tUniqRow)
  • Agrégation (tAggregateRow)
  • Tri (tSortRow)
  • Mapping (tMap)

Les métadonnées

  • Vue d’ensemble
  • Créer une métadonnée fichier
  • Utiliser une métadonnée fichier
  • Créer une métadonnée base de données
  • Récupérer les tables d’une base de données

Travailler avec les bases de données

  • Lecture (tMySQLInput, tMSSQLInput)
  • Écriture (tMySQLOutput, tMSSQLOutput)

Autres composants et fonctionnalités

  • Variables globales (tSetGlobalVar)
  • Réplication des flux de données (tReplicate)
  • Fusion des flux de données (tUnit)

Les itérations

  • Boucles d’itération (tLoop, tInfiniteLoop, …)
  • Itération sur une ou plusieurs colonnes d’un flux (tFlowToIterate)
  • Itération sur des éléments d’un répertoire (tFileList)

Gestion des logs et des erreurs

  • Gérer les erreurs (tDie, tLogCatcher)
  • Gérer les avertissements (tWarn, tLogCatcher)
  • Gérer les statistiques (tStatCatcher)
  • Gérer les informations de volumétrie (tFlowMeter, tFlowMeterCatcher)

Fonctionnalités avancées

  • Variables de contexte (tContextLoad)
  • Créer une variable de contexte
  • Utiliser une variable de contexte
  • Modifier une variable de contexte
  • Cascade de jobs (tRunJob)
  • Les routines

Automatisation & Dcumentation

  • Documenter ses jobs
  • Générer des scripts

 Profil du formateur

Le formateur, consultant expert sur la technologie, transmettra ses connaissances et partagera ses expériences terrains dans la réalisation de projet avec Talend.