Retour

Se familiariser avec l’interface Talend Studio

Temps de lecture : 4 minutes

Dans ce tutoriel vous apprendrez les bases de l’utilisation de l’interface de développement Talend Studio pour l’intégration ETL.

Prérequis :

  • Avoir installé Talend Studio, la partie ETL (Extract Transform Load) des solutions Talend.
  • L’application gratuite Talend Open Studio for Data Integration est suffisante pour ce tutoriel.

Composants ETL utilisés dans le traitement

  • Composants d’extraction, chargement : tRowGenerator.
  • Composants de transformation : Aucun.
  • Composants de médiation : Aucun
  • Composants d’affichage : tLogRow.

Présentation de l’Interface ETL Talend

Voici un aperçu global de l’interface Talend Studio avec un Job ouvert dans l’espace de modélisation graphique. L’interface comporte plusieurs panneaux appelés vues dont nous allons détailler la fonction :

Le Référentiel de projet indique tous les éléments du projet : les Jobs, qui sont des programmes Java ETL exécutables, codes, modèles SQL, métadonnées et documentation du projet. Ci – dessous le Job « OnBoardingDemoJob 0.1 » est un Job qui vous est proposé par défaut lors de l’ouverture de Talend Studio. Si vous double cliquez sur ce Job il va s’ouvrir dans l’espace de modélisation graphique visible ci – après :

L’espace de modélisation graphique vous permet de développer les composants de votre Job ETL et de les relier selon une séquence d’exécution. Ci – dessous un composant « tRowGenerator_1 » génère 100 lignes chacune constituée de une colonne contenant une chaîne de caractère aléatoire, puis envoi ces lignes vers le composant « tLogRow_1 » :

Vous pouvez double – cliquer sur ce composant pour afficher son paramétrage et le modifier. Le nom de la colonne générée est « newColumn« , son type est une chaîne de caractères (String) et la fonction « getAsciiRandomString(int) » de la classe « TalendString » permet de générer une chaîne de caractère d’une longueur spécifiée dans une variable d’environnement. Vous pouvez générer un aperçu des données générées par ce composant et modifier ses paramètres, par exemple la longueur de la chaîne de caractère ou le nombre de lignes générées puis valider par OK :

Les onglets de configuration vous permettent d’obtenir une vue affichant les propriétés de l’élément sélectionné dans l’espace de modélisation graphique et permettant de les modifier. ci – dessous l’onglet des propriétés du Job est affiché :

Ci – dessous l’onglet Composant a été sélectionné puis nous avons cliqué sur le composant cible tLogRow_1 du traitement. Vous pouvez alors modifier les propriétés de ce composant permettant d’afficher la sortie du traitement en spécifiant par exemple un séparateur de champs différent :

Vous pouvez aussi accéder au schéma des données d’entrée (à gauche) et de sortie (à droite) du composant sélectionné et modifier le schéma de sortie :

Ci – dessous l’onglet Exécuter vous permet de lancer l’exécution de votre flux ETL. Une fois l’exécution terminée la durée d’exécution et le nombre de lignes traitées sont visibles dans l’espace de modélisation graphique (1). Les données de sortie sont visibles au sein de l’onglet d’exécution (2) :

La Palette répertorie tous les composants pouvant être utilisés dans un flux ETL, organisés en dossiers. Ces composants peuvent être cliqués – déposés au sein de votre Job lorsqu’il est actif dans l’espace de modélisation graphique :

Vous pouvez aussi, lorsqu’un lien entre composants est actif dans l’espace de travail, cliquer pour obtenir un menu déroulant des composants que vous pouvez ajouter à la suite.

Vous savez désormais comment utiliser l’interface de développement Talend Studio for Data Integration. Vous pouvez consulter nos autres tutoriel Talend afin d’en apprendre plus.

Laisser un commentaire

Il n'y a pas de commentaires pour le moment. Soyez le premier à participer !