how perform etl testing using informatica powercenter tool
Es ist eine bekannte Tatsache, dass ETL-Tests ist einer der entscheidenden Aspekte von jedem Business Intelligence (BI) -basierte Anwendung. Um die Qualitätssicherung und Akzeptanz für die Inbetriebnahme zu erhalten, sollte die BI-Anwendung rechtzeitig getestet werden.
Das Hauptziel der ETL-Tests ist es, sicherzustellen, dass die IS xtract, T. transformieren & L. Die oad-Funktionalität entspricht den Geschäftsanforderungen und wird mit den Leistungsstandards synchronisiert.
Bevor wir uns mit ETL-Tests beschäftigen Computing Es ist wichtig zu wissen, was ETL und Informatica sind.
Was du lernen wirst:
- Was Sie in diesem ETL-Tutorial lernen werden:
- Informatica PowerCenter ETL-Testtool:
- Grundlegendes zu für Informatica spezifischen ETL-Tests:
- Klassifizierung von ETL-Tests in Informatica:
- Vorteile der Verwendung von Informatica als ETL-Tool:
- Einige nützliche Tipps, die Sie beim Testen von Informatica ETL unterstützen:
- Fazit:
- Literatur-Empfehlungen
Was Sie in diesem ETL-Tutorial lernen werden:
- Grundlagen der ETL-, Informatica- und ETL-Prüfung.
- Grundlegendes zu ETL-Tests, die für Informatica spezifisch sind.
- Klassifizierung von ETL-Tests in Informatica.
- Beispieltestfälle für Informatica ETL-Tests.
- Vorteile der Verwendung von Informatica als ETL-Tool .
- Tipps und Tricks, die Sie beim Testen unterstützen.
Beim Rechnen bezieht sich Extrahieren, Transformieren, Laden (ETL) auf einen Prozess bei der Datenbanknutzung und insbesondere beim Data Warehousing, der Folgendes ausführt:
- Datenextraktion - Extrahiert Daten aus homogenen oder heterogenen Datenquellen.
- Datentransformation - Formatiert die Daten in den gewünschten Typ.
- Daten laden - Verschieben und speichern Sie die Daten an einem dauerhaften Ort für die langfristige Verwendung.
Informatica PowerCenter ETL-Testtool:
Informatica PowerCenter ist ein leistungsstarkes ETL-Tool der Informatica Corporation. Es handelt sich um eine einheitliche Plattform zur Integration von Unternehmensdaten für den Zugriff auf, die Erkennung und die Integration von Daten aus praktisch jedem Geschäftssystem in jedem
Es handelt sich um eine einheitliche Plattform zur Integration von Unternehmensdaten, mit der Sie auf Daten aus praktisch jedem Geschäftssystem in jedem Format zugreifen, diese ermitteln und integrieren und diese Daten im gesamten Unternehmen mit jeder Geschwindigkeit bereitstellen können. Durch Informatica PowerCenter Wir erstellen Workflows, die End-to-End-ETL-Operationen ausführen.
Informatica PowerCenter herunterladen und installieren:
Verwenden Sie zum Installieren und Konfigurieren von Informatica PowerCenter 9.x den folgenden Link mit schrittweisen Anweisungen:
=> Informatica PowerCenter 9 Installations- und Konfigurationshandbuch
Grundlegendes zu für Informatica spezifischen ETL-Tests:
ETL-Tester haben häufig relevante Fragen dazu, was in Informatica getestet werden soll und wie viel Testabdeckung benötigt wird.
Lassen Sie sich von mir durch die Durchführung von Informatica-spezifischen ETL-Tests führen.
Die Hauptaspekte, die bei ETL-Tests von Informatica im Wesentlichen berücksichtigt werden sollten, sind:
- Testen der Funktionalität des Informatica-Workflows und seiner Komponenten; Alle in den zugrunde liegenden Zuordnungen verwendeten Transformationen.
- Um die Vollständigkeit der Daten zu überprüfen (d. H. Sicherzustellen, ob die projizierten Daten ohne Kürzung und Datenverlust auf das Ziel geladen werden),
- Überprüfen, ob die Daten innerhalb der geschätzten Zeitgrenzen auf das Ziel geladen werden (d. H. Bewertung der Leistung des Workflows),
- Stellen Sie sicher, dass im Workflow keine ungültigen oder unerwünschten Daten in das Ziel geladen werden können.
Klassifizierung von ETL-Tests in Informatica:
Zum besseren Verständnis und zur Vereinfachung des Testers können ETL-Tests in Informatica in zwei Hauptteile unterteilt werden:
Handy-Spionage-App für Android
# 1) Hochrangige Tests
# 2) Detaillierte Tests
Erstens bei den Tests auf hoher Ebene:
- Sie können überprüfen, ob der Informatica-Workflow und zugehörige Objekte gültig sind oder nicht.
- Überprüfen Sie, ob der Workflow beim Ausführen erfolgreich abgeschlossen wird.
- Bestätigen Sie, ob alle erforderlichen Sitzungen / Aufgaben im Workflow ausgeführt werden.
- Überprüfen Sie, ob die Daten in das gewünschte Zielverzeichnis und mit dem erwarteten Dateinamen geladen werden (falls der Workflow eine Datei erstellt) usw.
Kurz gesagt, Sie können sagen, dass die Tests auf hoher Ebene alle grundlegenden Gesundheitsprüfungen umfassen.
Kommen wir zum nächsten Teil, d.h. detaillierte Tests in Informatica Sie werden eingehend prüfen, ob die in Informatica implementierte Logik hinsichtlich ihrer Ergebnisse und Leistung wie erwartet funktioniert.
- Sie müssen die Ausgabedatenüberprüfungen auf Feldebene durchführen, um zu bestätigen, dass jede Transformation ordnungsgemäß funktioniert
- Überprüfen Sie, ob der Datensatz auf jeder Verarbeitungsebene zählt und ob das Ziel den Erwartungen entspricht.
- Überwachen Sie Elemente wie Quellqualifizierer und Ziel in der Quell- / Zielstatistik der Sitzung gründlich
- Stellen Sie sicher, dass die Ausführungsdauer des Informatica-Workflows der geschätzten Laufzeit entspricht.
Zusammenfassend lässt sich sagen, dass die detaillierten Tests eine strenge End-to-End-Validierung des Informatica-Workflows und des damit verbundenen Datenflusses umfassen.
Nehmen wir hier ein Beispiel:
Wir haben eine flache Datei, die Daten zu verschiedenen Produkten enthält. Es speichert Details wie den Namen des Produkts, seine Beschreibung, Kategorie, Verfallsdatum, Preis usw.
Meine Anforderung besteht darin, jeden Produktdatensatz aus der Datei abzurufen, eine eindeutige Produkt-ID für jeden Datensatz zu generieren und in die Zieldatenbanktabelle zu laden. Ich muss auch Produkte unterdrücken, die entweder zur Kategorie „C“ gehören oder deren Verfallsdatum unter dem aktuellen Datum liegt.
Angenommen, meine Flatfile (Quelle) sieht folgendermaßen aus:
((Hinweis:Klicken Sie auf ein Bild, um es zu vergrößern.)
Basierend auf meinen oben genannten Anforderungen sollte meine Datenbanktabelle (Ziel) folgendermaßen aussehen:
Tabellenname: Tbl_Product
Prod_ID (Primärschlüssel) | Produktname | Prod_description | Prod_category | Prod_expiry_date | Prod_price |
---|---|---|---|---|---|
1001 | ABC | Dies ist Produkt ABC. | M. | 14.08.2017 | 150 |
1002 | DEF | Dies ist Produkt DEF. | S. | 06.10.2008 | 700 |
1003 | PQRS | Dies ist das Produkt PQRS. | M. | 23.05.2019 | 1500 |
Jetzt haben wir beispielsweise einen Informatica-Workflow entwickelt, um die Lösung für meine ETL-Anforderungen zu erhalten.
Das zugrunde liegende Informatica-Mapping liest Daten aus der Flatfile, leitet die Daten durch eine Router-Transformation, bei der Zeilen verworfen werden, deren Produktkategorie entweder 'C' oder Ablaufdatum ist. Anschließend verwende ich eine Sequenzgenerierung, um den eindeutigen Primärschlüssel zu erstellen Werte für die Spalte Prod_ID in der Produkttabelle.
Schließlich werden die Datensätze in die Produkttabelle geladen, die das Ziel für meine Informatica-Zuordnung ist.
Beispiele:
Nachfolgend finden Sie die Beispieltestfälle für das oben erläuterte Szenario.
Sie können diese Testfälle als Vorlage in Ihrem Informatica-Testprojekt verwenden und ähnliche Testfälle abhängig von der Funktionalität Ihres Workflows hinzufügen / entfernen.
# 1) Testfall-ID: T001
Testfall Zweck: Workflow validieren - (Workflow-Name)
Testprozedur:
- Gehen Sie zum Workflow-Manager
- Workflow öffnen
- Menü Workflows-> Klicken Sie auf Validieren
Eingabewert / Testdaten: Quellen und Ziele sind verfügbar und verbunden
Quellen: (Name aller Quellinstanzen)
Zuordnungen: (Name aller Zuordnungen)
Ziele: (Name aller Zielinstanzen)
Sitzung: (Name aller Sitzungen)
Erwartete Ergebnisse: Meldung in der Statusleiste des Workflow-Managers: „Workflow (Workflow-Name) ist gültig“
Tatsächliche Ergebnisse: Meldung in der Statusleiste des Workflow-Managers: „Workflow (Workflow-Name) ist gültig“
Bemerkungen:Bestehen
Tester Kommentare:
# 2) Testfall-ID: T002
Testfall Zweck: Um sicherzustellen, dass der Workflow erfolgreich ausgeführt wird
Testprozedur:
- Gehen Sie zum Workflow-Manager
- Workflow öffnen
- Klicken Sie mit der rechten Maustaste in den Workflow-Designer und wählen Sie Workflow starten
- Überprüfen Sie den Status im Workflow Monitor
Eingabewert / Testdaten: Entspricht den Testdaten für T001
Erwartete Ergebnisse: Meldung im Ausgabefenster im Workflow-Manager: Aufgabenaktualisierung: (Workflow-Name) (erfolgreich)
Tatsächliche Ergebnisse: Meldung im Ausgabefenster im Workflow-Manager: Aufgabenaktualisierung: (Workflow-Name) (erfolgreich)
Bemerkungen:Bestehen
Tester Kommentare: Workflow erfolgreich
Hinweis: Sie können den Workflow-Ausführungsstatus (fehlgeschlagen / erfolgreich) im Workflow-Monitor leicht anzeigen, wie im folgenden Beispiel gezeigt. Sobald der Workflow abgeschlossen ist, wird der Status automatisch im Workflow-Monitor angezeigt.
beste Spionage-Handy-Apps für Android
Im obigen Screenshot sehen Sie die Start- und Endzeit des Workflows sowie den Status als erfolgreich.
# 3) Testfall-ID: T003
Testfall Zweck: Überprüfen, ob die gewünschte Anzahl von Datensätzen in das Ziel geladen wird
Testprozedur: Wechseln Sie nach erfolgreicher Ausführung des Workflows zur Zieltabelle in der Datenbank
Überprüfen Sie die Anzahl der Zeilen in der Zieldatenbanktabelle
Eingabewert / Testdaten: 5 Zeilen in der Quelldatei
Ziel: Datenbanktabelle - (Tbl_Product)
Abfrage zur Ausführung in SQL Server: Wählen Sie count (1) aus (Tbl_Product).
Erwartete Ergebnisse: 3 Zeilen ausgewählt
Tatsächliche Ergebnisse: 3 Zeilen ausgewählt
Bemerkungen:Bestehen
Tester Kommentare:
# 4) Testfall-ID: T004
Testfall Zweck: Um zu überprüfen, ob der Sequenzgenerator in der Informatica-Zuordnung zum Auffüllen von (Primärschlüssel-Spaltenname, z. Spalte Prod_ID)
Testprozedur: Wechseln Sie nach erfolgreicher Ausführung des Workflows zur Zieltabelle in der Datenbank
Überprüfen Sie die in der Spalte Prod_ID generierte eindeutige Sequenz
Eingabewert / Testdaten: Der Wert für Prod_ID wurde für jede Zeile in der Quelldatei leer gelassen
Sequenzgenerator, der in der Zuordnung der Spalte Prod_ID zugeordnet ist
Startwert des Sequenzgenerators auf 1001 eingestellt
Ziel: Datenbanktabelle - (Tbl_Product) in SQL Server geöffnet
Erwartete Ergebnisse: Der Wert 1001 bis 1003 wird für jede Zeile der Spalte Prod_ID angegeben
Tatsächliche Ergebnisse: Der Wert 1001 bis 1003 wird für jede Zeile der Spalte Prod_ID angegeben
Bemerkungen:Bestehen
Tester Kommentare:
# 5) Testfall-ID: T005
Warum wählen Sie die Frage zum Testen von Softwaretests?
Testfall Zweck: Um zu überprüfen, ob die Router-Transformation ordnungsgemäß funktioniert, um Datensätze zu unterdrücken, falls die Produktkategorie 'C' lautet oder das Produkt abgelaufen ist.
Testprozedur: Wechseln Sie nach erfolgreicher Ausführung des Workflows zur Zieltabelle in der Datenbank
Führen Sie die Abfrage in der Zieltabelle aus, um zu überprüfen, ob die gewünschten Datensätze unterdrückt wurden.
Eingabewert / Testdaten: 5 Zeilen in der Quelldatei
Ziel: Datenbanktabelle - (Tbl_Product)
Abfrage zur Ausführung in SQL Server: Wählen Sie * aus Produkt, wobei Prod_category = 'C' oder Prod_expiry_date< sysdate ;;
Erwartete Ergebnisse: Keine Zeilen ausgewählt
Tatsächliche Ergebnisse: Keine Zeilen ausgewählt
Bemerkungen:Bestehen
Tester Kommentare: (wenn überhaupt)
# 6) Testfall-ID: T006
Testfall Zweck: So überprüfen Sie die Leistung des Workflows durch Aufzeichnen der Workflow-Laufzeit.
Testprozedur:
- Öffnen Sie den Workflow-Monitor und führen Sie den Lauf aus, der als Teil von T001 ausgeführt wurde.
- Notieren Sie die Start- und Endzeit des Workflows.
- Berechnen Sie die Gesamtlaufzeit, indem Sie die Startzeit von der Endzeit abziehen.
Eingabewert / Testdaten: Der Workflow wurde erfolgreich ausgeführt
Startzeit des Workflows im Monitor
Endzeit des Workflows im Monitor.
Erwartete Ergebnisse: 2 min 30 sek
Tatsächliche Ergebnisse: 2 min 15 sek
Bemerkungen:Bestehen
Tester Kommentare: Betrachten Sie den Test als 'Bestanden', falls die tatsächliche Laufdauer +/- 10% der erwarteten Laufdauer beträgt.
# 7) Testfall-ID: T007
Testfall Zweck: Überprüfen von Daten auf Zieltabellenspaltenebene, um sicherzustellen, dass kein Datenverlust auftritt.
Testprozedur: Wechseln Sie nach erfolgreicher Ausführung des Workflows zum SQL Server.
Führen Sie die Abfrage in der Zieltabelle aus, um sicherzustellen, dass kein Datenverlust vorliegt.
Eingabewert / Testdaten: Der Workflow wurde erfolgreich ausgeführt
Ein Beispieldatensatz aus der Quell-Flatfile.
SQL-Abfrage: Wählen Sie Top 1 * aus Tbl_Patient;
Erwartete Ergebnisse:
1 Zeile zurückgegeben
Prod_ID (Primärschlüssel) | Produktname | Prod_description | Prod_category | Prod_expiry_date | Prod_price |
---|---|---|---|---|---|
1001 | ABC | Dies ist Produkt ABC. | M. | 14.08.2017 | 150 |
Tatsächliche Ergebnisse:
1 Zeile zurückgegeben.
Prod_ID (Primärschlüssel) | Produktname | Prod_description | Prod_category | Prod_expiry_date | Prod_price |
---|---|---|---|---|---|
1001 | ABC | Dies ist Produkt ABC. | M. | 14.08.2017 | 150 |
Bemerkungen:Bestehen
Tester Kommentare: Betrachten Sie den Test als 'Bestanden', falls die tatsächliche Laufdauer +/- 10% der erwarteten Laufdauer beträgt.
Vorteile der Verwendung von Informatica als ETL-Tool:
Informatica ist ein beliebtes und erfolgreiches ETL-Tool, weil:
- Es hat eine hohe Erfolgsquote beim Go-Live (fast 100%)
- Informatica kann Lean Integration ermöglichen.
- Es ist ein preisgünstiges Tool im Vergleich zu anderen ETL-Tools.
- Es kommt mit internem Job Scheduler. Es ist daher nicht erforderlich, den Scheduler eines Drittanbieters separat zu verwenden, wie dies bei einigen anderen ETL-Tools der Fall ist.
- Die einfache Schulung und die Verfügbarkeit von Werkzeugen haben Informatica immer beliebter gemacht.
Einige nützliche Tipps, die Sie beim Testen von Informatica ETL unterstützen:
- Generieren Sie die Testdaten, bevor Sie die Testszenarien ausführen.
- Die Testdaten sollten mit dem Testfall synchronisiert sein, für den sie verwendet werden.
- Stellen Sie sicher, dass Sie alle drei Szenarien abgedeckt haben - es werden keine Daten übermittelt, ungültige Daten werden übermittelt und gültige Daten werden als Eingabe für den Informatica-Workflow übermittelt.
- Stellen Sie sicher, dass Sie testen, ob alle erforderlichen Daten vollständig auf das Ziel geladen werden. Hierfür können Sie den oben beschriebenen Testfall T003 als Beispiel verwenden.
- Es ist sehr wichtig zu testen, ob der Workflow alle Datentransformationen gemäß den Geschäftsregeln korrekt ausführt.
- Ich würde vorschlagen, dass Sie für jede in Ihrer Informatica-Zuordnung angewendete Transformation eine Checkliste haben, um die Ausgabedaten anhand dieser zu überprüfen. Auf diese Weise können Sie Fehler leicht melden, wenn eine Transformation nicht ordnungsgemäß funktioniert.
Fazit:
Wir haben also einige der Beispieltestfälle im Detail gesehen, die als Vorlage für ETL-Tests in Informatica verwendet werden können. Wie bereits erwähnt, können Sie diese Testfälle je nach Szenario in Ihrem Projekt hinzufügen / entfernen / ändern.
Wie bereits erwähnt, können Sie diese Testfälle je nach Szenario in Ihrem Projekt hinzufügen / entfernen / ändern.
Das Informatica PowerCenter ist eine Grundlage für alle Datenintegrationsaktivitäten.
Sie können problemlos skriptfreie automatisierte Tests von Daten durchführen, die in Test-, Entwicklungs- oder Produktionsumgebungen kopiert wurden. Aus diesem Grund ist PowerCenter heutzutage das beliebteste ETL-Tool.
Empfohlene Lektüre => ETL vs. DB-Tests - Ein genauerer Blick auf den ETL-Testbedarf
Über den Autor: Dies ist ein Gastartikel von Priya K. Sie verfügt über mehr als 4 Jahre praktische Erfahrung in der Entwicklung und Unterstützung von Informatica ETL-Anwendungen.
Fühlen Sie sich frei, Ihre Fragen zu posten / Bemerkungen über dieses ETL-Tool.
Literatur-Empfehlungen
- Beste Software-Test-Tools 2021 (QA Test Automation Tools)
- So führen Sie Backend-Tests durch
- Fragen und Antworten zum ETL-Testinterview
- Tutorial zum Testen von ETL-Data Warehouse-Tests (Eine vollständige Anleitung)
- Testen von Primer eBook Download
- ETL vs. DB-Tests - Ein genauerer Blick auf den Bedarf, die Planung und die ETL-Tools für ETL-Tests
- Lasttests mit LoadUI - Ein kostenloses und Open Source-Lasttest-Tool
- Top 10 ETL-Testwerkzeuge im Jahr 2021