top 64 informatica interview questions with answers
Am häufigsten gestellte Fragen und Antworten zum Informatica-Interview:
Dieser Artikel behandelt die wichtigsten Fragen zu Informatica MDM, PowerCenter, Datenqualität, Cloud, ETL, Administrator, Test und Entwickler.
Im heutigen Szenario hat INFORMATICA die Auszeichnung als weltweit anspruchsvollstes Produkt erhalten. Die Produkte wurden neu eingeführt, wurden jedoch innerhalb kurzer Zeit populär.
Im Laufe der Jahre war INFORMATICA führend im Technologiebereich Datenintegration. Basierend auf der ETL-Architektur (Extract, Transfer, Load) verfügt dieses Datenintegrationstool über mehrere Produkte, die sich auf die Bereitstellung von Diensten für Regierungsorganisationen, Finanz- und Versicherungsunternehmen, das Gesundheitswesen und verschiedene andere Unternehmen konzentrieren.
Nun, dies war nur der Hintergrund von INFORMATICA. Aber heute hat das Data Warehousing-Feld ein enormes Wachstum und daher gibt es in der Branche viele Beschäftigungsmöglichkeiten.
Beste Informatica Interview Fragen & Antworten
Im Folgenden finden Sie eine Liste der am häufigsten gestellten Fragen und Antworten zu Vorstellungsgesprächen. Es enthält rund 64 Fragen, mit denen Sie Ihr Wissen über Informatica-Konzepte auf einfachere Weise erweitern können.
F # 1) Was ist INFORMATICA? Warum brauchen wir es?
Antworten: INFORMATICA ist eine Softwareentwicklungsfirma, die Datenintegrationslösungen für ETL, Datenvirtualisierung, Stammdatenverwaltung, Datenqualität, Datenreplik, Ultra-Messaging usw. anbietet.
Einige der beliebtesten INFORMATICA-Produkte sind:
- IT PowerCenter
- INFORMATICA PowerConnect
- COMPUTER Power Mart
- INFORMATICA Power Exchange
- INFORMATICA Leistungsanalyse
- INFORMATICA Stromqualität
Wir benötigen INFORMATICA, wenn wir mit Datensystemen arbeiten, die Daten enthalten, um bestimmte Operationen zusammen mit einer Reihe von Regeln auszuführen. Es erleichtert die Reinigung von Betriebslinien und das Ändern von Daten aus strukturierten und unstrukturierten Datensystemen.
F # 2) Wie ist das Format von INFORMATICA-Objekten in einem Repository? Welche Datenbanken können mit Windows verbunden werden?
Antworten: INFORMATICA-Objekte können im XML-Format geschrieben werden.
Im Folgenden finden Sie eine Liste der Datenbanken, mit denen eine Verbindung hergestellt werden kann:
- SQL Server
- Orakel
- MS Access
- MS Excel
- DB2
- Sybase
- Teradata
F # 3) Was ist INFORMATICA PowerCenter?
Antworten: Es ist ein ETL / Datenintegrationstool, mit dem Daten aus verschiedenen Quellen und Datenverarbeitungen verbunden und abgerufen werden. PowerCenter verarbeitet ein hohes Datenvolumen und unterstützt das Abrufen von Daten aus ERP-Quellen wie SAP, PeopleSoft usw.
Sie können PowerCenter mit Datenbankverwaltungssystemen wie SQL und Oracle verbinden, um Daten in das dritte System zu integrieren.
F # 4) Welche verschiedenen Editionen von INFORMATICA PowerCenter sind verfügbar?
Antwort: Verschiedene Editionen von INFORMATICA PowerCenter sind:
- Standard Edition
- Advanced Edition
- Premium Edition
Die aktuell verfügbare Version von PowerCenter ist Version 10 mit einer hohen Leistungssteigerung.
F # 5) Wie können Sie zwischen PowerCenter und Power Map unterscheiden?
Antwort: Nachfolgend sind die Unterschiede zwischen PowerCenter und Power Map aufgeführt.
IT PowerCenter | Informatik PowerMart | ||
---|---|---|---|
5858 | 4566 | 3550 | 23.01.2016 |
1. | Verarbeitet große Datenmengen | Verarbeitet geringes Datenvolumen | |
2. | Unterstützt globale und lokale Repositorys | Unterstützt nur lokale Repositorys | |
3. | Unterstützt das Abrufen von Daten aus ERP Quellen wie SAP, PeopleSoft usw. | Unterstützen Sie das Abrufen von Daten aus ERP-Quellen nicht | |
Vier. | Konvertiert lokale Repositorys in globale | Konvertieren Sie keine lokalen Repositorys in globale |
F # 6) Was sind die verschiedenen Komponenten von PowerCenter?
Antwort: Nachfolgend sind die 7 wichtigen Komponenten von PowerCenter aufgeführt:
- PowerCenter-Service
- PowerCenter-Clients
- PowerCenter Repository
- PowerCenter-Domäne
- Repository-Service
- Integrationsservice
- PowerCenter-Verwaltungskonsole
- Web Service Hub
F # 7) Was sind die verschiedenen Clients von PowerCenter?
Antwort: Hier ist die Liste der PowerCenter-Clients:
- PowerCenter Designer
- PowerCenter-Workflow-Monitor
- PowerCenter Workflow Manager
- PowerCenter-Repository-Manager
F # 8) Was ist das INFORMATICA PowerCenter Repository?
Antworten: PowerCenter Repository ist eine relationale Datenbank oder eine Systemdatenbank, die Metadaten wie z.
- Quelldefinition
- Zieldefinition
- Sitzung und Sitzungsprotokolle
- Arbeitsablauf
- ODBC-Verbindung
- Kartierung
Es gibt zwei Arten von Repositorys:
- Globale Repositories
- Lokale Repositorys
PowerCenter Repository ist erforderlich, um das Extrahieren, Transformieren und Laden (ETL) basierend auf Metadaten durchzuführen.
F # 9) Wie wird die Ablaufverfolgungsstufe ausgearbeitet?
Antworten: Die Ablaufverfolgungsstufe kann als die Menge an Informationen definiert werden, die der Server in die Protokolldatei schreibt. Die Ablaufverfolgungsebene wird entweder auf Transformationsebene oder auf Sitzungsebene auf beiden Ebenen erstellt und konfiguriert.
Nachstehend sind die 4 Arten der Rückverfolgungsstufe aufgeführt:
- Keiner
- Knapp
- Ausführliche Initialisierung
- Ausführliche Daten
F # 10) Wie kann der PowerCenter-Integrationsservice ausgearbeitet werden?
Antworten: Integration Services steuern den Workflow und die Ausführung von PowerCenter-Prozessen.
Es gibt drei Komponenten der INFORMATICA-Integrationsdienste, wie in der folgenden Abbildung dargestellt.
Integrationsservice-Prozess: Es wird als pmserver bezeichnet. Der Integrationsdienst kann mehr als einen Prozess starten, um den Workflow zu überwachen.
Lastverteilung: Der Lastausgleich bezieht sich auf die Verteilung der gesamten Arbeitslast auf mehrere Knoten im Raster. Ein Load Balancer führt verschiedene Aufgaben aus, darunter Befehle, Sitzungen usw.
Data Transformation Manager (DTM): Mit Data Transformation Manager können die folgenden Datentransformationen durchgeführt werden:
- Aktiv: So ändern Sie die Anzahl der Zeilen in der Ausgabe.
- Passiv: Die Anzahl der Zeilen in der Ausgabe kann nicht geändert werden.
- In Verbindung gebracht: Link zur anderen Transformation.
- Nicht verbunden: Keine Verbindung zu anderen Transformationen.
Q # 11) Was ist PowerCenter on Grid?
Antworten: INFORMATICA verfügt über die Funktion des Grid-Computing, die für die größte Skalierbarkeit der Daten in Bezug auf die Leistung verwendet werden kann. Die Rasterfunktion wird für den Lastausgleich und die Parallelverarbeitung verwendet.
PowerCenter-Domänen enthalten mehrere Knoten, um die Arbeitslast zu konfigurieren und dann im Grid auszuführen.
ZU Domain ist eine Grundlage für eine effiziente Serviceverwaltung, die vom PowerCenter bereitgestellt wird.
Knoten ist eine unabhängige physische Maschine, die zum Ausführen der PowerCenter-Umgebung logisch dargestellt wird.
F # 12) Was ist Enterprise Data Warehousing?
Antworten: Wenn eine große Datenmenge an einem einzelnen Zugriffspunkt zusammengestellt wird, spricht man von Enterprise Data Warehousing. Diese Daten können in regelmäßigen Abständen oder je nach Bedarf wiederverwendet und analysiert werden.
Enterprise Data Warehousing wird als zentrale Datenbank oder als zentraler Zugriffspunkt betrachtet und bietet eine vollständige globale Sicht und hilft somit bei der Entscheidungsunterstützung.
Es kann aus den folgenden Punkten besser verstanden werden, die seine Merkmale definieren:
- Auf alle wichtigen Geschäftsinformationen, die in dieser einheitlichen Datenbank gespeichert sind, kann von überall im Unternehmen zugegriffen werden.
- Obwohl die erforderliche Zeit länger ist, führt eine regelmäßige Analyse dieser einzelnen Quelle immer zu besseren Ergebnissen.
- Die Sicherheit und Integrität von Daten wird niemals beeinträchtigt, während sie im gesamten Unternehmen zugänglich gemacht werden.
F # 13) Was ist der Vorteil der Sitzungspartitionierung?
Antworten: Während der Integrationsdienst in der Umgebung ausgeführt wird, wird der Workflow für eine bessere Leistung partitioniert. Diese Partitionen werden dann zum Extrahieren, Transformieren und Laden verwendet.
Q # 14) Wie können wir nach Abschluss des Ladevorgangs einen Index erstellen?
Antworten: Befehlsaufgaben werden zum Erstellen eines Index verwendet. Befehlsaufgabenskripte können in einer Sitzung des Workflows verwendet werden, um einen Index zu erstellen.
F # 15) Was sind Sitzungen?
Antworten: Sitzung ist eine Reihe von Anweisungen, die beim Verschieben von Daten von der Quelle zum Ziel verwendet werden. Wir können die Sitzung partitionieren, um mehrere Sitzungssequenzen zu implementieren, um die Serverleistung zu verbessern.
Nach dem Erstellen einer Sitzung können wir den Server-Manager oder das Befehlszeilenprogramm verwenden pmcmd um die Sitzung zu stoppen oder zu starten.
F # 16) Wie können wir Batches verwenden?
Antworten: Batches sind die Sammlung von Sitzungen, mit denen die Daten von der Quelle zum Ziel auf einem Server migriert werden. Batches können die größte Anzahl von Sitzungen enthalten, verursachen jedoch mehr Netzwerkverkehr, während weniger Sitzungen in einem Batch schnell verschoben werden können.
F # 17) Was ist Mapping?
Antworten: Mapping ist eine Sammlung von Quellen und Zielen, die durch bestimmte Transformationssätze wie Ausdruckstransformation, Sortiertransformation, Aggregatortransformation, Routertransformation usw. miteinander verbunden sind.
F # 18) Was ist Transformation?
Antworten: Die Transformation kann als eine Reihe von Regeln und Anweisungen definiert werden, die angewendet werden müssen, um den Datenfluss und die Datenlast am Ziel zu definieren.
F # 19) Was ist Ausdruckstransformation?
Antworten: Es handelt sich um eine Zuordnungstransformation, mit der Daten in jeweils einem Datensatz transformiert werden. Die Ausdruckstransformation kann passiv oder verbunden sein. Der Ausdruck wird zur Datenmanipulation und Ausgabegenerierung unter Verwendung von bedingten Anweisungen verwendet.
F # 20) Was ist Update Strategy Transformation?
Antworten: Die Aktualisierungsstrategie in Informatica wird verwendet, um die durchlaufenden Daten zu steuern und zu kennzeichnen, z. B. INSERT, UPDATE, DELETE und REJECT. Wir können eine bedingte Logik in der Update Strategy Transformation festlegen, um sie zu kennzeichnen.
F # 21) Was ist Sorter Transformation?
Wie öffnet man eine Bin-Datei?
Antworten: Die Sortiertransformation wird verwendet, um große Datenmengen über mehrere Ports zu sortieren. Es ist sehr wahrscheinlich, dass es in SQL als ORDER BY-Klausel funktioniert. Die Sortierumwandlung kann aktiv, passiv oder verbunden sein.
Die aktive Transformation durchläuft die Zuordnung und ändert die Anzahl der Zeilen, während die passive Transformation die Zuordnung durchläuft, jedoch die Anzahl der Zeilen nicht ändert.
Die meisten INFORMATICA-Transformationen sind mit dem Datenpfad verbunden.
F # 22) Was ist Router-Transformation?
Antworten: Die Router-Transformation wird verwendet, um die Quelldaten zu filtern. Sie können die Router-Transformation verwenden, um eine einzelne Datenquelle aufzuteilen.
Es ähnelt der Filtertransformation, aber der einzige Unterschied besteht darin, dass die Filtertransformation nur eine Transformationsbedingung verwendet und die Zeilen zurückgibt, die die Bedingung nicht erfüllen, während die Routertransformation mehrere Transformationsbedingungen verwendet und die Zeilen zurückgibt, die sogar einer einzelnen Bedingung entsprechen.
F # 23) Was ist Rangtransformation?
Antworten: Die Rangtransformation ist sowohl aktiv als auch verbunden. Es wird verwendet, um eine Reihe von Datensätzen entweder oben oder unten zu sortieren und zu ordnen. Es wird auch verwendet, um Daten mit dem größten oder kleinsten numerischen Wert basierend auf einem bestimmten Port auszuwählen.
F # 24) Was ist der Rangindex bei der Rangtransformation?
Antworten: Der Rangindex wird vom Task-Designer jedem Datensatz zugewiesen. Der Rangindexport wird verwendet, um die Rangposition für jede Zeile zu speichern. Die Rangtransformation identifiziert jede Zeile von oben nach unten und weist dann den Rangindex zu.
F # 25) Was ist der Statuscode in INFORMATICA?
Antworten: Code bietet während jeder Sitzung einen Fehlerbehandlungsmechanismus. Der Statuscode wird von der gespeicherten Prozedur ausgegeben, um zu erkennen, ob sie erfolgreich festgeschrieben wurde oder nicht, und stellt dem INFORMATICA-Server Informationen zur Verfügung, um zu entscheiden, ob die Sitzung gestoppt oder fortgesetzt werden muss.
F # 26) Was sind Junk-Dimensionen?
Antworten: Die Junk-Dimension ist eine Struktur, die aus einer Gruppe einiger Junk-Attribute wie Zufallscodes oder Flags besteht. Es bildet ein Framework zum Speichern verwandter Codes in Bezug auf eine bestimmte Dimension an einem einzigen Ort, anstatt mehrere Tabellen für dieselbe zu erstellen.
F # 27) Was ist Mapplet in Informatica?
Antworten: Mapplet ist ein wiederverwendbares Objekt, das bestimmte Regeln für die Transformation und Transformationslogik enthält, die in mehreren Zuordnungen verwendet werden können. Mapplet wird im Mapplet-Designer im Designer-Tool erstellt.
Q # 28) Was ist Decodieren in Informatica?
Antworten: Um Decode zu verstehen, betrachten wir es als ähnlich wie die CASE-Anweisung in SQL. Es ist im Grunde die Funktion, die von einer Ausdruckstransformation verwendet wird, um einen bestimmten Wert in einem Datensatz zu suchen.
Innerhalb der Decode-Funktion können unbegrenzt gesucht werden, wobei ein Port für die Rückgabe von Ergebniswerten angegeben wird. Diese Funktion wird normalerweise in Fällen verwendet, in denen verschachtelte IF-Anweisungen oder Suchwerte durch Suchen in kleinen Tabellen mit konstanten Werten ersetzt werden müssen.
Dekodieren ist eine Funktion, die in der Ausdruckstransformation verwendet wird. Es wird genau wie die CASE-Anweisung in SQL verwendet, um einen bestimmten Datensatz zu durchsuchen.
Unten finden Sie ein einfaches Beispiel für einen CASE in SQL:
Syntax:
SELECT EMPLOYEE_ID, CASE WHEN EMPLOYEE_AGE <= 20 THEN 'Young' WHEN EMPLOYEE_AGE> 30 AND AGE <= 40 THEN 'Knowledgeable' WHEN EMPLOYEE_AGE> 40 AND AGE = 60 THEN ‘Wise’ ELSE ‘Very Wise’ END AS EMPLOYEE_WISDOM FROM EMPLOYEE
F # 29) Was ist Joiner Transformation in INFORMATICA?
Antworten: Mithilfe der Joiner-Transformation können Sie Joins in INFORMATICA verwenden.
Es basiert auf zwei Quellen, nämlich:
- Master-Quelle
- Detailquelle
Folgende Joins können mithilfe der Joiner-Transformation wie in SQL erstellt werden.
- Normal Join
- Volle äußere Verbindung
- Master Outer Join (Right Outer Join)
- Detail Outer Join (Links Outer Join)
F # 30) Was ist Aggregator-Transformation in INFORMATICA?
Antworten: Die Aggregatorumwandlung kann aktiv oder verbunden sein. Es funktioniert als GROUP BY-Klausel in SQL. Es ist nützlich, aggregierte Berechnungen für Gruppen in INFORMATICA PowerCenter durchzuführen. Es führt eine Aggregatberechnung für Daten unter Verwendung der Aggregattypfunktion durch, d. H. SUM, AVG, MAX und MIN.
F # 31) Was ist Sequenzgenerator-Transformation in INFORMATICA?
Antworten: Die Sequenzgenerator-Transformation kann passiv oder verbunden sein. Die grundlegende Verwendung besteht darin, mit NEXTVAL und CURRVAL einen ganzzahligen Wert zu generieren.
F # 32) Was ist Union Transformation in INFORMATICA?
Antworten: Die Union-Transformation wird verwendet, um Daten aus verschiedenen Quellen zu kombinieren und mit demselben Port und Datentyp zu versehen. Es ist einer Klausel in SQL sehr ähnlich.
F # 33) Was ist Source Qualifier Transformation in INFORMATICA?
Antworten: Die Umwandlung von Quellqualifizierern ist beim Mapping hilfreich. Wenn wir relationale Flatfiles hinzufügen, wird diese automatisch erstellt. Es ist eine aktive und verbundene Transformation, die diejenigen Zeilen darstellt, die vom Integrationsdienst gelesen werden.
F # 34) Was ist INFORMATICA Worklet?
Antworten: Worklet funktioniert als Mapplet mit der Funktion der Wiederverwendbarkeit. Der einzige Unterschied besteht darin, dass wir das Worklet im Gegensatz zu Mapplet auf eine beliebige Anzahl von Workflows in INFORMATICA anwenden können. Worklet speichert die Logik und Aufgaben an einem einzigen Ort, um sie wiederzuverwenden.
Worklet ist dem Mapplet sehr ähnlich und wird als Gruppe von Aufgaben definiert, die auf Workflow-Ebene entweder wiederverwendbar oder nicht wiederverwendbar sein können. Es kann zu beliebig vielen Workflows hinzugefügt werden. Mit seiner Wiederverwendbarkeitsfunktion wird viel Zeit gespart, da wiederverwendbare Logik einmal entwickelt und dort platziert werden kann, wo sie wiederverwendet werden kann.
In der INFORMATICA PowerCenter-Umgebung werden Mapplets als die vorteilhafteste Funktion angesehen. Sie werden in Mapplet-Designern erstellt und sind Teil des Designer-Tools.
Es enthält im Wesentlichen eine Reihe von Transformationen, die für die Mehrfachzuordnung wiederverwendet werden sollen.
Mapplets sollen wiederverwendbare Objekte sein, die die Zuordnung vereinfachen, indem:
- Einschließlich mehrerer Transformationen und Quelldefinitionen.
- Nicht erforderlich, um eine Verbindung zu allen Eingangs- und Ausgangsanschlüssen herzustellen.
- Akzeptieren Sie Daten aus Quellen und übergeben Sie sie an mehrere Transformationen
Insgesamt sollte die Logik in Mapplet platziert werden, wenn die Zuordnungslogik wiederverwendet werden muss.
F # 35) Was ist SUBSTR in INFORMATICA?
Antworten: SUBSTR ist eine Funktion, die einen Zeichensatz aus einem größeren Zeichensatz extrahiert oder entfernt.
Syntax: SUBSTR (Zeichenfolge, Start (, Länge))
Wo,
Zeichenfolge definiert das Zeichen, nach dem gesucht werden soll.
Start ist eine Ganzzahl, mit der die Position festgelegt wird, an der mit dem Zählen begonnen werden soll.
Länge ist ein optionaler Parameter, mit dem die Länge eines Strings gezählt wird, der von seiner Startposition zurückkehrt.
Zum Beispiel, SUBSTR (Kontakt, 5, 8), wo wir mit dem 5. Zeichen unseres Kontakts beginnen und zu den nächsten 8 Zeichen zurückkehren.
F # 36) Was ist Codepage-Kompatibilität?
Antworten: Wenn Daten von der Quellcodepage zur Zielcodepage übertragen werden, müssen alle Merkmale der Quellseite auf der Zielseite vorhanden sein, um Datenverlust zu vermeiden. Diese Funktion wird als Codepage-Kompatibilität bezeichnet.
Die Codepage-Kompatibilität wird angezeigt, wenn der INFORMATICA-Server im Unicode-Datenverschiebungsmodus ausgeführt wird. In diesem Fall gelten die beiden Codepages als identisch, wenn ihre codierten Zeichen praktisch identisch sind, und führen somit zu keinem Datenverlust.
Für eine vollständige Genauigkeit wird gesagt, dass die Quellcodepage die Teilmenge der Zielcodepage ist.
F # 37) Wie können Sie zwischen Connected LookUp und Unconnected LookUp unterscheiden?
Antworten: Connected Lookup ist Teil des Datenflusses, der mit einer anderen Transformation verbunden ist. Die Dateneingabe erfolgt direkt von einer anderen Transformation, die eine Suche durchführt. Es verwendet sowohl statischen als auch dynamischen Cache.
Unconnected Lookup übernimmt nicht die Dateneingabe einer anderen Transformation, kann jedoch als Funktion in jeder Transformation mit dem LKP-Ausdruck (LookUp) verwendet werden. Es wird der einzige statische Cache verwendet.
F # 38) Was ist inkrementelle Aggregation?
Antworten: Inkrementelle Aggregation wird generiert, sobald eine Sitzung erstellt wird. Es wird verwendet, um Änderungen in den Quelldaten zu berechnen, die die Zieldaten nicht mit signifikanten Änderungen ändern.
KUNDEN-NR | BILL_NO | MENGE | DATUM |
---|---|---|---|
1001 | 4001 | 1000 | 01/11/2016 |
2001 | 4002 | 2550 | 01/11/2016 |
3001 | 5012 | 4520 | 01/11/2016 |
1001 | 6024 | 2000 | 23.01.2016 |
1001 | 6538 | 5240 | 23.01.2016 |
2001 | 7485 | 5847 | 23.01.2016 |
1515 | 4572 | 6000 | 23.01.2016 |
Beim ersten Laden lautet die Ausgabe:
KUNDEN-NR | BILL_NO | LOAD_KEY | MENGE |
---|---|---|---|
1001 | 4001 | 20011 | 1000 |
2001 | 4002 | 20011 | 2550 |
3001 | 5012 | 20011 | 4520 |
Beim zweiten Laden werden die Daten mit dem nächsten Sitzungsdatum zusammengefasst.
KUNDEN-NR | BILL_NO | LOAD_KEY | MENGE | Bemerkungen / Bedienung |
---|---|---|---|---|
1001 | 6538 | 20011 | 8240 | Die Cache-Datei wird nach der Aggregation aktualisiert |
2001 | 7485 | 20011 | 8397 | Die Cache-Datei wird nach der Aggregation aktualisiert |
3001 | 5012 | 20011 | 4520 | Keine Änderung |
5858 | 4566 | 20011 | 3550 | Keine Änderung |
1515 | 4572 | 20011 | 6000 | Keine Änderung |
F # 39) Was ist ein Ersatzschlüssel?
Antworten: Ein Ersatzschlüssel ist ein sequentiell generierter ganzzahliger Wert, der als weiterer Ersatz oder Ersatz für den Primärschlüssel verwendet wird, der als eindeutige Identifikation jeder Zeile in einer Tabelle erforderlich ist.
Der Primärschlüssel kann je nach Bedarf häufig geändert werden, was den Aktualisierungsprozess für eine zukünftige Anforderung erschwert. Der Ersatzschlüssel ist die einzige Lösung für dieses Problem.
F # 40) Was ist die Sitzungsaufgabe und die Befehlsaufgabe?
Antworten: Die Sitzungsaufgabe besteht aus einer Reihe von Anweisungen, die beim Übertragen von Daten von der Quelle zum Ziel mithilfe des Sitzungsbefehls angewendet werden müssen. Der Sitzungsbefehl kann entweder ein Befehl vor der Sitzung oder ein Befehl nach der Sitzung sein.
Befehlsaufgabe ist eine bestimmte Aufgabe, mit der ein oder mehrere Shell-Befehle von UNIX unter Windows während des Workflows ausgeführt werden können
F # 41) Was ist die eigenständige Befehlsaufgabe?
Antworten: Mit der eigenständigen Befehlsaufgabe können Sie den Shell-Befehl überall und jederzeit im Workflow ausführen.
Q # 42) Was ist ein Workflow? Was sind die Komponenten des Workflow Managers?
Antworten: Der Workflow ist die Art und Weise, wie die Aufgabe implementiert werden sollte. Es handelt sich um eine Sammlung von Anweisungen, die den Server über die Implementierung der Aufgabe informieren.
Im Folgenden sind die drei Hauptkomponenten des Workflow Managers aufgeführt:
- Task Designer
- Aufgabenentwickler
- Workflow Designer
F # 43) Was ist das Ereignis und welche Aufgaben sind damit verbunden?
Antworten: Das Ereignis kann eine beliebige Aktion oder Funktion sein, die im Workflow auftritt.
Damit sind zwei Aufgaben verbunden, darunter:
- Event Wait Task: Diese Aufgabe wartet, bis ein Ereignis eintritt. Sobald das Ereignis ausgelöst wird, wird diese Aufgabe ausgeführt und weist die nächste Aufgabe zu.
- Ereignisse auslösen Aufgabe: Die Aufgabe 'Ereignis auslösen' löst das spezifische Ereignis im Workflow aus.
Q # 44) Was ist ein vordefiniertes Ereignis und ein benutzerdefiniertes Ereignis?
Antworten: Vordefinierte Ereignisse sind systemdefinierte Ereignisse, die bis zum Eintreffen einer bestimmten Datei an einem bestimmten Speicherort warten. Es wird auch als File-Watcher-Ereignis bezeichnet.
Benutzerdefinierte Ereignisse werden vom Benutzer erstellt, um sie nach ihrer Erstellung jederzeit im Workflow auszulösen.
F # 45) Was ist der Target Designer und die Target Load Order?
Antworten: Der Ziel-Designer wird zum Definieren des Datenziels verwendet.
Wenn mehrere Quellen oder eine einzelne Quelle mit mehreren Partitionen über den INFORMATICA-Server mit verschiedenen Zielen verknüpft sind, definiert der Server mithilfe der Zielladereihenfolge die Reihenfolge, in der die Daten auf ein Ziel geladen werden sollen.
F # 46) Was ist der Bereitstellungsbereich?
Antworten: Der Staging-Bereich ist eine Datenbank, in der temporäre Tabellen, die mit dem Arbeitsbereich verbunden sind, oder Faktentabellen gespeichert werden, um Eingaben für die Datenverarbeitung bereitzustellen.
F # 47) Was ist der Unterschied zwischen STOP und ABORT?
Antwort: Die Unterschiede sind wie folgt:
- STOP Der Befehl wird für die Sitzungstask ausgeführt. Sobald er ausgelöst wird, liest der Integrationsdienst nicht mehr nur die Daten in der Datenquelle, sondern verarbeitet sie weiter und schreibt sie in das Ziel.
- ABTREIBUNG Der Befehl wird verwendet, um den Integrationsdienst vollständig daran zu hindern, Daten zu lesen, zu verarbeiten und in das Ziel zu schreiben. Es hat eine eigene Zeitüberschreitung von 60 Sekunden, um die Verarbeitung und das Schreiben von Daten über den Integrationsdienst abzuschließen. Wenn dies nicht der Fall ist, wird die Sitzung einfach abgebrochen.
F # 48) Was sind die verschiedenen LookUp-Caches?
Antworten: Die Suche kann entweder zwischengespeichert oder nicht zwischengespeichert werden. Grundsätzlich ist es in fünf Teile gegliedert.
Sie sind:
- Statischer Cache
- Dynamischer Cache
- Recache
- Permanenter Cache
- Geteilter Cache
Der statische Cache bleibt unverändert, während eine Sitzung ausgeführt wird.
Der dynamische Cache wird regelmäßig aktualisiert, während eine Sitzung ausgeführt wird.
F # 49) Wie aktualisiere ich die Quelldefinition?
Antworten: Es gibt zwei Möglichkeiten, die Quelldefinition zu aktualisieren.
Sie sind:
- Sie können die vorhandene Quelldefinition bearbeiten.
- Sie können eine neue Quelle aus der Datenbank importieren.
F # 50) Wie implementiere ich Sicherheitsmaßnahmen mit einem Repository-Manager?
Antworten: Es gibt drei Möglichkeiten, Sicherheitsmaßnahmen zu implementieren.
Sie sind:
- Ordnerberechtigung innerhalb von Eigentümern, Gruppen und Benutzern.
- Sperren (Lesen, Schreiben, Abrufen, Speichern und Ausführen).
- Repository-Berechtigungen, d. H.
- Repository durchsuchen.
- Verwenden Sie den Workflow-Manager (um Sitzungen und Stapel zu erstellen und deren Eigenschaften festzulegen).
- Workflow-Operator (zum Ausführen von Sitzungen und Stapeln).
- Verwenden Sie Designer, Admin-Repository (ermöglicht es jedem Benutzer, ein Repository zu erstellen und zu verwalten).
- Administratorbenutzer (ermöglicht dem Benutzer, einen Repository-Server zu erstellen und seine Eigenschaften festzulegen).
- SuperUser (alle Berechtigungen werden dem Benutzer gewährt).
F # 51) Nutzen Sie die Vorteile von INFORMATICA.
Antworten: Als das beliebteste Datenintegrationstool gelten mehrere Vorteile, die genutzt werden müssen.
Sie sind:
- Es kann effektiv und sehr effizient kommunizieren und die Daten zwischen verschiedenen Datenquellen wie Mainframe, RDBMS usw. transformieren.
- Es ist normalerweise sehr schnell, robust und einfach zu lernen als jede andere verfügbare Plattform.
- Mit Hilfe des INFORMATICA Workflow Monitor können Jobs einfach überwacht, fehlgeschlagene Jobs wiederhergestellt und auf langsam laufende Jobs hingewiesen werden.
- Es verfügt über Funktionen wie einfache Verarbeitung von Datenbankinformationen, Datenvalidierung, Migration von Projekten von einer Datenbank in eine andere, Projektentwicklung, Iteration usw.
F # 52) Tragen Sie einige Bereiche oder Echtzeitsituationen ein, in denen INFORMATICA erforderlich ist.
Antworten: Data Warehousing, Datenintegration, Datenmigration und Anwendungsmigration von einer Plattform auf andere Plattformen sind einige Beispiele für Echtzeit-Nutzungsbereiche.
F # 53) Erläutern Sie das ETL-Programm anhand einiger Beispiele.
Antworten: Das ETL-Tool ist für seine Einzigartigkeit bekannt und steht für das Tool zum Extrahieren, Transformieren und Laden. Es löst im Wesentlichen den Zweck, Daten zu extrahieren und an einen Ort zu senden, der durch Ändern definiert wurde.
Um genau zu sein:
- Die Extraktionsaufgabe besteht darin, die Daten aus Quellen wie der Datenbank, Dateien usw. zu sammeln.
- Bei der Transformation werden die von der Quelle empfangenen Daten geändert.
- Das Laden definiert den Prozess des Zuführens der geänderten Daten zum definierten Ziel.
Um dies auf technische Weise zu verstehen, sammelt das ETL-Tool Daten aus heterogenen Quellen und ändert sie, um sie homogen zu machen, sodass sie für die Analyse der definierten Aufgabe weiter verwendet werden können.
Einige grundlegende Programmbeispiele umfassen:
- Zuordnungen leiten den ETL-Prozess des Lesens von Daten aus ihren ursprünglichen Quellen ab, wobei der Zuordnungsprozess im Designer ausgeführt wird.
- Workflows bestehen aus mehreren Aufgaben, die im Workflow Manager-Fenster festgelegt und entworfen werden.
- Die Aufgabe besteht aus mehreren Schritten, die die Reihenfolge der zur Laufzeit auszuführenden Aktionen festlegen.
F # 54) Tragen Sie die Unterschiede zwischen Datenbank und Data Warehouse ein.
Antworten: In der folgenden Tabelle finden Sie die Unterschiede zwischen den beiden:
Was ist der beste Musik-Downloader für Android-Handy
Datenbank | Data Warehouse |
---|---|
Es speichert / zeichnet aktuelle und aktuelle Daten auf, die im täglichen Betrieb verwendet werden | Es speichert / analysiert historische Daten, die langfristig zur Informationsunterstützung verwendet werden. |
Die Ausrichtung liegt auf der Online-Transaktionsverarbeitung, die einfache und kurze Transaktionen umfasst. | Die Ausrichtung liegt auf der Online-Analyseverarbeitung, die komplexe Abfragen umfasst. |
Es besteht aus detaillierten und primitiven Daten, deren Ansicht flach relational ist. | Es besteht aus zusammengefassten konsolidierten Daten, deren Ansicht mehrdimensional ist. |
Bei analytischen Abfragen wird eine geringe Leistung beobachtet. | Analytische Abfragen werden hier als leistungsstark beurteilt. |
Die Effizienz wird durch Messung des Transaktionsdurchsatzes bestimmt. | Die Effizienz wird durch Messen des Abfragedurchsatzes und der Antwortzeit bestimmt. |
F # 55) Erläutern Sie die Funktionen der Suche nach verbundenen und nicht verbundenen Verbindungen.
Antwort: Die Funktionen von Connected Lookup können wie folgt erklärt werden:
- Es gibt eine direkte Eingabequelle aus der Pipeline für die Suche nach verbundenen Verbindungen.
- Es ist aktiv am Datenfluss beteiligt und es wird sowohl der dynamische als auch der statische Cache verwendet.
- Es werden alle Suchspalten zwischengespeichert und die Standardwerte als Ausgabe zurückgegeben, wenn die Suchbedingung nicht übereinstimmt.
- Es können mehrere Spaltenwerte an den Ausgabeport zurückgegeben werden.
- Es werden mehrere Ausgabewerte übergeben und Ausgabeports mit einer anderen Transformation verknüpft.
- Connected Lookup unterstützt benutzerdefinierte Standardwerte.
Die Funktionen der nicht verbundenen Suche können wie folgt erklärt werden:
- Bei der nicht verbundenen Suche wird ein statischer Cache verwendet, und die Eingabequelle ist das Ergebnis, das von der Ausgabe des LKP-Ausdrucks empfangen wird.
- Es werden nur die Lookup-Ausgabeports zwischengespeichert und der Wert als NULL zurückgegeben, wenn die Lookup-Bedingung nicht übereinstimmt.
- Von jedem Port wird nur eine Spalte zurückgegeben.
- Nur ein Ausgabewert wird an eine andere Transformation übergeben.
- Benutzerdefinierte Standardwerte werden von der nicht verbundenen Suche nicht unterstützt.
F # 56) Während der laufenden Sitzung werden Ausgabedateien vom Informatica-Server erstellt. Tragen Sie einige von ihnen ein.
Antworten: Im Folgenden sind die wenigen Ausgabedateien aufgeführt:
- Cache-Dateien: Diese Dateien werden zum Zeitpunkt der Erstellung des Speichercaches erstellt. Unter Umständen wie Lookup-Transformation, Aggregator-Transformation usw. werden Index- und Daten-Cache-Dateien vom Informatica-Server erstellt.
- Sitzungsdetaildatei: Wie der Name definiert, enthält diese Datei Ladestatistiken wie Tabellennamen, abgelehnte oder geschriebene Zeilen für jedes Ziel in der Zuordnung und kann im Monitorfenster angezeigt werden.
- Leistungsdetaildatei: Diese Datei ist Teil des Sitzungs-Eigenschaftenblatts und enthält Informationen zur Sitzungsleistung, um Verbesserungsbereiche zu ermitteln.
- INFORMATICA-Serverprotokoll: Der Server erstellt ein Protokoll für alle Status- und Fehlermeldungen und kann im Ausgangsverzeichnis angezeigt werden.
- Sitzungsprotokolldatei: Für jede Sitzung erstellt der Server abhängig von der festgelegten Ablaufverfolgungsstufe eine Sitzungsprotokolldatei. Die Informationen, die in Protokolldateien zu Sitzungen angezeigt werden, können sein:
- Sitzungsinitialisierungsprozess,
- Erstellung von SQL-Befehlen für Lese- und Schreib-Threads,
- Liste der aufgetretenen Fehler und
- Zusammenfassung laden
- E-Mail nach der Sitzung: Dies hilft bei der automatischen Übermittlung der Informationen über die Sitzung (Sitzung abgeschlossen / Sitzung fehlgeschlagen) an die gewünschten Empfänger.
- Datei ablehnen: Diese Datei enthält Informationen zu den Daten, die nicht für Ziele verwendet / geschrieben wurden.
- Steuerdatei: Wenn die Sitzung den externen Loader verwendet, besteht die Steuerdatei aus Ladeanweisungen und dem Datenformat für die Zieldatei.
- Indikatordatei: Diese Datei enthält im Wesentlichen eine Zahl, die die für INSERT / UPDATE / DELETE oder REJECT markierten Zeilen hervorhebt.
- Ausgabedatei: Die Ausgabedatei wird basierend auf den Dateieigenschaften erstellt.
F # 57) Wie kann man zwischen aktiven und passiven Transformationen unterscheiden?
Antworten: Um den Unterschied zwischen aktiven und passiven Transformationen zu verstehen, sehen wir uns seine Merkmale an, die die Unterschiede besser erklären.
Die von aktiven Transformationen ausgeführte Aktion umfasst:
- Ändern der Anzahl der Zeilen gemäß der Anforderung, die die Transformationen durchläuft. Zum Beispiel, Filtertransformation, die die Zeile löscht, die die Bedingung nicht erfüllt.
- Ändern der Transaktionsgrenze durch Festlegen der Rollback- und Commit-Punkte. Zum Beispiel, Transaktionssteuerungstransformation.
- Ändern des Zeilentyps für INSERT / UPDATE / DELETE oder REJECT.
Die von passiven Transformationen ausgeführte Aktion umfasst:
- Die Anzahl der Zeilen, die die Transformation durchlaufen, wird niemals geändert.
- Die Transaktionsgrenze wird festgelegt.
- Der Zeilentyp ist festgelegt.
F # 58) Tragen Sie die verschiedenen Arten von Transformationen ein.
Antwort: Die verschiedenen Arten von Transformationen sind wie folgt:
- Aggregator-Transformation
- Ausdruckstransformation
- Normalizer-Transformation
- Rangtransformation
- Filtertransformation
- Tischlertransformation
- Lookup-Transformation
- Transformation gespeicherter Prozeduren
- Transformation sortieren
- Strategie-Transformation aktualisieren
- XML-Quellqualifizierertransformation
- Router-Transformation
- Sequenzgenerator-Transformation
F # 59) Was ist dynamischer Cache?
Antworten: INFORMATICA-Lookups können entweder als zwischengespeichert oder nicht zwischengespeichert werden. Im Fall eines dynamischen Caches können Zeilen zum Zeitpunkt der Übergabe der Zeilen eingefügt oder gelöscht werden und werden mit dem Ziel synchronisiert. Der Cache-Speicher wird jedes Mal nach Lösch- / Aktualisierungsvorgängen innerhalb der Sitzung aktualisiert.
F # 60) Was ist Dekodierung im statischen Cache?
Antworten: Der statische Cache wird im Sitzungslauf weder aktualisiert noch aktualisiert. Dies ist der Standardcache und gibt den Wert nur zurück, wenn die Rückgabebedingung erfüllt ist. In anderen Fällen wird der Wert Null zurückgegeben. Das Einfügen oder Aktualisieren des Cache kann in diesem Fall nicht durchgeführt werden.
F # 61) Erwähnen Sie einige Vorteile der Router-Transformation gegenüber der Filter-Transformation.
Antworten: Routertransformation und Filtertransformation sind identisch, da beide eine Bedingung zum Testen und Filtern der Daten verwenden.
Die Vorteile des Routers gegenüber der Filtertransformation können jedoch anhand der unten genannten Punkte verstanden werden.
Router-Transformation:
- Es erlaubt mehr als eine Testbedingung.
- Bieten Sie die Möglichkeit, dieselben Eingabedaten unter mehreren Bedingungen zu testen.
- Bei der Zuordnung werden Eingabedaten nur einmal vom Server verarbeitet und somit die Leistung verbessert.
- Weniger komplex und effizienter.
- Die Datensätze, die die Testbedingung nicht erfüllen, werden stattdessen niemals blockiert. Sie werden an die Standardgruppe weitergeleitet.
F # 62) Tragen Sie einige Eigenschaften von Sitzungen ein.
Antworten: Eine Sitzung ist im Workflow-Manager verfügbar und wird durch Erstellen einer Sitzungsaufgabe konfiguriert. Innerhalb eines Zuordnungsprogramms können mehrere Sitzungen vorhanden sein und es kann entweder wiederverwendbar oder nicht wiederverwendbar sein.
Einige der Eigenschaften der Sitzung lauten wie folgt:
- Je nach Anforderung können Sitzungsaufgaben entweder gleichzeitig oder nacheinander ausgeführt werden.
- Eine Sitzung kann konfiguriert werden, um die Leistung zu analysieren.
- Zum Erstellen oder Ausführen einer Sitzungsaufgabe sind allgemeine Informationen zu Sitzungsname, Zeitplan und Integrationsdienst erforderlich.
- Weitere wichtige Eigenschaften der Sitzung sind die Sitzungsprotokolldatei, das Laden des Tests, die Fehlerbehandlung, das Festschreibungsintervall, die Zieleigenschaften usw.
F # 63) Tragen Sie die Aufgaben ein, für die die Quellqualifizierertransformation verwendet wird.
Antworten: Das Quellqualifikationsmerkmal wird als aktive Transformation betrachtet, die die Zeilen liest, die am Integrationsdienst in der laufenden Sitzung beteiligt sind. Es bestimmt die Art und Weise, wie die Daten aus der Quelle abgerufen werden, und wird automatisch hinzugefügt, während der Zuordnung eine Quelle hinzugefügt wird.
Die Liste der verschiedenen Aufgaben, bei denen das Quellqualifikationsmerkmal verwendet wird, lautet wie folgt:
- Zeilenfilterung
- Datensortierung
- Benutzerdefinierte Abfrageerstellung
- Verknüpfen von Tabellen aus derselben Quelle
- Verschiedene Werte auswählen
F # 64) Erwähnen Sie einige Power Center-Clientanwendungen mit ihrem grundlegenden Zweck?
Antworten: Aufgaben wie die Erstellung von Sitzungen und Workflows, die Überwachung des Workflow-Fortschritts, das Entwerfen von Mapplets usw. werden von PowerCenter-Clientanwendungen ausgeführt.
Nachfolgend finden Sie eine Liste der PowerCenter-Clientanwendungen mit ihrem Zweck:
- Repository Manager: Es ist ein Verwaltungstool, dessen Hauptzweck darin besteht, Repository-Ordner, Objekte, Gruppen usw. zu verwalten.
- Administrationskonsole: Hier werden die Serviceaufgaben wie Starten / Stoppen, Sichern / Wiederherstellen, Aktualisieren / Löschen usw. ausgeführt.
- Power Center Designer: Der Designer besteht aus verschiedenen Entwurfswerkzeugen, die verschiedenen Zwecken dienen. Diese Entwurfswerkzeuge sind:
- Source Analyzer
- Ziel-Designer
- Transformationsentwickler
- Mapplet Designer
- Mapping Manager
- Workflow Manager: Der Hauptzweck besteht darin, eine Reihe von Anweisungen / Workflows zu definieren, die zum Ausführen von im Designer entworfenen Zuordnungen erforderlich sind. Zur Unterstützung der Entwicklung eines Workflows stehen drei Tools zur Verfügung: Aufgabenentwickler, Workflow-Designer und Worklet-Designer.
- Workflow Monitor: Wie der Name schon sagt, überwacht der Workflow-Monitor den Workflow oder die Aufgaben. Die Liste der verfügbaren Fenster ist:
- Navigatorfenster
- Ausgabefenster
- Zeitfenster
- Eigenschaftenfenster
- Aufgabenansicht
- Gantt-Diagrammansicht
Fazit
Ich hoffe, dass Sie inzwischen eine klare Vorstellung von dem Tool und der Art der Fragen haben, die in Interviews gestellt werden.
INFORMATICA ist die beste Lösung für die Datenintegration. Es funktioniert mit Multi-Data-Management in einer Multi-Plattform-Umgebung wie Windows, Linux, Unix usw. und wird auf über 50.000 Plattformen getestet, um unter anderem bessere Ergebnisse und beste Leistung zu erzielen.
Kurz gesagt, INFORMATICA ist ein ETL-Tool, das Informationen oder Daten aus verschiedenen Quellen sammelt und diese Informationen auf die definierten spezifischen Ziele lädt, ohne sie tatsächlich zu speichern. Seine Aufgabe ist es, verschiedene Dienste und Ressourcen an verschiedene Maschinen zu liefern, und daher müssen die gelieferten Daten korrekt sein und bemerkenswerte Ergebnisse liefern.
Verbessern Sie das Wissen über Informatica-Konzepte in diesem Artikel und bereiten Sie sich sofort auf Ihr Interview vor.
Alles Gute!!!
Literatur-Empfehlungen
- Interview Fragen und Antworten
- Fragen und Antworten zum ETL-Testinterview
- Einige knifflige manuelle Testfragen und -antworten
- Top 32 der besten Fragen und Antworten zum Datastage-Interview
- Top Teradata Interview Fragen und Antworten
- Top 30 SAS Interview Fragen und Antworten
- Top 24 Fragen zum Datenmodellierungsinterview mit detaillierten Antworten
- 10 besten Datenanalyse-Tools für ein perfektes Datenmanagement (2021 LIST)
- Datenpoolfunktion in IBM Rational Quality Manager für Testdatenverwaltung
- Konzept, Prozess und Strategie des Testdatenmanagements
- Top 14 der besten Tools zur Verwaltung von Testdaten im Jahr 2021