top teradata interview questions
Am häufigsten gestellte Fragen und Antworten zum Teradata-Interview:
In diesem Tutorial werden einige häufig gestellte Fragen und Antworten zum Teradata-Interview aufgeführt, um das Konzept besser zu verstehen.
Teradata ist ein relationales Datenbankverwaltungssystem, das für die Verwendung mit großen Data Warehousing-Anwendungen geeignet ist. Das Hauptkonzept hinter dieser Technologie ist Parallelität.
Die Anwendung wurde von einer Firma namens Teradata Corporation, USA, entwickelt. Hunderte von Kunden haben Teradata für die Verwendung in Enterprise Data Warehousing und Data Analysis ausgewählt.
Die wichtigsten Fragen und Antworten zum Teradata-Interview
F # 1) Was ist Teradata? Listen Sie einige der Hauptmerkmale auf.
Antworten: Teradata ist ein relationales Datenbankverwaltungssystem, das für die Erstellung und Wartung von Data Warehouses, OLAP (Online Analytical Processing), OLTP (Online Transaction Processing) und DSS (Decision Support Systems) verwendet wird.
Das Folgende sind die Hauptmerkmale:
- Lauffunktionen für einzelne und mehrere Knoten.
- Aufbauend auf Parallelität.
- Kompatibel mit dem American National Standards Institute (ANSI).
- Verhält sich genauso wie der Server.
- Offenes System.
F # 2) Erläutern Sie kurz die folgenden Begriffe im Zusammenhang mit dem relationalen Datenbankverwaltungssystem (RDBMS):
- Datenbank
- Tabellen
- Säulen
- Reihe
- Primärschlüssel
- Unbekannter Schlüssel
Antworten:
- Datenbank : Eine Sammlung logisch zusammengehöriger Daten wird als Datenbank bezeichnet.
- Tabellen : Eine Tabelle wird als Grundeinheit im relationalen Datenbankverwaltungssystem definiert und zum Speichern von Daten verwendet. Zum Beispiel, Die Mitarbeitertabelle enthält Details zu den Mitarbeitern des Unternehmens.
- Säulen: Eine Spalte ist eine Einheit, die ähnliche Daten enthält. Zum Beispiel, Die Spalte Geburtsdatum in der Mitarbeitertabelle enthält nur Geburtstage.
- Reihe : Eine einzelne Instanz aller Spalten kann als Zeile identifiziert werden. Zum Beispiel, Die Details eines Mitarbeiters aus der Mitarbeitertabelle bestehen aus einer Zeile und einer Instanz jeder Spalte.
- Primärschlüssel : Primärschlüssel ist der Wert, mit dem eine Zeile in der Tabelle eindeutig identifiziert wird. Es sind keine doppelten Werte oder NULL-Werte zulässig. Es ist ein obligatorischer Wert.
- Unbekannter Schlüssel : Die Schlüssel, mit denen eine Beziehung zwischen den einzelnen Tabellen erstellt wird, werden als Fremdschlüssel identifiziert. Beim Entwurf der Master-Detail-Tabelle wird der Primärschlüssel einer übergeordneten Tabelle als Fremdschlüssel einer untergeordneten Tabelle entworfen.
F # 3) Welche verschiedenen Tabellentypen werden von Teradata unterstützt?
Antworten: Es gibt vier Arten von Tabellen, die von Teradata unterstützt werden. Diese sind:
- Ständiger Tisch : Permanente Tabelle ist der Standardtabellentyp. Diese Tabellen werden verwendet, um die Daten dauerhaft im System zu speichern.
- Flüchtiger Tisch : Flüchtige Tabellen werden verwendet, um die Daten nur während der Benutzersitzung zu speichern. Am Ende der Benutzersitzung wird die Tabelle mit ihren Daten gelöscht. Diese Tabellen sind wichtig, um Zwischendaten während der Datenübertragung oder bei komplexen Berechnungen zu speichern.
- Globale temporäre Tabelle : Die globale temporäre Tabelle wird zum Speichern der global verwendeten Werte in der gesamten Anwendung verwendet. Ihre Gültigkeit gilt nur für die aktuelle Benutzersitzung. Am Ende der Benutzersitzung wird die Tabelle mit ihren Daten gelöscht.
- Abgeleitete Tabelle : Abgeleitete Tabellen haben die kleinste Lebensdauer bis zur Ausführungszeit einer Abfrage. Diese Tabellen werden verwendet, um die Zwischenergebnisse während der Ausführung der Abfrage zu speichern.
F # 4) Mit welchen Befehlen können Sie eine neue Tabelle erstellen, eine Tabelle ändern und eine Tabelle in Teradata entfernen?
Antworten: Die Befehle sind CREATE TABLE, ALTER TABLE bzw. DROP TABLE.
F # 5) Was sind die Hauptkomponenten des Teradata-Systems?
Antworten: Es gibt vier Hauptkomponenten, die diesem System zugeordnet sind. Sie können wie folgt beschrieben werden:
- Knoten : Jeder einzelne Server in diesem System wird als Knoten bezeichnet und ist die Grundeinheit in einem Teradata-System. Ein Knoten besteht aus einer eigenen Kopie von Teradata RDBMS und einem eigenen Betriebssystem, einer CPU, einem Speicher und einem Speicherplatz. Bei einer physischen Struktur besteht ein Schrank aus einem oder mehreren Knoten.
- Analyse-Engine : Hier liegt die Hauptverantwortung darin, eine Anfrage vom Client zu erhalten (Clientabfragen) und einen effizienten Ausführungsplan zu erstellen. Die folgenden Hauptverantwortlichkeiten waren mit Parsing Engine verbunden:
- Empfängt clientseitige SQL-Abfragen und überprüft sie auf mögliche Syntaxfehler.
- Überprüft die verfügbaren Benutzerrechte, um die SQL-Abfrage auszuführen.
- Überprüft die tatsächliche Verfügbarkeit des der SQL-Abfrage zugeordneten Objekts.
- Bereitet den Ausführungsplan vor und führt SQL-Abfragen aus.
- Empfängt das Ergebnis und sendet es an den Client.
- Nachrichtenübermittlungsebene : In diesem System ist die Message Passing Layer, auch als BYNET bezeichnet, die Netzwerkschicht. Dies erleichtert die Kommunikation zwischen Parsing Engine, Access Module Processor und Nodes.
- Zugriff auf den Modulprozessor : Access Module Processor wird auch als Virtual Processors (vprocs) bezeichnet und ist der eigentliche Datenspeicher- und Abrufagent im Teradata-System. Nur der Access Module Processor kann Daten auf Datenträgern lesen und schreiben, auf denen die Daten physisch gespeichert werden.
F # 6) Welche Datentypen werden in Teradata häufig verwendet?
Antworten: Es werden verschiedene Datentypen unterstützt. In der folgenden Tabelle werden der Wertebereich und die Länge in Byte für häufig verwendete Datentypen beschrieben.
F # 7) Wie lautet die grundlegende Syntax für die Teradata SELECT-Anweisung? Erstellen Sie außerdem eine SELECT-Anweisung, um die Namen der Mitarbeiter, Vor- und Nachnamen abzurufen, indem Sie die folgende Tabelle berücksichtigen.
Antworten: Die grundlegende Syntax für die SELECT-Anweisung lautet wie folgt:
WÄHLEN Spalte 1, Spalte 2,… ..
VON Tabellenname;
SELECT EmployeeNo, FirstName, LastName FROM Employee;
F # 8) Listen Sie die logischen und bedingten Operatoren mit Bedeutungen auf, die mit Teradata verwendet werden.
Antworten: Logische und bedingte Operatoren sind unten aufgeführt:
Syntax | Bedeutung |
---|---|
IM | Wenn Werte in |
> | Größer als |
< | Weniger als |
> = | Größer als oder gleich wie |
<= | Weniger als oder gleich |
= | Gleich |
ZWISCHEN | Wenn Werte innerhalb des Bereichs liegen |
NICHT IN | Wenn Werte nicht in |
IST NULL | Wenn der Wert NULL ist |
IST NICHT NULL | Wenn der Wert NICHT NULL ist |
UND | Kombinieren Sie mehrere Bedingungen. Wird nur dann als wahr ausgewertet, wenn alle Bedingungen erfüllt sind |
ODER | Kombinieren Sie mehrere Bedingungen. Wird nur dann als wahr ausgewertet, wenn eine der Bedingungen erfüllt ist. |
NICHT | Kehrt die Bedeutung der Bedingung um |
F # 9) Beschreiben Sie das Schlüsselwort BETWEEN und sagen Sie das Ergebnis der bereitgestellten SELECT-Anweisung anhand der folgenden Tabelle voraus.
SELECT EmployeeNo, FirstName FROM Employee WHERE EmployeeNo BETWEEN 101 AND 103;
Antworten: Der Befehl BETWEEN wird verwendet, um einen bestimmten Wert zwischen dem angegebenen Bereich zu überprüfen.
Das Ergebnis der angegebenen SELECT-Anweisung ist EmployeeNo und der Vorname von EmployeeNo zwischen 101 und 103.
F # 10) Beschreiben Sie die Mengenoperatoren in Teradata.
Antworten: Set-Operatoren werden zum Kombinieren der Ergebnisse mehrerer SELECT-Anweisungen verwendet. Dies unterscheidet sich vom Join-Operator, da Join die Spalte in mehreren Tabellen kombiniert, Set-Operatoren jedoch zum Kombinieren mehrerer Zeilen verwendet werden.
Nachstehend sind die vier Set-Operatoren aufgeführt:
- UNION
- UNION ALL
- SCHNEIDEN
- MINUS / AUSSER
F # 11) Was ist der Unterschied zwischen UNION und UNION ALL?
Antworten: UNION kombiniert die Ergebnismenge durch Ignorieren von Duplikaten, UNION ALL kombiniert jedoch mit Duplikaten.
Java, wie man eine Liste erstellt
Hinweis: Die Fragen Nr. 12 bis 15 basieren auf den folgenden beiden Tabellen.
Mitarbeitertabelle
Gehaltsliste
F # 12) Beschreiben Sie das Ergebnis der folgenden SELECT-Anweisung im angegebenen Szenario.
SELECT EmployeeNo FROM Employee UNION SELECT EmployeeNo FROM Salary;
Antworten: Die SELECT-Anweisung hat den UNION-Set-Operator verwendet, um die Ergebnisse der beiden SELECT-Anweisungen zu kombinieren und Duplikate aus der Liste zu entfernen.
Ergebnis:
F # 13) Beschreiben Sie das Ergebnis der folgenden SELECT-Anweisung im angegebenen Szenario.
SELECT EmployeeNo FROM Employee UNION ALL SELECT EmployeeNo FROM Salary;
Antworten: Die SELECT-Anweisung hat den UNION ALL-Set-Operator verwendet, um das Ergebnis beider SELECT-Anweisungen zu kombinieren, ohne Duplikate aus der Liste zu entfernen.
Ergebnis:
F # 14) Beschreiben Sie das Ergebnis der folgenden SELECT-Anweisung im angegebenen Szenario.
SELECT EmployeeNo FROM Employee INTERSECT SELECT EmployeeNo FROM Salary;
Antworten: Die SELECT-Anweisung hat den INTERSECT-Set-Operator verwendet, um die gemeinsamen Werte für beide SELECT-Anweisungen zu kombinieren. Da Mitarbeiter Nr. 105 in der Gehaltstabelle nicht verfügbar ist, wird er aus dem Ergebnis entfernt.
Ergebnis:
F # 15) Beschreiben Sie das Ergebnis der folgenden SELECT-Anweisung im angegebenen Szenario.
SELECT EmployeeNo FROM Employee MINUS SELECT EmployeeNo FROM Salary;
Antworten: Die SELECT-Anweisung hat den MINUS-Set-Operator verwendet, um die Ergebniswerte der ersten SELECT-Anweisung mit Ausnahme der Ergebniswerte der zweiten SELECT-Anweisung anzuzeigen.
Da die EmployeeNo 101,102,103 und 104 in beiden Tabellen verfügbar sind, ist nur 105 im Endergebnis enthalten.
Ergebnis:
F # 16) Beschreiben Sie den Primärindex in Teradata. Und welche Primärindexarten stehen zur Verfügung?
Antworten: Der Mechanismus zum Festlegen, wo sich die Daten in den Teradata befinden, wird als Primärindex bezeichnet. Für jede Tabelle sollte ein Primärindex angegeben werden. Wenn nicht, wird der Tabelle ein Primärindex zugewiesen. Ein Primärindex bietet einen schnelleren Datenzugriff.
Es gibt zwei Arten von Primärindizes:
- Einzigartiger Primärindex (UPI)
- Nicht eindeutiger Primärindex (NUPI)
F # 17) Was ist der Zweck der Verwendung von CASE Expression in Teradata?
Antworten: CASE Expression wird verwendet, um jede Zeile anhand einer bestimmten Bedingung zu bewerten, die das Ergebnis basierend auf der ersten Übereinstimmung zurückgibt. Wenn keine übereinstimmende Bedingung vorliegt, wird das Teilergebnis zurückgegeben.
Die allgemeine Syntax eines CASE lautet wie folgt:
CASE WHEN THEN result-1 WHEN THEN result-2 ELSE Result-n END
F # 18) Was ist der Zweck von Joins und welche verfügbaren Join-Typen gibt es?
Antworten: Im Allgemeinen werden Joins verwendet, um die Datensätze aus mehr als einer Tabelle mithilfe gemeinsamer Spalten oder Werte zu kombinieren.
Im Folgenden sind die sieben Arten von Verknüpfungen aufgeführt, die mit Teradata verknüpft sind:
- Inner Join : Kombinieren Sie die Datensätze aus mehreren Tabellen und geben Sie den Wertesatz zurück, der in beiden Tabellen vorhanden ist.
- Linke äußere Verbindung : Gibt alle Datensätze in der linken Tabelle und nur übereinstimmende Datensätze aus der rechten Tabelle zurück.
- Right Outer Join: Gibt alle Datensätze in der rechten Tabelle und nur übereinstimmende Datensätze aus der linken Tabelle zurück.
- Vollständige äußere Verbindung: Es ist eine Kombination aus Left Outer Join und Right Outer Join. Gibt sowohl übereinstimmende als auch nicht übereinstimmende Datensätze aus beiden Tabellen zurück.
- Self-Join: Vergleichen Sie den Wert in einer Spalte mit den anderen Werten in derselben Spalte der Tabelle.
- Cross Join: Verbindet jede Zeile von der linken Tabelle mit jeder Zeile in der rechten Tabelle.
- Kartesische Produktion Beitritt: Funktioniert genauso wie Cross Join.
F # 19) Wie heißt Partitioned Primary Index (PPI) und welche Vorteile bietet die Verwendung in einer Abfrage?
Antworten: Partitioned Primary Index (PPI) ist ein Indexierungsmechanismus, mit dem die Leistung bestimmter Abfragen verbessert werden kann. Innerhalb einer Tabelle mit definiertem Partitioned Primary Index (PPI) werden Zeilen nach ihrer Partitionsnummer sortiert.
Innerhalb jeder Partition werden Datensätze nach ihrem Zeilen-Hash angeordnet. Außerdem werden Zeilen einer Partition basierend auf der Definition einer Partition zugewiesen.
Vorteile des partitionierten Primärindex (PPI):
- Bei mehreren Abfragen hilft PPI dabei, einen vollständigen Tabellenscan zu vermeiden, und es wird nur auf die erforderlichen Partitionen zugegriffen.
- Verhindert die Verwendung des Sekundärindex und hilft, zusätzliche Eingabe- / Ausgabewartung zu vermeiden.
- Schneller Zugriff auf die Teilmenge der großen Tabelle.
- Einfach alte Daten zu löschen und neue Daten hinzuzufügen.
F # 20) Definieren Sie Ansichten mit allgemeiner Syntax.
Antworten: Datenbankobjekte, die mithilfe von Abfragen für einzelne oder mehrere Tabellen erstellt wurden, werden als Ansichten bezeichnet. Die Definition für die Ansicht wird dauerhaft in der Datendefinition gespeichert und die ausgewählten Daten werden nicht gespeichert. Daten für die Ansicht sind zur Ausführungszeit ein dynamischer Prozess.
Allgemeine Syntax:
CREATE/REPLACE VIEW AS ;
F # 21) Was bedeutet Caching in Teradata?
Antworten: Das Caching funktioniert hauptsächlich mit der Quelle, die sich nicht häufig ändert. Das System verwendet die Datenblöcke weiterhin häufig in einem separaten Speicher in der Anwendung. Das Caching wird auch von mehreren Anwendungen gemeinsam genutzt.
F # 22) Was ist der Zweck des UPSERT-Befehls?
Antworten: Der UPSERT-Befehl wird für die Operation verwendet, um Update Else Insert Natures durchzuführen. Dies ist eine spezielle Option, die nur in Teradata verfügbar ist.
F # 23) Was ist der Unterschied zwischen schneller Last und Mehrfachlast?
Antworten: Beim schnellen Laden werden mehrere Sitzungen verwendet, um schnell eine große Datenmenge in eine leere Tabelle zu laden. Multi-Load wird verwendet, um die Aktivitäten von Tabellen und Ansichten mit hohem Volumen zu verwalten. Multi-Loads funktionieren auch mit nicht leeren Tabellen und mit Multi-Load können nur bis zu 5 Tabellen verwendet werden.
F # 24) Was sind die Operatoren und Funktionen zur String-Manipulation?
Antworten: Die Operatoren und Funktionen zur Zeichenfolgenmanipulation lauten wie folgt:
- || : Verketten Sie Zeichenfolgen miteinander und erstellen Sie eine einzelne Zeichenfolge.
- SUBSTR : Extrahiert nur einen Teil der langen Zeichenfolge, abhängig von der Teradata-Erweiterung.
- SUBSTRING : Extrahiert nur einen Teil der langen Zeichenfolge, abhängig von der ANSI-Erweiterung.
- INDEX : Suchen Sie eine bestimmte Position einer Zeichenfolge, abhängig von der Teradata-Erweiterung.
- POSITION : Suchen Sie eine bestimmte Position einer Zeichenfolge, abhängig von der ANSI-Erweiterung.
- TRIMMEN : Trimmt leer von der angegebenen Zeichenfolge.
- OBERER, HÖHER : Konvertiert die Zeichenfolge in Großbuchstaben.
- NIEDRIGER : Konvertiert die Zeichenfolge in Kleinbuchstaben.
Fazit
Dieser Artikel konzentriert sich auf die Besonderheiten von Teradata. Und ich hoffe, dass die oben genannten Fragen, die auf den Konzepten, Schlüsselwörtern, der Syntax und der Anwendung der gesamten Datenbankverwaltungsaktivitäten basieren, Ihnen definitiv helfen werden.
Dieser Artikel kann auch als Kurzreferenz für erfahrene Datenbankprogrammierer in ihrem komplexen Skripterstellungsprozess verwendet werden.
Bist du bereit, jetzt ein Teradata-Interview zu knacken?
Literatur-Empfehlungen
- Interview Fragen und Antworten
- Fragen und Antworten zum ETL-Testinterview
- Einige knifflige manuelle Testfragen und -antworten
- Top 32 der besten Fragen und Antworten zum Datastage-Interview
- Top Fragen und Antworten zum JSON-Interview
- 25 Fragen und Antworten zu den besten Agile Testing-Interviews
- Spock Interview Fragen mit Antworten (am beliebtesten)
- Top 30 SAS Interview Fragen und Antworten