top 30 sas interview questions
Liste der beliebtesten häufig gestellten SAS-Interviewfragen mit Antworten:
In diesem Artikel werden einige der grundlegenden und fortgeschrittenen Konzepte der SAS-Programmierung anhand der am häufigsten gestellten Fragen und Antworten zu SAS-Interviews vorgestellt.
Das statistische Analysesystem, allgemein bekannt als SAS, wird als eine Reihe mehrerer Software betrachtet, die integriert ist und für verschiedene Vorgänge wie Datenmanagement, prädiktive - perspektivische und beschreibende Analyse, Qualitätsverbesserung, Geschäftsanalyse, Anwendungsentwicklung usw. verwendet wird.
Die große Anzahl von Komponentenanpassungen von SAS sowie der umfassende Programmieransatz zusammen führen Datenanalyse- und Datentransformationsaufgaben aus. Es kann auf jedem Betriebssystem (Linux, Windows usw.) ausgeführt werden, da es plattformunabhängig ist.
Die beliebtesten Fragen und Antworten zu SAS-Interviews
Auf geht's..
F # 1) Tragen Sie die von SAS ausgeführten Funktionen ein.
Antworten: SAS (Statistical Analysis System) hat in jedem Geschäftsbereich eine eigene Bedeutung.
Nachfolgend sind einige der zusammengefassten Funktionen aufgeführt, die von SAS ausgeführt werden:
- Datenmanagement und Projektmanagement
- Data Warehousing
- Betriebsforschung und Entscheidungsunterstützung
- Informationsabruf und Qualitätsmanagement
- Geschäftliche Planung
- Statistische Analyse
F # 2) Was sind die 3 Komponenten in der SAS-Programmierung?
Antworten: Die 3 Komponenten in der SAS-Programmierung sind:
- Aussagen
- Variablen
- Datensatz
F # 3) Tragen Sie die Syntaxregeln ein, die in SAS-Anweisungen befolgt werden.
Antworten: Das SAS-Programm wird im Editorfenster geschrieben. Hier enthält es eine Reihe von Anweisungen, gefolgt von der richtigen Syntax, damit das SAS-Programm sie verstehen kann.
Einige der Syntaxregeln, die im Fall der Anweisungskomponente von SAS befolgt werden, lauten wie folgt:
- Das Ende einer Anweisung ist durch ein Semikolon (;) gekennzeichnet.
- Ein Semikolon wird auch verwendet, um mehrere Anweisungen zu trennen, die in einer einzelnen Zeile erscheinen.
- SAS-Anweisungen unterscheiden nicht zwischen Groß- und Kleinschreibung und zusätzlichen Abständen, bevor Anweisungen automatisch entfernt werden.
- Kommentare können auf zwei verschiedene Arten in das SAS-Programm für Anweisungen aufgenommen werden:
- Eine Zeile, die mit einem Sternchen (*) beginnt und mit einem Semikolon (;) endet.
- Eine Zeile, die mit einem Weiterleitungs-Schrägstrich und einem Sternchen (/ *) beginnt und mit einem Sternchen und einem Vorwärts-Schrägstrich (* /) endet.
F # 4) Welche Datentypen enthält SAS?
Antworten: ‘Numerisch’ und 'Charakter' sind die beiden Arten von Datentypen, die das SAS-Programm enthält.
F # 5) Was sind PDV und ihre Funktionen?
Antworten: Program Data Vector (PDV) ist ein logisches Konzept und wird als Speicherbereich definiert, in dem ein Datensatz von SAS erstellt wird.
Die Funktionen von PDV sind wie folgt:
- Eine Datenbank mit jeweils einer Beobachtung wird erstellt.
- Der Eingabepuffer zum Speichern der Daten aus einer externen Datei wird zum Zeitpunkt der Kompilierung erstellt.
- PDV enthält zwei automatische Variablen, nämlich _N_ (zeigt die Anzahl der ausgeführten Datenschritte an) und _ERROR_ (benachrichtigt den Fehler, der zum Zeitpunkt der Ausführung auftritt).
F # 6) Was wissen Sie über den SAS-Datensatz?
Antworten: Der SAS-Datensatz wird im Wesentlichen als die Daten bezeichnet, die für die Analyse innerhalb eines SAS-Programms verfügbar sind. SAS-Dataset wird auch als SAS-Datentabelle bezeichnet.
Die SAS-Datentabelle besteht aus zwei Teilen:
- Spalten von Variablen
- Beobachtungsreihen
Nützliche Informationen zum SAS-Datensatz können wie folgt zusammengefasst werden:
- SAS-Dataset kann lesen und verfügt über integrierte Datenquellen für die Verwendung wie Excel, Access usw.
- Das Dataset, das nur im aktuellen Sitzungslauf verwendet und nach Beendigung der Sitzung verworfen wird, wird als temporäres Dataset bezeichnet.
- Der Datensatz, der zur Verwendung in der zukünftigen Sitzung gespeichert wird, wird auch als permanenter Datensatz bezeichnet.
- Über diesen Pfad kann auf den integrierten Datensatz zugegriffen werden Bibliotheken -> Meine Bibliotheken-> SASHELP.
F # 7) Erklären Sie, warum in Eingabeanweisungen doppelt abschließendes @@ verwendet wird.
Antworten: Während der Iteration von Datenschritten bedeutet das Einschließen von doppeltem @ @ in Eingabeanweisungen, dass SAS den aktuellen Datensatz zum Zweck der Ausführung der nächsten Eingabeanweisung halten sollte, anstatt auf den neuen Datensatz zu wechseln.
F # 8) Erklären Sie den Unterschied zwischen den Optionen NODUP und NODUPKEY?
Antworten: Zum Entfernen doppelter Werte aus der Tabelle PROC SORT wird grundsätzlich in zwei Optionen unterteilt:
- NODUP
- NODUPKEY
Der Unterschied zwischen diesen beiden Optionen ist unten zu sehen:
NODUPKEY | NODUP |
---|---|
Vergleicht nur die im Datensatz vorhandene BY-Variable. | Vergleicht alle im Datensatz vorhandenen Variablen. |
Entfernt doppelte Optionen für die Werte der in der BY-Anweisung aufgelisteten Variablen. | Identifiziert und eliminiert doppelte Beobachtungen. |
Syntax: PROC SORT DATA = NODUPKEY einlesen; BY Variablenname; LAUF; | Syntax: PROC SORT DATA = NODUP einlesen; BY Variablenname; LAUF; |
F # 9) Mit welchem Befehl wird die Sortierung im SAS-Programm durchgeführt?
Antworten: Der Befehl PROC SORT wird zum Sortieren verwendet, sei es für eine einzelne Variable oder für mehrere Variablen. Dieser Befehl wird für den Datensatz ausgeführt, in dem der neue Datensatz als Ergebnis der Sortierung erstellt wird, der ursprüngliche Datensatz jedoch unverändert bleibt.
Syntax:
PROC SORT DATA=original OUT=Sorted; BY variable;
Wo,
'Original' bezieht sich auf den Originaldatensatz
'Sortiert' bezieht sich auf das Ergebnis als sortierten Datensatz
'Variable' bezieht sich auf die Spalte, in der der Sortiervorgang ausgeführt wird.
Die Sortierung kann sowohl in aufsteigender als auch in absteigender Reihenfolge erfolgen.
Damit das Dataset in absteigender Reihenfolge angezeigt wird, wird in der BY-Anweisung das Schlüsselwort 'Absteigend' mit dem Spaltennamen verwendet, für den die Sortierung durchgeführt werden soll.
PROC SORT DATA=original OUT=Sorted; BY DESCENDING variable
F # 10) Erläutern Sie den Unterschied zwischen Informat und Format anhand eines Beispiels.
Antworten: Der Unterschied zwischen Informat und Format kann wie folgt erklärt werden:
Finde mehr heraus | Format |
---|---|
Geben Sie SAS an, wie Daten in die SAS-Variable eingelesen werden sollen. | Geben Sie SAS an, wie Werte in der Variablen angezeigt werden sollen. |
Diese werden verwendet, um die Daten zu lesen oder Eingabedaten aus externen Dateien zu übernehmen. | Diese werden zum Schreiben der Daten verwendet. |
F # 11) Unterscheiden Sie INPUT und INFILE.
Antworten: Das Einbeziehen einer INFILE-Anweisung in die SAS-Programmierung identifiziert eine externe Datei, die aus den Daten besteht, während das Einbeziehen der INPUT-Anweisung in die SAS-Programmierung die verwendeten Variablen beschreibt.
Die Syntax für INFILE:
INFILE ‘filename’;
Die Syntax für INPUT:
INPUT ‘varname1’ ‘varname2’;
F # 12) Erklären Sie die Verwendung von PROC-Druck und PROC-Inhalten?
Antworten: Der PROC-Schritt des SAS-Programms wird verwendet, um integrierte Prozeduren zum Analysieren der Daten des Datensatzes aufzurufen.
PROC-Druck: Stellt sicher, dass die im Datensatz enthaltenen Daten korrekt gelesen werden.
PROC-Inhalte: Zeigt die Informationen zum SAS-Dataset an.
F # 13) Erklären Sie DATA_NULL_?
Antworten: Wie der Name schon sagt, ist DATA_NULL_ ein Datenschritt, der tatsächlich keinen Datensatz erstellt.
Es wird genutzt für:
- Makrovariablen erstellen.
- Schreiben der Ausgabe ohne Datensatz.
F # 14) Wie wird eine Zeichenvariable in eine numerische Variable umgewandelt und umgekehrt?
Antworten: Bei der SAS-Programmierung treten viele Aufgaben auf, bei denen ein Zeichenwert in einen numerischen Wert umgewandelt werden soll und auf die gleiche Weise ein numerischer Wert in einen Zeichenwert konvertiert werden soll.
STELLEN() wird verwendet, um numerische in Zeichen umzuwandeln. In diesem Fall müssen das Quellformat und der Quellvariablentyp immer ähnlich sein.
Beispiel:
char_var= PUT( num_var, 6.);
INPUT () wird verwendet, um ein Zeichen in ein numerisches Zeichen umzuwandeln. In diesem Fall muss der Quellvariablentyp immer Zeichenvariablen sein.
Beispiel:
Num_var= INPUT(char_var,2.0);
F # 15) Was ist der Zweck von _CHARACTER_ und _NUMERIC_?
Antworten: Im aktuellen Datensatz
_CHARAKTER_ definiert alle derzeit definierten Zeichenvariablen.
Beispiel :: Um alle Zeichenvariablen in PROC MEANS aufzunehmen, werden die folgenden Anweisungen verwendet:
PROC MEANS; Var_character_; Run;
_NUMERIC_ definiert alle derzeit definierten numerischen Variablen.
Beispiel: Um alle numerischen Variablen in PROC MEANS aufzunehmen, werden folgende Anweisungen verwendet:
PROC MEANS; Var_numeric_; Run;
F # 16) Welche Befehle werden verwendet, um bestimmte Variablen in den Datensatz aufzunehmen oder auszuschließen?
Antworten: Zu diesem Zweck werden die Optionen DROP, KEEP und Datensatz verwendet.
Die Variable, die aus dem Datenschritt entfernt werden soll, wird in der DROP-Anweisung angegeben.
Die Variable, die wir aus dem Datenschritt beibehalten möchten, wird in der KEEP-Anweisung angegeben.
F # 17) Unterscheiden Sie zwischen PROC MEANS und PROC SUMMARY.
Antworten: Der Unterschied zwischen PROC MEANS und PROC SUMMARY kann wie folgt verstanden werden:
PROC BEDEUTET | PROC ZUSAMMENFASSUNG |
---|---|
Diese Prozedur erstellt den gedruckten Bericht standardmäßig im OUTPUT-Fenster. | Dieses Verfahren enthält den DRUCK in der Anweisung, um den gedruckten Bericht zu erstellen. |
PROC MEANS verwendet standardmäßig alle numerischen Variablen in der Analyse. | PROC SUMMARY nimmt die Variablen in die statistische Analyse auf, die in der VAR-Anweisung beschrieben sind. |
F # 18) Erläutern Sie den Zweck der SUBSTR-Funktionen in der SAS-Programmierung.
Antworten: Bei der SAS-Programmierung wird im Fall einer Zeichenvariablen die SUBSTR-Funktion verwendet, wenn das Programm eine Teilzeichenfolge abstrahieren muss.
Wenn eine Startposition und eine Länge angegeben werden, wird diese Funktion zum Abstrahieren der Zeichenfolge verwendet.
Syntax: SUBSTR (char_var, start, length);
F # 19) Nennen und beschreiben Sie kurz einige SAS-Zeichenfunktionen, die zur Datenbereinigung verwendet werden.
Antworten: Nachfolgend sind einige SAS-Zeichenfunktionen aufgeführt, die für die Datenbereinigung verwendet werden:
- Komprimieren (char_string) Die Funktion wird zum Entfernen von Leerzeichen oder bestimmten Zeichen aus einer bestimmten Zeichenfolge verwendet.
- TRIM (str) Die Funktion wird zum Entfernen von nachgestellten Leerzeichen aus einer bestimmten Zeichenfolge verwendet.
- LOWCASE (char_string) Die Funktion wird zum Konvertieren aller Zeichen in einer bestimmten Zeichenfolge in Kleinbuchstaben verwendet.
- UPCASE (char_string) Die Funktion wird zum Konvertieren aller Zeichen in einer bestimmten Zeichenfolge in Großbuchstaben verwendet.
- COMPBL (str) Die Funktion wird zum Konvertieren mehrerer Leerzeichen in ein einzelnes Leerzeichen verwendet.
F # 20) Erwähnen Sie einige Möglichkeiten, wie eine 'Tabellensuche' in der SAS-Programmierung durchgeführt wird.
Antworten: Bei der SAS-Programmierung können die Tabellensuchwerte auf folgende Arten gespeichert werden:
- Code
- Array
- Hash-Objekt
- Format
- Datensatz
Die folgenden Techniken werden verwendet, um eine Tabellensuche in SAS durchzuführen:
- SELECT / WHEN- oder IF / THEN-Anweisungen
- Array-Indexwert
- Hash-Objektschlüsselwert
- FORMAT-Anweisung, PUT-Funktion
- Zusammenführen, verbinden, KEY = Option
Sehen wir uns ein Beispiel an, das zeigt, wie Code mithilfe von IF / THEN-Anweisungen nach Tabellen gesucht werden kann:
data location; set myinfo; if AreaCode='226' then Location='Ontario, Canada'; else if AreaCode='212' then Location='New York, NY'; else Location='Unknown'; run;
F # 21) Unterscheiden Sie zwischen CEIL- und FLOOR-Funktionen.
Antwort: CEIL-Funktion wird zum Abschneiden numerischer Werte verwendet, wobei die Ausgabe als kleinste Ganzzahl angezeigt wird. Mit kleinster Ganzzahl bedeutet hier, dass der Ganzzahlwert größer als / gleich dem Argument ist.
Beispiel: CEIL (12.85) zeigt die Ausgabe als 13 an.
BODENfunktion wird zum Abschneiden numerischer Werte verwendet, wobei die Ausgabe als größte Ganzzahl angezeigt wird. Mit der größten Ganzzahl bedeutet dies, dass der Ganzzahlwert kleiner als / gleich dem Argument ist.
Beispiel: FLOOR (12.85) zeigt die Ausgabe als 12 an.
F # 22) Auf welche Weise können Makrovariablen in der SAS-Programmierung erstellt werden?
Antworten: Nun, eine Reihe verschiedener Techniken können verwendet werden, um Makrovariablen in der SAS-Programmierung zu erstellen.
Nachfolgend sind die fünf am häufigsten verwendeten Methoden aufgeführt:
- % LET-Anweisung
- Makroparameter (benannt sowie positionell)
- % DO-Anweisung (iterativ)
- INTO in PROC SQL
- CALL SYMPUTX Routine
F # 23) Erläutern Sie den Zweck der RETAIN-Anweisung.
Antworten: Da die Bedeutung des Wortes 'RETAIN' bedeutet, dass der einmal zugewiesene Wert beibehalten wird, ist der Zweck der RETAIN-Anweisung in der SAS-Programmierung derselbe, wie es die Bedeutung impliziert.
Wenn in einem SAS-Programm von der aktuellen Iteration zum nächsten Datenschritt gewechselt werden muss, weist die RETAIN-Anweisung SAS zu diesem Zeitpunkt an, die Werte beizubehalten, anstatt sie auf fehlend zu setzen.
Beispiel: Lassen Sie uns ein Programm drucken, das den Ausgabewert von 'z' ab 1 mit der Anweisung RETAIN anzeigt.
data abc; set xyz; RETAIN z 0; z = z + 1; run;
F # 24) Mit welchem Befehl werden Protokolle in der externen Datei gespeichert?
Antworten: DRUCKVERFAHREN Befehl wird verwendet, um Protokolle in der externen Datei zu speichern.
Was ist der beste Video-Downloader?
Beispiel:
PROC PRINTTO log='C:UsersabcDownloadsLOG11.txt' new; run;
F # 25) Erwähnen Sie einige häufige Fehler, die normalerweise bei der SAS-Programmierung auftreten.
Antworten: Nachfolgend sind einige der häufigsten Fehler aufgeführt, die normalerweise auftreten, insbesondere wenn Sie mit dieser Programmiersprache noch nicht vertraut sind.
- Die grundlegende Syntax enthält ein Semikolon am Ende jeder Anweisung, und das Fehlen eines Semikolons ist der häufigste Fehler.
- Sie überspringen das Überprüfen der Protokolle nach dem Senden des Programms.
- Kommentierungsfehler wie das Versäumnis, Kommentare bei Bedarf zu verwenden oder Kommentare auf unangemessene Weise zu verwenden.
- Keine ordnungsgemäßen Debugging-Methoden verwenden.
F # 26) Erwähnen Sie SAS-Systemoptionen zum Debuggen von SAS-Makros.
Antworten: Um die Verfolgung des Makrocodes sowie des von den Makros generierten SAS-Codes zu erleichtern, können einige Systemoptionen verwendet werden.
Sie sind:
- MLOGIC
- MPRINT
- SYMBOLGEN
Die Nachricht, die von diesen Systemoptionen generiert wird, wird im SAS-Protokoll angezeigt.
F # 27) Unterscheiden Sie zwischen SAS-Funktionen und SAS-Prozeduren.
Antworten: Die Hauptunterschiede können durch den Fall entdeckt / verstanden werden, der sowohl für SAS-Funktionen als auch für Prozeduren erläutert wird.
Fall:
Zum Funktion Der Argumentwert wird für die Berechnung in der in der Programmanweisung genannten Beobachtung angegeben oder zur Berechnung herangezogen, während im Fall von Verfahren Es wird erwartet, dass jede Beobachtung nur eine Variable enthält, über die die Berechnung durchgeführt wird, wie im folgenden Beispiel erwähnt.
Lassen Sie es uns anhand von Beispielen verstehen:
data average; set temp; avgtemp = mean( of T1 – T24 ); run;
Hier in den obigen Beispielen werden die an die mittlere Funktion übergebenen Argumente zur Berechnung als Beobachtung herangezogen.
proc sort; by month; run; proc means; by month; var avgtemp; run;
Hier im obigen Beispiel berechnet die Proc-Mittelfunktion die Durchschnittstemperatur für ein Argument, das als Beobachtung übergeben wird, d. H. Nach Monat.
F # 28) Was wissen Sie über SYMPUT und SYMGET?
Antwort: Die Hauptunterschiede zwischen den beiden sind unten aufgeführt.
SYMPUT wird zum Speichern des Werts eines Datensatzes in der Makrovariablen verwendet, während SYMGET zum Abrufen des Werts von der Makrovariablen in den Datensatz verwendet wird.
F # 29) Erläutern Sie die speziellen Eingabetrennzeichen, die bei der SAS-Programmierung verwendet werden.
Antworten: Die speziellen Eingabetrennzeichen, die bei der SAS-Programmierung verwendet werden, sind:
- DLM
- DSD
Sie werden in der Anweisung 'INFILE' verwendet und DSD hat die Funktion, die Trennzeichen zu ignorieren, die in Anführungszeichen eingeschlossen erscheinen.
F # 30) Mit welcher Funktion wird die Anzahl der Intervalle zwischen zwei SAS-Daten gezählt?
Antworten: Die Intervallfunktion INTCK wird zum Zählen der Anzahl der Intervalle zwischen zwei bestimmten SAS-Daten verwendet.
Syntax:
INTCK(interval,start-of-period,end-of-period)
Fazit
Bisher haben wir mehrere Fragen und Antworten gesehen, die Ihnen ein klares Verständnis der SAS-Programmierkonzepte vermittelt und Ihnen eine Vorstellung von der Art der Fragen gegeben haben, die in SAS-Interviews gestellt werden.
Wenn Sie mit der SAS-Programmierung noch nicht vertraut sind, sind die Kenntnisse einiger Technologien der Computerprogrammierung und die Kenntnis von SQL (Structured Query Language) ein zusätzlicher Vorteil für Sie, um SAS schnell zu verstehen und zu lernen.
Ich hoffe, Sie sind bereit, sich jedem SAS-Interview sicher zu stellen !!