Nullbasierte Python-Datenanalyse und Visualisierung am Ende des Semesters, die Schlüsselversion des Lehrers mit sehr detaillierten Fragen und Antworten


Dieser Artikel fasst hauptsächlich die Schlüsselthemen zusammen, die der Lehrer am Ende der Python-Datenanalyse- und Visualisierungsphase gezeichnet hat. Ich hoffe, dass er meinen Freunden hilfreich sein wird!


1. Multiple-Choice-Fragen

1. Welche der folgenden Aussagen ist in Bezug auf die Standardabweichungsstandardisierung falsch ( B )?
A. Der Mittelwert der von dieser Methode verarbeiteten Daten beträgt 0 und die Standardabweichung beträgt 1
B. Die Verteilung der Daten kann geändert werden. C.
Diese Methode kann in Python angepasst werden, um die Funktion zu implementieren:
def StandardScaler(data ):
data=(data-data .mean())/data.std()
gibt Daten
D zurück. Die Berechnungsformel lautet X*=(X-`X)/σ

2. Verwenden Sie die Funktion „pivot_table“, um eine Pivot-Tabelle zu erstellen. Verwenden Sie die folgenden ( A ) Parameter, um den Zeilengruppierungsschlüssel festzulegen.
A. Index
B. Rohdaten
C. Werte
D. Daten

3. Die korrekte Verwendung der folgenden loc-, iloc- und ix-Attribute ist ( D )
A. df.loc['Spaltenname', 'Indexname'];df.iloc['Indexposition','Spaltenposition'] ;df .ix['Indexposition', 'Spaltenname']
B. df.loc['Indexname', 'Spaltenname'];df.iloc['Indexposition', 'Spaltenname'];df.ix ['Indexposition', 'Spaltenname']
C. df.loc['Indexname', 'Spaltenname'];df.iloc['Indexposition','Spaltenname'];df.ix['Indexname ', 'Spaltenposition']
D. df.loc['index name', 'column name']; df.iloc['index position', 'column position']; df.ix['index position', 'column Position' ]

4. Das Folgende kann die Eigenschaften der ufunc-Funktion ( C ) am besten widerspiegeln.
A. Sie wird auch als allgemeine Funktion bezeichnet.
B. Betreiben Sie jedes Element im Array einzeln.
C. Betreiben Sie das gesamte Array
. D. Die Elemente im Array sind alle vom gleichen Typ

5. Die Funktion, die die Daten-Pivot-Funktion selbst erreichen kann, ist ( D )
A. Groupby
B. Transformation
C. Cosstab
D. Pivot_Table

6. Welche der folgenden Beschreibungen zum Prozess der Datenanalyse und -vorverarbeitung ist richtig ( C ).
A. Die Datenbereinigung umfasst Datenstandardisierung, Datenzusammenführung und Verarbeitung fehlender Werte.
B. Die Datenzusammenführung ist entsprechend der Richtung der Zusammenführungsachse hauptsächlich in Links-Join, Rechts-Join, Innen-Join und Außen-Join unterteilt.
C. Der Vorverarbeitungsprozess umfasst hauptsächlich die Datenbereinigung , Datenzusammenführung, Datenstandardisierung und Datenkonvertierung, es gibt einen Schnittpunkt zwischen ihnen, es gibt keine strikte Reihenfolgebeziehung
D. Das Hauptziel der Datenstandardisierung sind die Merkmale der Kategorie

7. Welche der folgenden Aussagen zur Pandas-Datenvorverarbeitung ist richtig ( D ).
A. Pandas verfügt nicht über eine Dummy-Variablenfunktion
B. Ohne den Import anderer Bibliotheken können Clusteranalyse und Diskretisierung nur mit Pandas realisiert werden.
C. Pandas können alle Datenvorverarbeitungsoperationen realisieren.
D. Cut-Funktion standardmäßig. Was getan wird, ist die Diskretisierung von die Methode gleicher Breite

8. Die folgende Aussage zur Funktion drop_duplicates ist falsch ( B ).
A. Nur gültig für Daten vom Typ „DataFrame“ und „Serie“.
B. Unterstützt nur die Datendeduplizierung eines einzelnen Features.
C. Wenn Daten wiederholt werden, werden die ersten Daten standardmäßig beibehalten.
D. Diese Funktion ändert die ursprüngliche Datenanordnung nicht

9. Welche der folgenden Aussagen zu standardisierten Methoden ist falsch ( A ).
A. Die Standardisierung der Abweichung ist einfach und leicht zu verstehen und reagiert nicht auf den Maximal- und Minimalwert.
B. Häufig verwendete Standardisierungsmethode, auch bekannt als Null-Mittelwert-Standardisierung.
C. Die Dezimalkalibrierungsstandardisierung dient im Wesentlichen dazu, die Abweichung zu reduzieren Daten entsprechend einem bestimmten Verhältnis.
D. KMeans-Clustering von Daten mit mehreren Merkmalen erfordert keine Normalisierung der Daten

10. Welche der folgenden Aussagen zur Ausreißererkennung ist falsch ( B ).
A. Das 3σ-Prinzip verwendet das Prinzip kleiner Wahrscheinlichkeitsereignisse in der Statistik.
B. Bei Verwendung der Boxplot-Methode müssen die Daten der Normalverteilung gehorchen oder annähernd gehorchen.
C. Die auf Clustering basierende Methode kann Ausreißer erkennen.
D. Die Methode basiert Bei der Klassifizierung kann eine Ausreißererkennung durchgeführt werden

11. Welche der folgenden Aussagen zur Concat-Funktion, Append-Methode, Merge-Funktion und Join-Methode ist richtig ( D ).
A. concat ist die am häufigsten verwendete Funktion zum Zusammenführen von Primärschlüsseln, mit der innere und äußere Verknüpfungen realisiert werden können.
B. Die Append-Methode kann nur für vertikales Stapeln verwendet werden und ist auf alle vertikalen Stapelsituationen anwendbar.
C. merge wird am häufigsten verwendet Funktion zum Zusammenführen von Primärschlüsseln, es ist jedoch nicht möglich, einen linken und rechten Join zu erreichen.
D. Join ist eine der am häufigsten verwendeten Methoden zum Zusammenführen von Primärschlüsseln, kann jedoch keinen linken und rechten Join implementieren

12. Welche der folgenden Aussagen ist richtig ( C ).
A. Das Streudiagramm kann nicht im Unterdiagramm gezeichnet werden.
B. Die x-Achsenskala des Streudiagramms muss einen Wert haben.
C. Das Liniendiagramm kann verwendet werden, um die Trendbeziehung zwischen Merkmalen anzuzeigen.
D. Das Boxdiagramm kann verwendet werden Wird verwendet, um die Korrelationsbeziehung zwischen Features anzuzeigen

13. Erstellen Sie ein 3×3-Array. Der Fehler im folgenden Code ist ( C )
A, np.arange(0,9).reshape(3,3)
B, np.eyes(3)
C, np.random. random([3,3,3])
D, np.mat("1,2,3;4,5,6;7,8,9")

14. Die Methode zum Zählen der Anzahl der Array-Elemente in Numpy ist ( C )
A, ndim
B, Form
C, Größe
D, Itemsize

15. Unter den folgenden Aussagen zur Erkennung fehlender Werte ist die richtige ( B )
A, null und notnull können fehlende Werte
B verarbeiten, die Dropna-Methode kann Beobachtungsdatensätze löschen und auch Features
C löschen, die Fillna-Methode wird verwendet Ersetzen Der Wert des fehlenden Werts kann nur der Datenrahmen
D sein. Das Interpolationsmodul in der Pandas-Bibliothek enthält verschiedene Interpolationsmethoden

16. Verwenden Sie die visuelle Zeichnung ( C ), um Ausreißer in den Daten zu finden.
A. Dichtekarte
B. Histogramm
C. Boxkarte
D. Wahrscheinlichkeitskarte

17. Das ( A )-Paket in Matplotlib bietet eine Reihe von Betriebs- und Zeichenfunktionen.
A. pyplot
B. Bar
C. rcparams
D. pprint

18. Unter den folgenden Parametern wird Chinesisch nach Anpassung angezeigt ( C )
A,lines.linestyle
B,lines.linewidthC
,font.sans-serifD
,axis.unicode_minus

19. Die folgende Aussage über den Zeichnungsstandardprozess ist falsch ( B )
A. Sie können die Standard-Leinwand verwenden, um einfache Grafiken zu zeichnen.
B. Sie können Legenden hinzufügen, bevor Sie Grafiken zeichnen.
C. Fügen Sie vorher X-Achsen- und Y-Achsen-Beschriftungen hinzu Zeichnen von Grafiken.
D. Ändern Sie die Beschriftungen der X- und Y-Achse sowie die ohne Reihenfolge gezeichneten Grafiken

20. Numpy bietet zwei Grundobjekte: eines ist ndarray, das andere ist (B)
A, Array
B, ufunc
C, Matrix
D, Series

21. Die folgende Aussage ist falsch ( C )
A. Kreisdiagramme werden im Allgemeinen verwendet, um den Anteil verschiedener Kategorien darzustellen.
B. Boxdiagramme zeigen die Position von Quantilen.
C. Streudiagramme können die statistische Beziehung zwischen Merkmalen nicht widerspiegeln.
D. Die Wortwolke wird visuell hervorgehoben die Schlüsselwörter, die häufig im Text vorkommen

2. Urteilsfragen

1. Ein Fehler tritt auf, wenn zwei Serien mit inkonsistenten Indizes arithmetische Operationen ausführen. ( × )
2. Beim Erstellen eines DataFrame wird automatisch ein Index hinzugefügt und alle Spalten werden geordnet angeordnet. (√)
3. Die Neuindizierung von Daten in Pandas bezieht sich auf die Neuordnung des Index und nicht auf dessen Änderung. (√)
4. Die Kreuztabelle ist eine spezielle Pivot-Tabelle, die hauptsächlich zur Berechnung der Gruppierungshäufigkeit verwendet wird. (√)
5. Der Index des Datenobjekts in Pandas kann jederzeit geändert werden. (×)
6. Wenn beim Erstellen einer Serie ein Index angegeben wird, kann nur der Index für den Zugriff auf Daten verwendet werden. (×)
7. Wenn Sie die Zusammenführungsfunktion in Pandas zum Zusammenführen von Datentabellen verwenden, ist die Standardeinstellung die innere Verbindungsmethode. (√)
8. Deskriptive Statistiken bei Pandas umfassen im Allgemeinen fehlende Daten. (×)
9. Die Anweisung dataframe.dropna(thresh=len(df)*0.9,axis=1) bedeutet, dass die Spalte gelöscht wird, wenn der fehlende Wert einer Spalte 90 % überschreitet. (×)
10. Bei Verwendung der Zusammenführungsmethode zum Zusammenführen von Daten ist es zulässig, dass zwischen den zusammengeführten Datenrahmen kein Verbindungsschlüssel vorhanden ist. (×)
11. Dummy-Variablen, auch Dummy-Variablen genannt, sind künstliche Variablen, die zur Darstellung qualitativer Attribute verwendet werden. (√)
12. Seaborns Zeichnung ist bequemer und schöner und eine Alternative zu Matplotlib. (×)
13. Um den Standard-Seaborn-Zeichenstil zu konvertieren, rufen Sie einfach die Set-Methode mit Parametereinstellungen auf. (×)
14. Verwenden Sie set_style() in Seaborn, um das Thema festzulegen. Es gibt 5 voreingestellte Themen. (√)
15. Der Realisierungsprozess der Wärmekarte besteht darin, die diskreten Punktinformationen in ein Bild abzubilden. (√)
16. Die Liste ist ein unveränderliches Objekt, das direkte Änderungen unterstützt. (×)
17. Tupel sind unveränderlich. Sie können den Wert von Elementen im Tupel nicht direkt ändern, noch können Sie Elemente für das Tupel hinzufügen oder löschen. (√)
18. Python verwendet Lambda, um anonyme Funktionen zu erstellen, die ihren eigenen Namensraum haben. (√)
19. Die Datentypen der Elemente in derselben Liste können unterschiedlich sein. (√)
20. Listen, Tupel und Strings sind geordnete Sequenzen und die darin enthaltenen Elemente sind streng geordnet. (√)
21. Die Elemente in der Menge haben keine bestimmte Reihenfolge, können aber wiederholt werden. (×)
22. Das Listenverständnis entspricht logisch einer Schleifenanweisung, die Form ist jedoch prägnanter. (√)
23. Um eine leere Menge in Python zu erstellen, können Sie set1={} direkt verwenden. (×)
24. Listen, Tupel und Zeichenfolgen unterstützen alle bidirektionale Indizes, und der Bereich gültiger Indizes ist [-L, L], wobei L die Länge von Listen, Tupeln oder Zeichenfolgen ist. (×)
25. Das Tupel, das die Liste enthält, kann als Schlüssel des Wörterbuchs verwendet werden. (×)

Zusammenfassen

Dieser Artikel fasst zunächst die Multiple-Choice-Fragen und die Beurteilungsfragen zusammen. Bitte achten Sie auf meinen nächsten Blog und fassen Sie weiterhin die Lückenfüllfragen, Kurzantwortfragen und Programmierfragen für Sie zusammen.
Wenn dieser Artikel für Sie hilfreich ist, liken Sie ihn bitte + sammeln Sie ihn! Ihre Unterstützung ist meine größte Motivation, weiter kreativ zu sein!

Ich denke du magst

Origin blog.csdn.net/m0_52423924/article/details/128471102
Empfohlen
Rangfolge