© ConceptCafe/Shutterstock.com
Wenn Sie mit einem Pandas DataFrame arbeiten, müssen manchmal nicht alle Ihre Daten vorhanden sein. Die Datenanalyse ist normalerweise einfacher, wenn wir unseren Blick fokussieren und unwichtige Daten aus der Gleichung entfernen können.
Es gibt viele Möglichkeiten, dies zu tun, aber die gebräuchlichste ist die Drop-Funktion. Entdecken Sie in diesem Artikel die einfachen Methoden zum Ablegen von Spalten in Pandas.
Wie man eine Spalte mit Drop() löscht
Lassen Sie uns zuerst durchgehen, wie man eine einzelne Spalte mit der Drop-Methode entfernt. Dies kann verwendet werden, um jede gewünschte Spalte zu löschen. Befolgen Sie die nachstehenden Schritte.
Schritt 1: Pandas importieren
Pandas als pd importieren.
©”TNGD”.com
Zur Veranschaulichung verwenden wir Python in der Spyder-Umgebung. Zuerst werden wir Pandas importieren, damit wir damit Daten manipulieren können. Dies geschieht mit diesem Code:
import pandas as pd
Step 2: Create a Dictionary
Erstellen eines assoziativen Arrays (Wörterbuch).
©”TNGD”.com
Als nächstes müssen wir erstellen ein Wörterbuch, damit wir den Prozess veranschaulichen können. Ein Wörterbuch wird auch als assoziatives Array bezeichnet und ist im Grunde eine Art Datenstruktur mit Schlüssel-Wert-Paaren, wobei jeder Schlüssel nur einen Wert hat.
data={‘A’: [‘A1′,’A2′,’A3′,’A4′,’A5′],’B’: [‘B1′,’B2′,’B3′,’B4′,’B5′],’C’: [‘C1′,’C2′,’C3′,”C4′,’C5′],’D’: [‘D1′,’D2′,’D3′,’D4′,’D5′],’E’: [‘E1′,’E2′,’E3′,’E4′,”E5’]}
Dies kann beliebig benannt werden, aber in diesem Fall wurde „Daten“ ausgewählt.
Schritt 3: DataFrame erstellen
Konvertieren des Wörterbuchs.
©”TNGD”.com
Der nächste Schritt ist das Konvertieren des Wörterbuchs in einen DataFrame. Verwenden Sie dazu den Code:
df=pd.DataFrame(data)
Schritt 4: Drop the Column
Löschen der ersten Spalte.
©”TNGD”.com
Jetzt können wir es Lassen Sie endlich die Spalte fallen, die wir wünschen. In diesem Fall werden wir die erste Spalte mit der Bezeichnung „A“ löschen. Der Code
df.drop([‘A’}, axis=1)
bewerkstelligt dies. Die Achse ist als 1 definiert, da sich dies auf Spalten bezieht. Die Ausgabe zeigt den DataFrame mit entfernter Spalte.
Schritt 5: Mehrere Spalten mit Drop() löschen
Dropping mehrerer Spalten.
©”TNGD”.com
Dieses Verfahren kann ebenfalls verwendet werden mehrere Spalten mit einer leichten Modifikation zu löschen. Durch die Verwendung von
df.drop([‘A’,’B’], axis=1)
verwerfen wir die Spalten „A“ und „B“ ganz einfach.
Wie man Spalten verwirft Den Spaltenindex verwenden
Eine andere Möglichkeit, Spalten zu löschen, besteht darin, sich auf den Spaltenindex zu beziehen. Die erste Spalte hat einen Index von 0, die zweite einen Index von 1 und so weiter. Dies wird mit den folgenden Schritten veranschaulicht.
Schritt 1: DataFrame erstellen
Erstellen eines DataFrame.
©”TNGD”.com
Erstellen Sie wie zuvor einen DataFrame.
Schritt 2: Einen Spalten-für-Spalten-Index ablegen
Entfernen der ersten Spalte.
©”TNGD”.com
Jetzt können wir den Code
df.drop(df.columns[[0], axis=1)
um die erste Spalte zu entfernen.
Schritt 3: Mehrere Spalten nach Spaltenindex löschen
Entfernen mehrerer Spalten.
©”TNGD”.com
Wie bei der ersten Methode, Wir können diesen Prozess auch verwenden, um mehrere Spalten nach ihrem Index zu löschen. Dies geschieht mit dem Code
df.drop(df.columns[[0, 1]], axis=1)
der angibt, welche Spalten Sie löschen möchten.
How to Drop Spalten mit iloc[] und Drop()
Eine alternative Methode zum Löschen von Spalten ist die Verwendung der Methoden iloc[] und drop(). Die Verwendung der iloc-Methode entfernt die erste Spalte im angegebenen Bereich bis zur letzten angegebenen Spalte, schließt aber die letzte Spalte aus. Die nächsten Schritte zeigen, wie das geht.
Schritt 1: Erstellen Sie einen DataFrame
Erstellen eines DataFrame.
©”TNGD.com
Wir beginnen mit dem Erstellen eines DataFrame, wie bei den anderen Methoden.
Schritt 2: Spalten mit iloc[] und Drop() löschen
Eingabe des Codes zum Löschen von Spalten.
©”TNGD”.com
Einfach den Code eingeben
df. drop(df.iloc[:, 1:3], axis=1)
Angabe des Bereichs nach Spaltenindex. In diesem Fall wurden die Spalten „B“ und „C“ entfernt. „D“ wurde beibehalten, da es die zweite angegebene Spalte ist.
So löschen Sie Spalten mit loc[] und Drop()
Mit dieser Methode löschen wir immer noch mehrere Spalten , aber die Verwendung von loc[] schließt die zweite angegebene Spalte nicht vom Löschen aus. Sehen Sie sich als Nächstes an, wie das geht.
Schritt 1: Erstellen Sie einen DataFrame
Konstruieren eines Datenrahmens.
©”TNGD”.com
Um zu beginnen, benötigen wir wie üblich einen Datenrahmen.
p>
Schritt 2: Mehrere Spalten mit loc[] und Drop() ablegen
Mehrere Spalten loswerden.
©”TNGD”.com
Mit dem Code
df.drop(df. loc[:,’A’:’B’].columns,axis=1)
wir entfernen die Spalten „A“ und „B“. Beachten Sie nicht nur, dass die Spalte „B“ weggelassen wird, sondern auch, dass Spaltenbeschriftungen mit loc[] und nicht mit dem Spaltenindex verwendet werden.
So löschen Sie eine Spalte
Das ist ein bisschen andere Methode, da sie del und nicht drop verwendet. Das Endergebnis ist ähnlich, aber die Unterschiede bestehen darin, dass del nur für Spalten funktioniert und nur jeweils eine Spalte entfernen kann. Sehen Sie unten, wie dies gemacht wird.
Schritt 1: Erstellen Sie einen DataFrame
Beginnend mit unserem DataFrame.
©”TNGD”.com
Wir verwenden denselben DataFrame wie bisher zuvor.
Schritt 2: Spalte löschen
Löschen der dritten Spalte.
©”TNGD”.com
In diesem Fall löschen wir die dritte Spalte, also Spalte „C“.. Dies wird mit folgendem Code erreicht:
für col in df.columns: if’C’in col: del df[col]
Dadurch wird die Spalte aus dem DataFrame gelöscht.
So löschen Sie eine Spalte mit der Pop-Funktion
Dieser Vorgang funktioniert ähnlich wie del, unterscheidet sich jedoch darin, dass er die gelöschte Spalte an Sie zurückgibt, del jedoch nicht. Die einfachen Schritte unter dieser Methode.
Schritt 1: Erstellen Sie einen DataFrame
Genau wie bei den anderen Methoden benötigen wir einen DataFrame, um zu beginnen.
Schritt 2: Spalte mit Pop löschen
Using df.pop.
©”TNGD”.com
Verwenden Sie einfach den Code
df.pop(‘D’)
um die gewünschte Spalte zu löschen, ersetzen Sie „ D“ durch die von Ihnen gewählte Spaltenbezeichnung.
So löschen Sie eine Spalte aus einer vorhandenen Datentabelle
Eine andere Möglichkeit, Pandas zum Löschen von Spalten zu verwenden, besteht darin, wenn Sie eine bereits vorhandene Datentabelle haben. Dazu müssen Sie Ihre Tabelle oder Tabelle im CSV-Format haben und den Dateipfad dafür kennen. Befolgen Sie dazu diese einfachen Schritte.
Schritt 1: Importieren Sie Ihre Daten
Importieren von Daten.
©”TNGD”.com
Importieren Sie zunächst Pandas ganz normal und verwenden Sie dann
df=pd.read_csv(r’Filepath/Filename.csv’)
um die Daten zu importieren. Dies ist normalerweise Ordner/Dateiname auf dem Mac, in diesem Fall der Ordner „Dokumente“. Unter Windows geht dem normalerweise C:/Benutzer/Benutzername voran.
Schritt 2: Spalten mit Drop() löschen
Spalten löschen mit df.drop.
©”TNGD”.com
Wie zuvor verwenden wir den Code
df.drop([„Gewicht“, „Höhe“, Achse=1)
um die Spalten „Gewicht“ und „Höhe“ aus dieser Tabelle zu löschen. Die Tabelle wird Ihnen danach zurückgegeben, wobei diese Spalten entfernt wurden.
Empfang von NaN-Werten.
©”TNGD”.com
Es ist wichtig zu beachten, dass bei den Spaltenbezeichnungen zwischen Groß-und Kleinschreibung unterschieden wird und sie korrekt eingegeben werden müssen, andernfalls Ich erhalte stattdessen NaN-Werte. Dies wird im zweiten Screenshot gezeigt.
Schritt 3: Spalten aus der importierten Tabelle auswählen
Spalten auswählen.
©”TNGD”.com
Dies ist technisch gesehen keine Möglichkeit, Spalten zu löschen, sondern eine Möglichkeit, sie zum Anzeigen auszuwählen. Dies kann praktisch sein, wenn Sie die Spalten nicht entfernen möchten. Importieren Sie Ihre Daten wie zuvor, um zu beginnen.
Schritt 4: Wählen Sie die gewünschten Spalten
Wählen Sie die gewünschten Spalten aus.
©”TNGD”.com
Verwenden Sie schließlich
df=pd.DataFrame (df, column=[‘Weight’,’Height’])
Ersetzen Sie „Weight“ und „Height“ durch Ihre gewünschten Spaltenbeschriftungen, um diese Spalten zur Anzeige auszuwählen.
Zusammenfassung
h2>
Es gibt mehrere Methoden, die Sie verwenden können, um eine oder mehrere Spalten aus einem Pandas DataFrame zu löschen. Der einfachste Weg ist wahrscheinlich drop() und die Spaltenbeschriftungen, da dies getan werden kann, um eine oder mehrere Spalten in einem neuen DataFrame oder importierten Daten zu löschen.
Für große Datenmengen sollten Sie stattdessen die Methoden iloc oder loc verwenden, da diese viele Spalten innerhalb eines bestimmten Bereichs entfernen können. Schließlich kann die delete-Methode verwendet werden, aber beachten Sie, dass diese nur eine Spalte auf einmal entfernen kann. Alles in allem können Sie Ihre Daten viel effizienter analysieren, sobald Sie wissen, wie man Spalten in Pandas löscht.
Als nächstes
How to Drop Columns in Pandas FAQs (Häufig gestellte Fragen )
Wie lösche ich eine Spalte in Pandas?
Der einfachste Weg, eine Spalte zu löschen, ist die drop()-Funktion und die Angabe einer der beiden die Spaltenbeschriftung oder Achse. Sie können auch die del-Funktion verwenden.
Warum sollten Sie eine Spalte löschen?
Normalerweise werden Spalten gelöscht, weil dies nicht der Fall ist für die Analyse nützlich sein, die Sie durchführen möchten. Wenn Sie sie entfernen, können Sie sich einfacher auf die Werte konzentrieren, die für Ihre Analyse wichtig sind.
Wie entferne ich mehrere Spalten in Pandas?
Um mehrere zu entfernen Spalten, müssen Sie die Funktion drop() verwenden, aber einen Bereich angeben, entweder mit Spaltenbeschriftungen oder Spaltenindizes.
Was ist der Unterschied zwischen drop und pop?
Die Verwendung von pop gibt Ihnen die angegebene Spalte zurück, während drop dies nicht tut.
Was ist der Unterschied zwischen drop und del?
Del kann nur kann verwendet werden, um eine Spalte zu entfernen, und kann nicht für Zeilen verwendet werden.