© ConceptCafe/Shutterstock.com

Wenn Sie mit einem Pandas DataFrame arbeiten, müssen manchmal nicht alle Ihre Daten vorhanden sein. Die Datenanalyse ist normalerweise einfacher, wenn wir unseren Blick fokussieren und unwichtige Daten aus der Gleichung entfernen können.

Es gibt viele Möglichkeiten, dies zu tun, aber die gebräuchlichste ist die Drop-Funktion. Entdecken Sie in diesem Artikel die einfachen Methoden zum Ablegen von Spalten in Pandas.

Wie man eine Spalte mit Drop() löscht

Lassen Sie uns zuerst durchgehen, wie man eine einzelne Spalte mit der Drop-Methode entfernt. Dies kann verwendet werden, um jede gewünschte Spalte zu löschen. Befolgen Sie die nachstehenden Schritte.

Schritt 1: Pandas importieren

Pandas als pd importieren.

©”TNGD”.com

Zur Veranschaulichung verwenden wir Python in der Spyder-Umgebung. Zuerst werden wir Pandas importieren, damit wir damit Daten manipulieren können. Dies geschieht mit diesem Code:

import pandas as pd

Step 2: Create a Dictionary

Erstellen eines assoziativen Arrays (Wörterbuch).

©”TNGD”.com

Als nächstes müssen wir erstellen ein Wörterbuch, damit wir den Prozess veranschaulichen können. Ein Wörterbuch wird auch als assoziatives Array bezeichnet und ist im Grunde eine Art Datenstruktur mit Schlüssel-Wert-Paaren, wobei jeder Schlüssel nur einen Wert hat.

data={‘A’: [‘A1′,’A2′,’A3′,’A4′,’A5′],’B’: [‘B1′,’B2′,’B3′,’B4′,’B5′],’C’: [‘C1′,’C2′,’C3′,”C4′,’C5′],’D’: [‘D1′,’D2′,’D3′,’D4′,’D5′],’E’: [‘E1′,’E2′,’E3′,’E4′,”E5’]}

Dies kann beliebig benannt werden, aber in diesem Fall wurde „Daten“ ausgewählt.

Schritt 3: DataFrame erstellen

Konvertieren des Wörterbuchs.

©”TNGD”.com

Der nächste Schritt ist das Konvertieren des Wörterbuchs in einen DataFrame. Verwenden Sie dazu den Code:

df=pd.DataFrame(data)

Schritt 4: Drop the Column

Löschen der ersten Spalte.

©”TNGD”.com

Jetzt können wir es Lassen Sie endlich die Spalte fallen, die wir wünschen. In diesem Fall werden wir die erste Spalte mit der Bezeichnung „A“ löschen. Der Code

df.drop([‘A’}, axis=1)

bewerkstelligt dies. Die Achse ist als 1 definiert, da sich dies auf Spalten bezieht. Die Ausgabe zeigt den DataFrame mit entfernter Spalte.

Schritt 5: Mehrere Spalten mit Drop() löschen

Dropping mehrerer Spalten.

©”TNGD”.com

Dieses Verfahren kann ebenfalls verwendet werden mehrere Spalten mit einer leichten Modifikation zu löschen. Durch die Verwendung von

df.drop([‘A’,’B’], axis=1)

verwerfen wir die Spalten „A“ und „B“ ganz einfach.

Wie man Spalten verwirft Den Spaltenindex verwenden

Eine andere Möglichkeit, Spalten zu löschen, besteht darin, sich auf den Spaltenindex zu beziehen. Die erste Spalte hat einen Index von 0, die zweite einen Index von 1 und so weiter. Dies wird mit den folgenden Schritten veranschaulicht.

Schritt 1: DataFrame erstellen

Erstellen eines DataFrame.

©”TNGD”.com

Erstellen Sie wie zuvor einen DataFrame.

Schritt 2: Einen Spalten-für-Spalten-Index ablegen

Entfernen der ersten Spalte.

©”TNGD”.com

Jetzt können wir den Code

df.drop(df.columns[[0], axis=1)

um die erste Spalte zu entfernen.

Schritt 3: Mehrere Spalten nach Spaltenindex löschen

Entfernen mehrerer Spalten.

©”TNGD”.com

Wie bei der ersten Methode, Wir können diesen Prozess auch verwenden, um mehrere Spalten nach ihrem Index zu löschen. Dies geschieht mit dem Code

df.drop(df.columns[[0, 1]], axis=1)

der angibt, welche Spalten Sie löschen möchten.

How to Drop Spalten mit iloc[] und Drop()

Eine alternative Methode zum Löschen von Spalten ist die Verwendung der Methoden iloc[] und drop(). Die Verwendung der iloc-Methode entfernt die erste Spalte im angegebenen Bereich bis zur letzten angegebenen Spalte, schließt aber die letzte Spalte aus. Die nächsten Schritte zeigen, wie das geht.

Schritt 1: Erstellen Sie einen DataFrame

Erstellen eines DataFrame.

©”TNGD.com

Wir beginnen mit dem Erstellen eines DataFrame, wie bei den anderen Methoden.

Schritt 2: Spalten mit iloc[] und Drop() löschen

Eingabe des Codes zum Löschen von Spalten.

©”TNGD”.com

Einfach den Code eingeben

df. drop(df.iloc[:, 1:3], axis=1)

Angabe des Bereichs nach Spaltenindex. In diesem Fall wurden die Spalten „B“ und „C“ entfernt. „D“ wurde beibehalten, da es die zweite angegebene Spalte ist.

So löschen Sie Spalten mit loc[] und Drop()

Mit dieser Methode löschen wir immer noch mehrere Spalten , aber die Verwendung von loc[] schließt die zweite angegebene Spalte nicht vom Löschen aus. Sehen Sie sich als Nächstes an, wie das geht.

Schritt 1: Erstellen Sie einen DataFrame

Konstruieren eines Datenrahmens.

©”TNGD”.com

Um zu beginnen, benötigen wir wie üblich einen Datenrahmen.

p>

Schritt 2: Mehrere Spalten mit loc[] und Drop() ablegen

Mehrere Spalten loswerden.

©”TNGD”.com

Mit dem Code

df.drop(df. loc[:,’A’:’B’].columns,axis=1)

wir entfernen die Spalten „A“ und „B“. Beachten Sie nicht nur, dass die Spalte „B“ weggelassen wird, sondern auch, dass Spaltenbeschriftungen mit loc[] und nicht mit dem Spaltenindex verwendet werden.

So löschen Sie eine Spalte

Das ist ein bisschen andere Methode, da sie del und nicht drop verwendet. Das Endergebnis ist ähnlich, aber die Unterschiede bestehen darin, dass del nur für Spalten funktioniert und nur jeweils eine Spalte entfernen kann. Sehen Sie unten, wie dies gemacht wird.

Schritt 1: Erstellen Sie einen DataFrame

Beginnend mit unserem DataFrame.

©”TNGD”.com

Wir verwenden denselben DataFrame wie bisher zuvor.

Schritt 2: Spalte löschen

Löschen der dritten Spalte.

©”TNGD”.com

In diesem Fall löschen wir die dritte Spalte, also Spalte „C“.. Dies wird mit folgendem Code erreicht:

für col in df.columns: if’C’in col: del df[col]

Dadurch wird die Spalte aus dem DataFrame gelöscht.

So löschen Sie eine Spalte mit der Pop-Funktion

Dieser Vorgang funktioniert ähnlich wie del, unterscheidet sich jedoch darin, dass er die gelöschte Spalte an Sie zurückgibt, del jedoch nicht. Die einfachen Schritte unter dieser Methode.

Schritt 1: Erstellen Sie einen DataFrame

Genau wie bei den anderen Methoden benötigen wir einen DataFrame, um zu beginnen.

Schritt 2: Spalte mit Pop löschen

Using df.pop.

©”TNGD”.com

Verwenden Sie einfach den Code

df.pop(‘D’)

um die gewünschte Spalte zu löschen, ersetzen Sie „ D“ durch die von Ihnen gewählte Spaltenbezeichnung.

So löschen Sie eine Spalte aus einer vorhandenen Datentabelle

Eine andere Möglichkeit, Pandas zum Löschen von Spalten zu verwenden, besteht darin, wenn Sie eine bereits vorhandene Datentabelle haben. Dazu müssen Sie Ihre Tabelle oder Tabelle im CSV-Format haben und den Dateipfad dafür kennen. Befolgen Sie dazu diese einfachen Schritte.

Schritt 1: Importieren Sie Ihre Daten

Importieren von Daten.

©”TNGD”.com

Importieren Sie zunächst Pandas ganz normal und verwenden Sie dann

df=pd.read_csv(r’Filepath/Filename.csv’)

um die Daten zu importieren. Dies ist normalerweise Ordner/Dateiname auf dem Mac, in diesem Fall der Ordner „Dokumente“. Unter Windows geht dem normalerweise C:/Benutzer/Benutzername voran.

Schritt 2: Spalten mit Drop() löschen

Spalten löschen mit df.drop.

©”TNGD”.com

Wie zuvor verwenden wir den Code

df.drop([„Gewicht“, „Höhe“, Achse=1)

um die Spalten „Gewicht“ und „Höhe“ aus dieser Tabelle zu löschen. Die Tabelle wird Ihnen danach zurückgegeben, wobei diese Spalten entfernt wurden.

Empfang von NaN-Werten.

©”TNGD”.com

Es ist wichtig zu beachten, dass bei den Spaltenbezeichnungen zwischen Groß-und Kleinschreibung unterschieden wird und sie korrekt eingegeben werden müssen, andernfalls Ich erhalte stattdessen NaN-Werte. Dies wird im zweiten Screenshot gezeigt.

Schritt 3: Spalten aus der importierten Tabelle auswählen

Spalten auswählen.

©”TNGD”.com

Dies ist technisch gesehen keine Möglichkeit, Spalten zu löschen, sondern eine Möglichkeit, sie zum Anzeigen auszuwählen. Dies kann praktisch sein, wenn Sie die Spalten nicht entfernen möchten. Importieren Sie Ihre Daten wie zuvor, um zu beginnen.

Schritt 4: Wählen Sie die gewünschten Spalten

Wählen Sie die gewünschten Spalten aus.

©”TNGD”.com

Verwenden Sie schließlich

df=pd.DataFrame (df, column=[‘Weight’,’Height’])

Ersetzen Sie „Weight“ und „Height“ durch Ihre gewünschten Spaltenbeschriftungen, um diese Spalten zur Anzeige auszuwählen.

Zusammenfassung

h2>

Es gibt mehrere Methoden, die Sie verwenden können, um eine oder mehrere Spalten aus einem Pandas DataFrame zu löschen. Der einfachste Weg ist wahrscheinlich drop() und die Spaltenbeschriftungen, da dies getan werden kann, um eine oder mehrere Spalten in einem neuen DataFrame oder importierten Daten zu löschen.

Für große Datenmengen sollten Sie stattdessen die Methoden iloc oder loc verwenden, da diese viele Spalten innerhalb eines bestimmten Bereichs entfernen können. Schließlich kann die delete-Methode verwendet werden, aber beachten Sie, dass diese nur eine Spalte auf einmal entfernen kann. Alles in allem können Sie Ihre Daten viel effizienter analysieren, sobald Sie wissen, wie man Spalten in Pandas löscht.

Als nächstes

How to Drop Columns in Pandas FAQs (Häufig gestellte Fragen ) 

Wie lösche ich eine Spalte in Pandas?

Der einfachste Weg, eine Spalte zu löschen, ist die drop()-Funktion und die Angabe einer der beiden die Spaltenbeschriftung oder Achse. Sie können auch die del-Funktion verwenden.

Warum sollten Sie eine Spalte löschen?

Normalerweise werden Spalten gelöscht, weil dies nicht der Fall ist für die Analyse nützlich sein, die Sie durchführen möchten. Wenn Sie sie entfernen, können Sie sich einfacher auf die Werte konzentrieren, die für Ihre Analyse wichtig sind.

Wie entferne ich mehrere Spalten in Pandas?

Um mehrere zu entfernen Spalten, müssen Sie die Funktion drop() verwenden, aber einen Bereich angeben, entweder mit Spaltenbeschriftungen oder Spaltenindizes.

Was ist der Unterschied zwischen drop und pop?

Die Verwendung von pop gibt Ihnen die angegebene Spalte zurück, während drop dies nicht tut.

Was ist der Unterschied zwischen drop und del?

Del kann nur kann verwendet werden, um eine Spalte zu entfernen, und kann nicht für Zeilen verwendet werden.

By Maxwell Gaven

Ich habe 7 Jahre im IT-Bereich gearbeitet. Es macht Spaß, den stetigen Wandel im IT-Bereich zu beobachten. IT ist mein Job, Hobby und Leben.