© ConceptCafe/Shutterstock.com
Lorsque vous travaillez avec un Pandas DataFrame, vous n’avez parfois pas besoin que toutes vos données soient présentes. L’analyse des données est généralement plus simple si nous pouvons concentrer notre point de vue et supprimer les données sans importance de l’équation.
Il existe de nombreuses façons de procéder, mais la plus courante consiste à utiliser la fonction drop. Découvrez les méthodes simples pour supprimer des colonnes dans Pandas avec cet article.
Comment supprimer une colonne à l’aide de Drop()
D’abord, voyons comment supprimer une seule colonne à l’aide de la méthode drop. Cela peut être utilisé pour supprimer la colonne de votre choix. Suivez les étapes ci-dessous.
Étape 1 : Importer des Pandas
Importer des pandas en tant que pd.
©”TNGD”.com
Pour illustrer cela, nous allons utiliser Python dans l’environnement Spyder. Tout d’abord, nous allons importer des Pandas, afin que nous puissions l’utiliser pour manipuler des données. Ceci est fait avec ce code :
importez les pandas en tant que pd
Étape 2 : Créez un dictionnaire
Création d’un tableau associatif (dictionnaire).
©”TNGD”.com
Ensuite, nous devons créer un dictionnaire afin que nous puissions illustrer le processus. Un dictionnaire est également connu sous le nom de tableau associatif, et est essentiellement un type de structure de données avec des paires de clé et de valeur, où chaque clé n’a qu’une seule valeur.
data={‘A’: [‘A1′,’A2′,’A3′,’A4′,’A5′],’B’: [‘B1′,’B2′,’B3′,’B4′,’B5′],’C’: [‘C1′,’C2′,’C3′,”C4′,’C5′],’D’ : [‘D1′,’D2′,’D3′,’D4′,’D5′],’E’ : [‘E1′,’E2′,’E3′,’E4′,”E5’]}
Ceci peut être nommé comme vous voulez, mais dans ce cas,”données”a été choisi.
Étape 3 : Créez le DataFrame
Convertir le dictionnaire.
©”TNGD”.com
L’étape suivante consiste à convertir le dictionnaire en DataFrame. Pour ce faire, utilisez le code :
df=pd.DataFrame(data)
Étape 4 : supprimez la colonne
Suppression de la première colonne.
©”TNGD”.com
Maintenant, nous pouvons enfin déposer la colonne que nous désirons. Dans ce cas, nous allons supprimer la première colonne, intitulée”A”. Le code
df.drop([‘A’}, axis=1)
accomplira cela. L’axe est défini comme 1, car il fait référence aux colonnes. La sortie affichera le DataFrame avec la colonne supprimée.
Étape 5 : Supprimez plusieurs colonnes à l’aide de Drop()
Suppression de plusieurs colonnes.
©”TNGD”.com
Ce processus peut également être utilisé supprimer plusieurs colonnes avec une légère modification. En utilisant
df.drop([‘A’,’B’], axis=1)
nous supprimons facilement les colonnes”A”et”B”.
Comment supprimer des colonnes Utilisation de l’index de colonne
Une autre façon de supprimer des colonnes consiste à se référer à l’index de colonne. La première colonne a un index de 0, la seconde un index de 1, et ainsi de suite. Ceci est illustré par les étapes ci-dessous.
Étape 1 : Créer un DataFrame
Établir un DataFrame.
©”TNGD”.com
Comme précédemment, créez un DataFrame.
Étape 2 : Déposez une colonne par index de colonne
Suppression de la première colonne.
©”TNGD”.com
Maintenant, nous pouvons utiliser le code
df.drop(df.columns[[0], axis=1)
pour supprimer la première colonne.
Étape 3 : supprimez plusieurs colonnes par index de colonne
Suppression de plusieurs colonnes.
©”TNGD”.com
Comme pour la première méthode, nous pouvons également utiliser ce processus pour supprimer plusieurs colonnes par leur index. Cela se fait avec le code
df.drop(df.columns[[0, 1]], axis=1)
spécifiant les colonnes que vous souhaitez supprimer.
Comment supprimer Colonnes utilisant iloc[] et Drop()
Une autre façon de supprimer des colonnes consiste à utiliser les méthodes iloc[] et drop(). L’utilisation de la méthode iloc supprime la première colonne de la plage spécifiée jusqu’à la dernière colonne spécifiée, mais exclut la dernière colonne. Les étapes suivantes montrent comment procéder.
Étape 1 : Créer un DataFrame
Création d’un DataFrame.
©”TNGD”.com
Nous commençons par créer un DataFrame, comme avec les autres méthodes.
Étape 2 : Déposer des colonnes à l’aide de iloc[] et Drop()
Saisie du code pour supprimer les colonnes.
©”TNGD”.com
Saisissez simplement le code
df. drop(df.iloc[:, 1:3], axis=1)
spécifiant la plage par index de colonne. Dans ce cas, les colonnes « B » et « C » ont été supprimées.”D”a été conservé puisqu’il s’agit de la deuxième colonne spécifiée.
Comment supprimer des colonnes à l’aide de loc[] et Drop()
Avec cette méthode, nous supprimons encore plusieurs colonnes , mais l’utilisation de loc[] n’exclut pas la suppression de la deuxième colonne spécifiée. Découvrez comment procéder ensuite.
Étape 1 : Créer un DataFrame
Construire un DataFrame.
©”TNGD”.com
Pour commencer, nous avons besoin d’un DataFrame comme d’habitude.
Étape 2 : supprimez plusieurs colonnes à l’aide de loc[] et Drop()
Suppression de plusieurs colonnes.
©”TNGD”.com
Avec le code
df.drop(df. loc[:,’A’:’B’].columns,axis=1)
nous supprimons les colonnes”A”et”B”. En plus de supprimer la colonne”B”, notez également que les étiquettes de colonne sont utilisées avec loc[] plutôt que l’index de colonne.
Comment supprimer une colonne
C’est un peu méthode différente car elle utilise del et non drop. Le résultat final est similaire, mais les différences sont que del ne fonctionne que pour les colonnes et ne peut supprimer qu’une seule colonne à la fois. Voyez comment cela se fait ci-dessous.
Étape 1 : Créer un DataFrame
Commencer avec notre DataFrame.
©”TNGD”.com
Nous utilisons le même DataFrame que nous avons fait précédemment.
Étape 2 : Supprimer une colonne
Suppression de la troisième colonne.
©”TNGD”.com
Dans ce cas, nous supprimons la troisième colonne, qui est la colonne”C”. Ceci est réalisé avec le code suivant :
for col in df.columns : if’C’in col: del df[col]
Cela supprimera la colonne du DataFrame.
Comment supprimer une colonne à l’aide de la fonction Pop
Ce processus fonctionne de la même manière que del, mais diffère en ce qu’il vous renverra la colonne supprimée, contrairement à del. Les étapes simples ci-dessous cette méthode.
Étape 1 : Créer un DataFrame
Tout comme avec les autres méthodes, nous avons besoin d’un DataFrame pour commencer.
Étape 2 : Supprimer une colonne à l’aide de Pop
Avec df.pop.
©”TNGD”.com
Utilisez simplement le code
df.pop(‘D’)
pour supprimer la colonne souhaitée en remplaçant”D”avec l’étiquette de colonne choisie.
Comment supprimer une colonne d’un tableau de données existant
Une autre façon d’utiliser Pandas pour supprimer des colonnes est lorsque vous avez un tableau de données préexistant. Pour ce faire, vous devez disposer de votre feuille de calcul ou de votre tableau au format CSV et connaître le chemin d’accès au fichier correspondant. Suivez ces étapes simples pour y parvenir.
Étape 1 : Importez vos données
Importation de données.
©”TNGD”.com
Tout d’abord, importez les Pandas normalement, puis utilisez
df=pd.read_csv(r’Filepath/Filename.csv’)
pour importer les données. Ce sera généralement Dossier/Nom de fichier sur Mac, dans ce cas, le dossier Documents. Sous Windows, ceci est normalement précédé de C:/Users/Username.
Étape 2 : Supprimer des colonnes à l’aide de Drop()
Suppression de colonnes à l’aide de df.drop.
©”TNGD”.com
Comme précédemment, nous utilisons le code
df.drop([“Weight”,”Height”, axis=1)
pour supprimer les colonnes”Weight”et”Height”de ce tableau. Le tableau vous est renvoyé par la suite, avec ces colonnes supprimées.
Réception des valeurs NaN.
©”TNGD”.com
Il est important de noter que les étiquettes des colonnes sont sensibles à la casse et doivent être saisies correctement, sinon vous ll recevra des valeurs NaN à la place. Ceci est illustré dans la deuxième capture d’écran.
Étape 3 : Sélectionner des colonnes dans le tableau importé
Sélectionner des colonnes.
©”TNGD”.com
Techniquement, ce n’est pas un moyen de supprimer des colonnes, mais un moyen de les sélectionner pour les visualiser. Cela peut être pratique si vous ne souhaitez pas supprimer les colonnes. Importez vos données comme avant pour commencer.
Étape 4 : Sélectionnez les colonnes souhaitées
Choix des colonnes souhaitées.
©”TNGD”.com
Enfin, utilisez
df=pd.DataFrame (df, columns=[‘Weight’,’Height’])
remplacer”Weight”et”Height”par les étiquettes de colonne souhaitées, pour sélectionner ces colonnes à afficher.
Récapitulation
Il existe plusieurs méthodes que vous pouvez utiliser pour supprimer une ou plusieurs colonnes d’un Pandas DataFrame. Le moyen le plus simple est probablement de drop () et les étiquettes de colonne, car cela peut être fait pour supprimer une ou plusieurs colonnes dans un nouveau DataFrame ou des données importées.
Pour les gros volumes de données, vous pouvez utiliser les méthodes iloc ou loc à la place, car elles peuvent supprimer de nombreuses colonnes dans une plage spécifiée. Enfin, la méthode de suppression peut être utilisée, mais notez que cela ne peut supprimer qu’une colonne à la fois. Dans l’ensemble, une fois que vous savez comment supprimer des colonnes dans Pandas, vous pouvez analyser vos données beaucoup plus efficacement.
Suivant
Comment supprimer des colonnes dans Pandas FAQ (Foire aux questions )
Comment supprimer une colonne dans Pandas ?
Le moyen le plus simple de supprimer une colonne consiste à utiliser la fonction drop() et en spécifiant soit l’étiquette ou l’axe de la colonne. Vous pouvez également utiliser la fonction del.
Pourquoi voudriez-vous supprimer une colonne ?
Généralement, les colonnes sont supprimées car elles ne vont pas être utile pour l’analyse que vous envisagez d’effectuer. Les supprimer permet de se concentrer plus facilement sur les valeurs importantes pour votre analyse.
Comment puis-je supprimer plusieurs colonnes dans Pandas ?
Pour supprimer plusieurs colonnes, vous devez utiliser la fonction drop() mais spécifiez une plage, soit en utilisant des étiquettes de colonne, soit des index de colonne.
Quelle est la différence entre drop et pop ?
L’utilisation de pop vous renvoie la colonne spécifiée, contrairement à drop.
Quelle est la différence entre drop et del ?
Del ne peut que être utilisé pour supprimer une colonne et ne peut pas être utilisé pour les lignes.