Profilo di
Sebastian Gray
| Nome | Sebastian Gray |
|---|---|
| Indirizzo email | paulm.faris652@gmail.com |
| Avatar | ![]() |
| Messaggi | 1 |
-
- 2025-11-24 08:00:02
- Re: Come gestire i valori mancanti in un dataframe Pandas?
- Forum >> Programmazione Python >> Database
- Quando lavori con valori mancanti in Pandas non esiste una soluzione unica. La scelta migliore dipende molto dal tipo di analisi che devi fare e dal significato delle colonne nel tuo dataset.
In generale puoi seguire questi approcci:
Rimuovere le righe con valori mancanti
Va bene se i NaN sono pochi e la perdita di dati non influisce molto sull’analisi.
df_clean = df.dropna()
Sostituire i valori mancanti con la media, mediana o moda
Se i dati sono numerici e non vuoi perdere righe, questo è spesso il metodo più semplice.
df_filled = df.copy()
df_filled['Age'] = df_filled['Age'].fillna(df_filled['Age'].mean())
df_filled['Score'] = df_filled['Score'].fillna(df_filled['Score'].mean())
df_filled['Salary'] = df_filled['Salary'].fillna(df_filled['Salary'].median())
Interpolazione
Utile quando i dati seguono un certo ordine o una progressione.
df_interpolated = df.interpolate()
Imputazione avanzata
Se hai molti NaN o stai preparando dati per il machine learning puoi usare metodi più evoluti come KNNImputer o IterativeImputer da scikit learn.
Se ci dici qualcosa in più sul tipo di analisi posso suggerire un metodo più preciso, ma per la maggior parte dei progetti di data science i metodi sopra funzionano già molto bene.

