Apri un file CSV o un file di testo delimitato, lo incolli in un foglio di calcolo e le colonne sono un disastro. I dati che dovrebbero essere nella terza colonna finiscono nella quinta, e niente si allinea come dovrebbe. Succede più spesso di quanto si pensi, e la soluzione è generalmente più semplice di quanto sembri, una volta che sai dove controllare.
Perché l'allineamento delle colonne si rompe
Il colpevole più comune è un delimitatore incoerente o inaspettato. Il file potrebbe essere salvato come file separato da virgole, ma alcuni campi contengono virgole al loro interno. Se quei campi non sono racchiusi tra virgolette, il parser tratta ogni virgola come un'interruzione di colonna e tutto si sfasa.
Un'altra causa frequente sono i fine riga misti. Windows usa CRLF (ritorno a capo + avanzamento riga), mentre Mac e Linux usano solo LF. Quando un file alterna tra questi formati a metà strada, alcuni parser si confondono e trattano i caratteri estranei come parte del valore di un campo.
Passo dopo passo: diagnosticare il problema
- Apri il file grezzo in un editor di testo semplice come Notepad++ o VS Code, non in un'applicazione per fogli di calcolo. Questo ti mostra i caratteri effettivi, non una versione interpretata.
- Cerca i campi che contengono il carattere delimitatore all'interno del valore. Ad esempio, "Smith, John" in un file delimitato da virgole ha bisogno delle virgolette che lo circondano, altrimenti verrà suddiviso in due colonne.
- Controlla la riga di intestazione. Conta il numero di delimitatori al suo interno. Poi controlla alcune righe di dati. Se una riga ha più o meno delimitatori dell'intestazione, quella riga è disallineata.
- Cerca un uso incoerente delle virgolette. Una virgoletta di apertura senza la corrispondente chiusura farà sì che il parser inglobi più righe in un singolo campo.
- Verifica la codifica del file. Un file UTF-8 con BOM (byte order mark) può aggiungere caratteri invisibili all'inizio, spostando la prima colonna.
Suggerimento: un modo rapido per contare i delimitatori per riga è incollare i dati in un contatore di righe e poi controllare manualmente le singole righe. Se una riga specifica appare più lunga o più corta delle altre, quella è la riga problematica.
Cause comuni e relative soluzioni
| Problema | Causa | Soluzione |
|---|---|---|
| Le colonne si spostano a destra | Virgola non racchiusa tra virgolette all'interno di un campo | Racchiudere il valore del campo tra doppi apici |
| Le righe si fondono insieme | Virgoletta di chiusura mancante | Trovare e chiudere la virgoletta non chiusa |
| La prima colonna contiene caratteri anomali | BOM UTF-8 nel file | Salvare nuovamente il file come UTF-8 senza BOM |
| Colonne vuote casuali | Delimitatori doppi (es. ,,) | Trovare e rimuovere o sostituire i delimitatori in eccesso |
| Dati nelle colonne sbagliate | Delimitatore errato selezionato durante l'importazione | Reimportare utilizzando il carattere delimitatore corretto |
Cambiare delimitatore per evitare conflitti
A volte la soluzione più semplice è cambiare completamente il delimitatore. Se i tuoi dati contengono molte virgole (indirizzi, nomi, descrizioni), passa al carattere pipe (|) o al tabulatore. Questi caratteri compaiono raramente nel testo normale, quindi c'è molta meno probabilità di collisioni.
Puoi farlo rapidamente con un convertitore di delimitatori online. Basta incollare i dati, scegliere il nuovo delimitatore e otterrai un output pulito in pochi secondi. Nessuno script necessario.
Attenzione: prima di cambiare delimitatore, controlla sempre che il nuovo carattere delimitatore non sia già presente nei tuoi valori. Sostituire le virgole con i pipe non servirà a nulla se i dati contengono già dei pipe.
Correggere l'allineamento con uno strumento di testo
Se hai bisogno di fare un rapido trova e sostituisci per ripulire caratteri anomali, uno strumento trova e sostituisci online può gestire l'operazione senza aprire un editor di codice completo. Puoi eliminare caratteri indesiderati, correggere delimitatori doppi o sostituire un separatore con un altro in pochi clic.
Per una pulizia più strutturata, come ordinare le righe o rimuovere duplicati che si sono insinuati durante la correzione, un strumento per rimuovere righe duplicate e uno strumento per ordinare le righe possono rimettere in ordine il tuo file di testo in poco tempo.
Punti chiave
- La maggior parte dei problemi di allineamento delle colonne deriva da caratteri delimitatori non racchiusi tra virgolette all'interno dei valori dei campi, non da un file corrotto.
- Ispeziona sempre il contenuto grezzo del file in un editor di testo semplice prima di supporre che i dati stessi siano errati.
- Passare a un delimitatore meno comune come il pipe o il tabulatore riduce le probabilità di conflitti futuri.
- Problemi invisibili come i caratteri BOM UTF-8 e i fine riga misti sono facili da non notare, ma rapidi da correggere una volta identificati.
- Gli strumenti online gratuiti possono gestire la maggior parte dei problemi di delimitazione e allineamento senza bisogno di scrivere codice.
Parti dai dati grezzi
I problemi di allineamento delle colonne nei file delimitati risalgono quasi sempre a una manciata di cause. Il trucco è non tirare a indovinare. Apri il file grezzo, osserva i caratteri effettivi e conta i delimitatori per riga. Una volta individuato lo schema, la soluzione è generalmente immediata.
Se ti capita spesso di avere a che fare con disallineamenti dei delimitatori, aggiungi ai preferiti il convertitore da virgola a pipe su Delimiter.site. È un modo rapido per riformattare i dati senza alcuna configurazione o installazione.