تفتح ملف CSV أو ملف نصي محدد بفواصل، وتلصقه في جدول بيانات، فتجد الأعمدة في فوضى عارمة. البيانات التي يُفترض أن تكون في العمود الثالث تظهر في العمود الخامس، ولا شيء يصطف كما ينبغي. يحدث هذا أكثر مما تتخيل، والحل عادةً أبسط مما يبدو بمجرد معرفة أين تبحث.
لماذا تتعطل محاذاة الأعمدة في الأساس
السبب الأكثر شيوعاً هو وجود محدد (delimiter) غير متسق أو غير متوقع. قد يكون ملفك محفوظاً كملف مفصول بفواصل، لكن بعض الحقول تحتوي على فواصل داخلها. إذا لم تكن تلك الحقول محاطة بعلامات اقتباس، يتعامل المحلل مع كل فاصلة كفاصل بين الأعمدة فتنزاح جميع البيانات عن مواضعها.
سبب شائع آخر هو اختلاف أحرف نهاية الأسطر. يستخدم Windows نظام CRLF (حرف الإرجاع + تغذية السطر)، بينما يستخدم Mac وLinux حرف LF فقط. عندما يتبدل الملف بينهما في منتصفه، تختلط الأمور على بعض المحللات وتتعامل مع الأحرف الزائدة كجزء من قيمة الحقل.
خطوة بخطوة: تشخيص المشكلة
- افتح الملف الخام في محرر نصوص بسيط مثل Notepad++ أو VS Code، وليس في تطبيق جداول بيانات. هذا يُظهر لك الأحرف الفعلية وليس نسخة مُفسَّرة.
- ابحث عن الحقول التي تحتوي على حرف المحدد داخل القيمة. على سبيل المثال، "Smith, John" في ملف مفصول بفواصل يحتاج إلى علامات الاقتباس المحيطة به وإلا سينقسم إلى عمودين.
- تحقق من صف الترويسة. عُد عدد المحددات فيه. ثم تحقق من بعض صفوف البيانات. إذا كان أي صف يحتوي على محددات أكثر أو أقل من الترويسة، فذلك الصف غير محاذٍ.
- ابحث عن استخدام غير متسق لعلامات الاقتباس. علامة اقتباس افتتاحية بدون علامة إغلاق ستجعل المحلل يبتلع عدة صفوف كحقل واحد.
- تحقق من ترميز الملف. ملف UTF-8 يحتوي على BOM (علامة ترتيب البايت) قد يُضيف أحرفاً غير مرئية في البداية، مما يُزيح العمود الأول.
نصيحة: طريقة سريعة لعد المحددات في كل سطر هي لصق بياناتك في عداد الأسطر ثم فحص الأسطر الفردية يدوياً. إذا بدا سطر معين أطول أو أقصر من البقية، فهذا هو السطر المشكل.
الأسباب الشائعة وحلولها
| المشكلة | السبب | الحل |
|---|---|---|
| الأعمدة تنزاح نحو اليمين | فاصلة غير محاطة بعلامات اقتباس داخل حقل | أحط قيمة الحقل بعلامات اقتباس مزدوجة |
| الصفوف تندمج معاً | علامة اقتباس إغلاق مفقودة | ابحث عن علامة الاقتباس غير المغلقة وأغلقها |
| العمود الأول يحتوي على أحرف غريبة | علامة BOM في ملف UTF-8 | أعد حفظ الملف بترميز UTF-8 بدون BOM |
| أعمدة فارغة عشوائية | محددات مزدوجة (مثل: ,,) | ابحث عن المحددات الزائدة وأزلها أو استبدلها |
| البيانات في أعمدة خاطئة | اختيار محدد خاطئ عند الاستيراد | أعد الاستيراد باستخدام حرف المحدد الصحيح |
تغيير المحددات لتجنب التعارضات
أحياناً يكون الحل الأسهل هو تغيير المحدد بالكامل. إذا كانت بياناتك تحتوي على الكثير من الفواصل (عناوين، أسماء، أوصاف)، انتقل إلى حرف الأنبوب (|) أو علامة الجدولة (tab). نادراً ما تظهر هذه الأحرف في النصوص العادية، مما يقلل بشكل كبير من احتمال حدوث تعارض.
يمكنك القيام بذلك بسرعة باستخدام محوّل المحددات عبر الإنترنت. ما عليك سوى لصق بياناتك واختيار المحدد الجديد وستحصل على مخرجات نظيفة في ثوانٍ. لا حاجة لكتابة أي أكواد برمجية.
تحذير: قبل تغيير المحددات، افحص دائماً بياناتك للتأكد من أن حرف المحدد الجديد لا يظهر بالفعل في قيمك. استبدال الفواصل بأحرف الأنبوب لن يفيد إذا كانت بياناتك تحتوي بالفعل على أحرف أنبوب.
إصلاح المحاذاة باستخدام أداة نصية
إذا كنت بحاجة إلى إجراء بحث واستبدال سريع لتنظيف الأحرف الشاردة، يمكن لأداة البحث والاستبدال عبر الإنترنت التعامل مع ذلك دون فتح محرر أكواد كامل. يمكنك إزالة الأحرف غير المرغوب فيها، وإصلاح المحددات المزدوجة، أو استبدال فاصل بآخر بنقرات قليلة.
لتنظيف أكثر تنظيماً، مثل ترتيب الصفوف أو إزالة التكرارات التي تسللت أثناء الإصلاح، يمكن لأداة إزالة الأسطر المكررة وأداة ترتيب الأسطر إعادة ملفك النصي إلى حالته الصحيحة بسرعة.
النقاط الرئيسية
- معظم مشاكل محاذاة الأعمدة تنتج عن أحرف محددات غير محاطة بعلامات اقتباس داخل قيم الحقول، وليس بسبب تلف الملف.
- افحص دائماً محتوى الملف الخام في محرر نصوص بسيط قبل افتراض أن البيانات نفسها خاطئة.
- التحويل إلى محدد أقل شيوعاً مثل الأنبوب أو علامة الجدولة يقلل من احتمال حدوث تعارضات مستقبلية.
- المشاكل غير المرئية مثل أحرف BOM في UTF-8 واختلاف أحرف نهاية الأسطر يسهل إغفالها لكن يمكن إصلاحها بسرعة بمجرد تحديدها.
- الأدوات المجانية عبر الإنترنت يمكنها التعامل مع معظم مشاكل المحددات والمحاذاة دون الحاجة لكتابة أي كود برمجي.
ابدأ بالبيانات الخام
مشاكل محاذاة الأعمدة في الملفات المحددة بفواصل تعود دائماً تقريباً إلى واحد من مجموعة قليلة من الأسباب. الحيلة هي ألا تخمّن. افتح الملف الخام، وانظر إلى الأحرف الفعلية، وعُد المحددات في كل سطر. بمجرد رؤية النمط، يكون الحل عادةً واضحاً ومباشراً.
إذا كنت تتعامل مع عدم تطابق المحددات بشكل متكرر، أضف محوّل الفواصل إلى أنابيب على Delimiter.site إلى مفضلاتك. إنها طريقة سريعة لإعادة تنسيق بياناتك دون أي إعداد أو تثبيت.