Link to this sectionاستراتيجيات جمع البيانات وتصنيفها لرؤية الحاسوب#
يُعد جمع البيانات وتصنيفها الخطوتين الأساسيتين في أي مشروع رؤية حاسوبية: حيث تقوم بجمع صور أو مقاطع فيديو تمثيلية، ثم تصنيفها (وضع علامات عليها) ليتمكن النموذج من التعلم منها. وتحدد جودة هذه البيانات بشكل مباشر أداء النموذج، ولهذا السبب تكتسب تعريف الفئات، والمصادر غير المتحيزة، والتصنيف المتسق أهمية بالغة قبل بدء أي عملية تدريب.
Watch: How to Build Effective Data Collection and Annotation Strategies for Computer Vision 🚀
يغطي هذا الدليل إعداد الفئات وجمع البيانات، وماهية تصنيف البيانات بالإضافة إلى أنواع التنسيقات التي يجب الاختيار من بينها، واستراتيجيات التصنيف الفعالة — حيث يتماشى كل قرار مع أهداف مشروعك.
Link to this sectionإعداد الفئات وجمع البيانات#
يعتمد جمع الصور ومقاطع الفيديو لمشروع رؤية حاسوبية على ثلاثة قرارات: عدد الفئات المطلوب تعريفها، ومكان الحصول على البيانات، وكيفية الحفاظ على مجموعة البيانات خالية من التحيز.
Link to this sectionاختيار الفئات المناسبة لمشروعك#
أحد الأسئلة الأولى عند بدء مشروع رؤية حاسوبية هو عدد الفئات التي يجب تضمينها. تحتاج إلى تحديد عضوية الفئة، والتي تشمل الفئات أو التسميات المختلفة التي تريد أن يتعرف عليها نموذجك ويميز بينها. يجب تحديد عدد الفئات من خلال الأهداف المحددة لمشروعك.
على سبيل المثال، إذا كنت تريد مراقبة حركة المرور، فقد تشمل فئاتك "سيارة"، "شاحنة"، "حافلة"، "دراجة نارية"، و"دراجة هوائية". من ناحية أخرى، لتتبع العناصر في متجر، يمكن أن تكون فئاتك "فواكه"، "خضروات"، "مشروبات"، و"وجبات خفيفة". يساعد تحديد الفئات بناءً على أهداف مشروعك في الحفاظ على صلة مجموعة بياناتك وتركيزها.
عند تحديد فئاتك، هناك تمييز مهم آخر يجب القيام به وهو الاختيار بين أعداد الفئات الإجمالية أو الدقيقة. يشير 'العدد' إلى عدد الفئات المميزة التي تهتم بها. يؤثر هذا القرار على دقة بياناتك وتعقيد نموذجك. إليك اعتبارات كل نهج:
- عدد الفئات الإجمالي (Coarse Class-Count): هذه فئات أوسع وأكثر شمولاً، مثل "مركبة" و"غير مركبة". وهي تبسط عملية التصنيف وتتطلب موارد حوسبة أقل ولكنها توفر معلومات أقل تفصيلاً، مما قد يحد من فعالية النموذج في السيناريوهات المعقدة.
- عدد الفئات الدقيق (Fine Class-Count): المزيد من الفئات مع تمييزات أدق، مثل "سيدان"، "سيارة دفع رباعي (SUV)"، "شاحنة صغيرة"، و"دراجة نارية". وهي تلتقط معلومات أكثر تفصيلاً، مما يحسن دقة النموذج وأدائه. ومع ذلك، فهي تستغرق وقتاً أطول وتتطلب جهداً أكبر في التصنيف وتستهلك موارد حوسبة أكثر.
يمكن أن يكون البدء بفئات أكثر تحديداً مفيداً جداً، خاصة في المشاريع المعقدة حيث تكون التفاصيل مهمة. تسمح لك الفئات الأكثر تحديداً بجمع بيانات أكثر تفصيلاً، واكتساب رؤى أعمق، وإنشاء تمييزات أوضح بين الفئات. لا يؤدي ذلك إلى تحسين دقة النموذج فحسب، بل يسهل أيضاً تعديل النموذج لاحقاً إذا لزم الأمر، مما يوفر الوقت والموارد.
Link to this sectionمصادر البيانات#
يمكنك استخدام مجموعات البيانات العامة أو جمع بياناتك المخصصة. توفر مجموعات البيانات العامة مثل تلك الموجودة على Kaggle ومحرك بحث بيانات Google بيانات مصنفة وموحدة بشكل جيد، مما يجعلها نقاط انطلاق رائعة لتدريب النماذج والتحقق من صحتها.
من ناحية أخرى، يسمح لك جمع البيانات المخصصة بتكييف مجموعة بياناتك مع احتياجاتك الخاصة. قد تلتقط صوراً ومقاطع فيديو باستخدام الكاميرات أو الطائرات بدون طيار، أو تقوم بجمع الصور من الويب، أو استخدام بيانات داخلية موجودة من مؤسستك. تمنحك البيانات المخصصة مزيداً من التحكم في جودتها ومدى ملاءمتها. يساعد الجمع بين مصادر البيانات العامة والمخصصة في إنشاء مجموعة بيانات متنوعة وشاملة.
Link to this sectionتجنب التحيز في جمع البيانات#
يحدث التحيز عندما يتم تمثيل مجموعات أو سيناريوهات معينة بشكل ناقص أو مفرط في مجموعة بياناتك. يؤدي هذا إلى نموذج يعمل بشكل جيد على بعض البيانات ولكن بشكل سيئ على بيانات أخرى. من الضروري تجنب التحيز في الذكاء الاصطناعي حتى يتمكن نموذج الرؤية الحاسوبية الخاص بك من الأداء الجيد في مجموعة متنوعة من السيناريوهات.
إليك كيفية تجنب التحيز أثناء جمع البيانات:
- مصادر متنوعة: اجمع البيانات من العديد من المصادر لالتقاط وجهات نظر وسيناريوهات مختلفة.
- تمثيل متوازن: قم بتضمين تمثيل متوازن من جميع المجموعات ذات الصلة. على سبيل المثال، ضع في اعتبارك مختلف الأعمار والأجناس والأعراق.
- مراقبة مستمرة: قم بمراجعة وتحديث مجموعة بياناتك بانتظام لتحديد ومعالجة أي تحيزات ناشئة.
- تقنيات تخفيف التحيز: استخدم أساليب مثل زيادة أخذ العينات للفئات الممثلة تمثيلاً ناقصاً، وزيادة البيانات، والخوارزميات المراعية للعدالة.
تساعد هذه الممارسات في إنشاء نموذج أكثر قوة وعدالة يمكنه التعميم بشكل جيد في تطبيقات العالم الحقيقي.
Link to this sectionما هو تصنيف البيانات (Data Annotation)؟#
تصنيف البيانات هو عملية وضع تسميات للبيانات لجعلها قابلة للاستخدام لتدريب نماذج التعلم الآلي. في رؤية الحاسوب، يعني هذا وضع تسميات للصور أو الفيديوهات بالمعلومات التي يحتاجها النموذج للتعلم منها. بدون بيانات مصنفة بشكل صحيح، لا يمكن للنماذج تعلم العلاقات بين المدخلات والمخرجات بدقة.
Link to this sectionأنواع تصنيف البيانات#
اعتماداً على المتطلبات المحددة لـ مهمة رؤية حاسوبية، هناك أنواع مختلفة من تصنيف البيانات. فيما يلي بعض الأمثلة:
- صناديق التحديد (Bounding Boxes): مربعات مستطيلة تُرسَم حول الكائنات في الصورة، تُستخدم بشكل أساسي لمهام اكتشاف الكائنات. يتم تعريف هذه المربعات بإحداثيات الزاوية العلوية اليسرى والسفلية اليمنى.
- المضلعات (Polygons): مخططات تفصيلية للكائنات، مما يسمح بتصنيف أكثر دقة من صناديق التحديد. تُستخدم المضلعات في مهام مثل تقسيم المثيلات، حيث يكون شكل الكائن مهماً.
- الأقنعة (Masks): أقنعة ثنائية حيث يكون كل بكسل إما جزءاً من كائن أو الخلفية. تُستخدم الأقنعة في مهام التقسيم الدلالي لتوفير تفاصيل على مستوى البكسل.
- النقاط الرئيسية (Keypoints): نقاط محددة يتم تمييزها داخل الصورة لتحديد مواقع الاهتمام. تُستخدم النقاط الرئيسية في مهام مثل تقدير الوضع واكتشاف معالم الوجه.
Link to this sectionتنسيقات التصنيف الشائعة#
بعد اختيار نوع التصنيف، من المهم اختيار التنسيق المناسب لتخزين ومشاركة التصنيفات. التنسيقات الأكثر شيوعاً هي:
| التنسيق | هيكل الملف | يُستخدم عادةً لـ |
|---|---|---|
| COCO | ملف JSON واحد | اكتشاف الكائنات، وتقسيم الأجزاء (instance segmentation)، واكتشاف النقاط الرئيسية (keypoint detection)، وتقسيم العناصر والتقسيم البانوبتيكي، وشرح الصور |
| Pascal VOC | ملف XML واحد لكل صورة | اكتشاف الكائنات |
| YOLO | ملف .txt واحد لكل صورة | اكتشاف الكائنات، والتقسيم، والوضعية (pose) |
يخزن تنسيق YOLO صفاً واحداً لكل كائن مع فهارس فئة تبدأ من 0. بالنسبة لـ اكتشاف الكائنات، يكون الصف class x_center y_center width height مع إحداثيات طبيعية تتراوح بين 0 و1، بينما يُلحق تنسيق التقسيم نقاط المضلع الطبيعية، ويُلحق الوضعية إحداثيات النقاط الرئيسية بالإضافة إلى قيم الرؤية الاختيارية بعد الصندوق.
Link to this sectionوضع إرشادات التصنيف#
بعد اختيار نوع التصنيف والتنسيق، تكون الخطوة التالية هي وضع قواعد تصنيف واضحة وموضوعية. تعمل هذه القواعد كخارطة طريق للاتساق والدقة طوال عملية التصنيف. تشمل الجوانب الرئيسية لهذه القواعد:
- الوضوح والتفصيل: تأكد من أن تعليماتك واضحة. استخدم أمثلة وتوضيحات لإظهار ما هو متوقع.
- الاتساق: اجعل تصنيفاتك موحدة. ضع معايير قياسية لتصنيف أنواع مختلفة من البيانات، بحيث تتبع جميع التصنيفات نفس القواعد.
- تقليل التحيز: كن محايداً. درب نفسك على أن تكون موضوعياً وقلل التحيزات الشخصية لضمان تصنيفات عادلة.
- الكفاءة: اعمل بذكاء، وليس بجهد أكبر. استخدم الأدوات وسير العمل التي تعمل على أتمتة المهام المتكررة، مما يجعل عملية التصنيف أسرع وأكثر كفاءة.
ستساعدك مراجعة وتحديث قواعد التصنيف بانتظام في الحفاظ على دقة تصنيفاتك واتساقها وتوافقها مع أهداف مشروعك.
Link to this sectionأدوات الوسم#
تتيح لك أداة التصنيف الجيدة تصنيف كل نوع تحتاجه مهمتك، وتفرض إرشادات متسقة، وتصدر التصنيفات بتنسيق جاهز للتدريب. توفر Ultralytics Platform محرر تصنيف مدمج يغطي الاكتشاف، وتقسيم الأجزاء، والوضعية، وOBB، والتصنيف، مع تصنيف ذكي مدعوم بـ SAM يحول نقرة واحدة إلى قناع لمهام الاكتشاف والتقسيم وOBB. ولأن كل تصنيف يتم حفظه بتنسيق YOLO، تنتقل مجموعة البيانات المصنفة الخاصة بك مباشرة إلى التدريب دون الحاجة إلى خطوة تحويل.
Link to this sectionجودة التصنيف: الدقة، والضبط، والقيم المتطرفة#
قبل التصنيف على نطاق واسع، من المفيد فهم الدقة، والضبط، والقيم المتطرفة، ومراقبة الجودة، حتى لا تقوم بتصنيف بياناتك بطريقة عكسية.
Link to this sectionفهم الدقة والإحكام#
من المهم فهم الفرق بين الدقة (Accuracy) والإحكام (Precision) وكيفية ارتباطهما بالتصنيف. تشير الدقة إلى مدى قرب البيانات المصنفة من القيم الحقيقية. وهي تساعدنا في قياس مدى قرب التسميات من سيناريوهات العالم الحقيقي. يشير الإحكام إلى اتساق التصنيفات. وهو يتحقق مما إذا كنت تعطي نفس التسمية لنفس الكائن أو الميزة طوال مجموعة البيانات. تؤدي الدقة والإحكام العاليان إلى نماذج مدربة بشكل أفضل من خلال تقليل الضوضاء وتحسين قدرة النموذج على التعميم من بيانات التدريب.
Link to this sectionتحديد القيم المتطرفة#
القيم المتطرفة هي نقاط بيانات تنحرف قليلاً عن الملاحظات الأخرى في مجموعة البيانات. فيما يتعلق بالتصنيفات، يمكن أن تكون القيمة المتطرفة صورة مصنفة بشكل غير صحيح أو تصنيفاً لا يتناسب مع بقية مجموعة البيانات. القيم المتطرفة مقلقة لأنها يمكن أن تشوه عملية تعلم النموذج، مما يؤدي إلى تنبؤات غير دقيقة وضعف في التعميم.
يمكنك استخدام طرق مختلفة لاكتشاف القيم المتطرفة وتصحيحها:
- التقنيات الإحصائية: لاكتشاف القيم المتطرفة في الميزات الرقمية مثل قيم البكسل، أو إحداثيات صندوق التحديد، أو أحجام الكائنات، يمكنك استخدام طرق مثل مخططات الصندوق، أو الرسوم البيانية، أو درجات Z.
- التقنيات البصرية: لاكتشاف الشذوذ في الميزات الفئوية مثل فئات الكائنات، أو الألوان، أو الأشكال، استخدم أساليب بصرية مثل رسم الصور، أو التسميات، أو الخرائط الحرارية.
- الطرق الخوارزمية: استخدم أدوات مثل التجميع (مثل تجميع K-means، وDBSCAN) وخوارزميات اكتشاف الشذوذ لتحديد القيم المتطرفة بناءً على أنماط توزيع البيانات.
Link to this sectionمراقبة جودة البيانات المصنفة#
تماماً مثل المشاريع التقنية الأخرى، تعد مراقبة الجودة ضرورية للبيانات المصنفة. من الممارسات الجيدة التحقق بانتظام من التصنيفات للتأكد من دقتها واتساقها. يمكن القيام بذلك بعدة طرق مختلفة:
- مراجعة عينات من البيانات المصنفة
- استخدام أدوات آلية لاكتشاف الأخطاء الشائعة
- جعل شخص آخر يقوم بإعادة التحقق من التصنيفات
إذا كنت تعمل مع عدة أشخاص، فإن الاتساق بين المصنفين المختلفين مهم. الاتفاق الجيد بين المصنفين يعني أن الإرشادات واضحة وأن الجميع يتبعها بنفس الطريقة. إنها تحافظ على توافق الجميع وتجعل التصنيفات متسقة.
أثناء المراجعة، إذا وجدت أخطاء، قم بتصحيحها وتحديث الإرشادات لتجنب الأخطاء المستقبلية. قدم ملاحظات للمصنفين وقدم تدريباً منتظماً للمساعدة في تقليل الأخطاء. إن وجود عملية قوية للتعامل مع الأخطاء يبقي مجموعة بياناتك دقيقة وموثوقة.
Link to this sectionاستراتيجيات فعالة لتصنيف البيانات#
لجعل عملية تصنيف البيانات أكثر سلاسة وفعالية، فكر في تنفيذ هذه الاستراتيجيات:
- إرشادات تصنيف واضحة: قدم تعليمات مفصلة مع أمثلة لضمان أن جميع المصنفين يفسرون المهام بشكل متسق. على سبيل المثال، عند تصنيف الطيور، حدد ما إذا كنت تريد تضمين الطائر بأكمله أو أجزاء معينة فقط.
- فحوصات الجودة المنتظمة: حدد معايير واستخدم مقاييس محددة لمراجعة العمل، مع الحفاظ على معايير عالية من خلال التغذية الراجعة المستمرة.
- استخدام أدوات التصنيف المسبق: توفر العديد من منصات التصنيف الحديثة ميزات التصنيف المسبق المدعومة بالذكاء الاصطناعي والتي يمكنها تسريع العملية بشكل كبير من خلال إنشاء تصنيفات أولية تلقائياً يمكن للبشر تحسينها لاحقاً.
- تنفيذ التعلم النشط: يعطي هذا النهج الأولوية لتصنيف العينات الأكثر إفادة أولاً، مما قد يقلل من العدد الإجمالي للتصنيفات المطلوبة مع الحفاظ على أداء النموذج.
- المعالجة المجمعة: قم بتجميع الصور المتشابهة معاً للتصنيف للحفاظ على الاتساق وتحسين الكفاءة.
يمكن أن تساعد هذه الاستراتيجيات في الحفاظ على تصنيفات عالية الجودة مع تقليل الوقت والموارد المطلوبة لعملية التصنيف.
Link to this sectionشارك أفكارك مع المجتمع#
يمكن أن يساعد طرح أفكارك واستفساراتك على عشاق رؤية الحاسوب الآخرين في تسريع مشاريعك. إليك بعض الطرق الرائعة للتعلم، واستكشاف الأخطاء وإصلاحها، والتواصل:
Link to this sectionأين تجد المساعدة والدعم#
- GitHub Issues: قم بزيارة مستودع YOLO26 على GitHub واستخدم علامة تبويب المشكلات لطرح الأسئلة، والإبلاغ عن الأخطاء، واقتراح الميزات. المجتمع والقائمون على الصيانة موجودون للمساعدة في أي مشكلات تواجهها.
- خادم Ultralytics على Discord: انضم إلى خادم Ultralytics على Discord للتواصل مع مستخدمين ومطورين آخرين، والحصول على الدعم، ومشاركة المعرفة، وطرح الأفكار.
Link to this sectionالتوثيق الرسمي#
- توثيق Ultralytics YOLO26: ارجع إلى توثيق YOLO26 الرسمي للحصول على أدلة شاملة ورؤى قيمة حول العديد من مهام ومشاريع رؤية الحاسوب.
Link to this sectionالخلاصة#
يُعد جمع بيانات متنوعة وغير متحيزة وتصنيفها باستمرار باستخدام الأدوات المناسبة أساس نموذج رؤية حاسوبية موثوق. بمجرد جمع مجموعة البيانات وتصنيفها، تابع إلى دليل خطوات مشروع الرؤية الحاسوبية للانتقال إلى التدريب والتقييم.
Link to this sectionالأسئلة الشائعة#
Link to this sectionما هي أفضل طريقة لتجنب التحيز في جمع البيانات لمشاريع رؤية الحاسوب؟#
للحد من التحيز، اجمع البيانات من مصادر متنوعة، وتأكد من وجود تمثيل متوازن عبر جميع المجموعات ذات الصلة (مثل الأعمار والأجناس والأعراق المختلفة)، وراجع مجموعة البيانات وحدثها بانتظام لاكتشاف التحيزات الناشئة، وطبق تقنيات التخفيف مثل الإفراط في أخذ عينات من الفئات غير الممثلة بشكل كافٍ، وزيادة البيانات، والخوارزميات الواعية بالعدالة. يؤدي تجنب التحيز بهذه الطريقة إلى الحفاظ على أداء نموذج الرؤية الحاسوبية بشكل جيد عبر سيناريوهات متنوعة في العالم الحقيقي ويحسن قدرته على التعميم.
Link to this sectionكيف يمكنني ضمان اتساق ودقة عاليين في تصنيف البيانات؟#
ضع إرشادات تصنيف واضحة وموضوعية مع تعليمات مفصلة وأمثلة ورسوم توضيحية، ثم طبقها بشكل موحد عبر جميع أنواع البيانات بحيث تتبع كل عملية تصنيف نفس القواعد. درب المصنفين على البقاء محايدين لتقليل التحيز الشخصي، وراجع الإرشادات وحدثها بانتظام، واستخدم فحوصات الاتساق الآلية بالإضافة إلى ملاحظات المصنفين للحفاظ على دقة عالية ومتوافقة مع أهداف مشروعك.
Link to this sectionكم عدد الصور التي أحتاجها لتدريب نماذج Ultralytics YOLO؟#
بضع مئات من الكائنات المصنفة لكل فئة تكفي لبدء التجربة مع التعلم بنقل المعرفة، ولكن للحصول على أداء موثوق في العالم الحقيقي، توصي Ultralytics بـ ما لا يقل عن 1,500 صورة و10,000 مثيل مصنف لكل فئة. اجمع بين مجموعة بيانات كبيرة بما يكفي وجدول تدريب معقول — حوالي 300 حقبة (epoch) هو نقطة بداية شائعة، يتم تقليلها إذا بدأ النموذج في الإفراط في التخصيص (overfitting) مبكراً — واجعل تصنيفاتك صارمة ومتوافقة مع أهداف مشروعك المحددة. استكشف استراتيجيات التدريب المفصلة في دليل تدريب YOLO26.
Link to this sectionهل توفر Ultralytics أداة لتصنيف البيانات؟#
نعم. تتضمن Ultralytics Platform محرر تصنيف مدمج يدعم مربعات الإحاطة، والمضلعات، والنقاط الرئيسية، والمربعات الموجهة، وتصنيفات التصنيف في مساحة عمل واحدة. يعمل التصنيف الذكي المدعوم بـ SAM على تسريع عملية التصنيف لمهام الاكتشاف والتقسيم وOBB من خلال إنشاء أقنعة بنقرة واحدة، ويتم تخزين كل تصنيف بتنسيق YOLO، جاهزاً لـ التدريب.
Link to this sectionما هي أنواع تصنيف البيانات الشائعة الاستخدام في رؤية الحاسوب؟#
أنواع تصنيف البيانات الأكثر شيوعاً في الرؤية الحاسوبية هي مربعات الإحاطة، والمضلعات، والأقنعة، والنقاط الرئيسية، وكل منها مناسب لمهمة مختلفة:
- صناديق التحديد: تُستخدم بشكل أساسي لاكتشاف الكائنات، وهي مربعات مستطيلة حول الكائنات في الصورة.
- المضلعات: توفر مخططات كائنات أكثر دقة ومناسبة لمهام تقسيم المثيلات.
- الأقنعة: توفر تفاصيل على مستوى البكسل، وتُستخدم في التقسيم الدلالي لتمييز الكائنات عن الخلفية.
- النقاط الرئيسية: تحدد نقاط اهتمام محددة داخل الصورة، مفيدة لمهام مثل تقدير الوضع واكتشاف معالم الوجه.
يعتمد اختيار نوع التصنيف المناسب على متطلبات مشروعك. تعرف على المزيد حول كيفية تنفيذ هذه التصنيفات وتنسيقاتها في دليل تصنيف البيانات الخاص بنا.