Meet YOLO26: next-gen vision AI.

Link to this sectionكيفية تحديد الأهداف لمشروع الرؤية الحاسوبية الخاص بك#

لتحديد مشروع رؤية حاسوبية، اكتب بيان مشكلة يحدد القضية الجوهرية، والنطاق، وأصحاب المصلحة، والقيود؛ وضع أهدافاً قابلة للقياس ومحددة زمنياً؛ واربط المشكلة بمهمة الرؤية الحاسوبية التي تحدد قراراتك المتعلقة بالنموذج، ومجموعة البيانات، والنشر. يستعرض هذا الدليل كل خطوة مع مثال عملي.



Watch: How to define Computer Vision Project's Goal | Problem Statement and VisionAI Tasks Connection 🚀

للحصول على نظرة عامة على سير العمل الكامل بدءاً من جمع البيانات وصولاً إلى النشر، راجع دليلنا حول الخطوات الرئيسية في مشروع الرؤية الحاسوبية.

Link to this sectionكيفية كتابة بيان مشكلة الرؤية الحاسوبية#

بيان المشكلة الواضح هو الخطوة الكبيرة الأولى نحو إيجاد الحل الأكثر فعالية. وهو يتكون من أربعة أجزاء:

  • تحديد المشكلة الأساسية: حدد بدقة التحدي الذي يهدف مشروع الرؤية الحاسوبية الخاص بك إلى حله.
  • تحديد النطاق: حدد حدود مشكلتك.
  • مراعاة المستخدمين النهائيين وأصحاب المصلحة: حدد من سيتأثر بالحل.
  • تحليل متطلبات وقيود المشروع: قم بتقييم الموارد المتاحة (الوقت، الميزانية، الموظفون) وحدد أي قيود تقنية أو تنظيمية.

Link to this sectionمثال على بيان مشكلة تجارية#

ضع في اعتبارك مشروع رؤية حاسوبية حيث تريد تقدير سرعة المركبات على طريق سريع. المشكلة الأساسية هي أن طرق مراقبة السرعة الحالية غير فعالة وعرضة للأخطاء بسبب أنظمة الرادار القديمة والعمليات اليدوية. يهدف المشروع إلى تطوير نظام رؤية حاسوبية في الوقت الفعلي يمكنه استبدال أنظمة تقدير السرعة القديمة.

Vehicle speed estimation on a highway using Ultralytics YOLO

يشمل المستخدمون الأساسيون سلطات إدارة المرور وجهات إنفاذ القانون، بينما يشمل أصحاب المصلحة الثانويون مخططي الطرق السريعة والجمهور الذي يستفيد من طرق أكثر أماناً. تتضمن المتطلبات الرئيسية تقييم الميزانية والوقت والموظفين، بالإضافة إلى تلبية الاحتياجات التقنية مثل الكاميرات عالية الدقة ومعالجة البيانات في الوقت الفعلي. بالإضافة إلى ذلك، يجب مراعاة القيود التنظيمية المتعلقة بالخصوصية وأمن البيانات.

Link to this sectionوضع أهداف قابلة للقياس#

يعد وضع أهداف قابلة للقياس مفتاحاً لنجاح مشروع الرؤية الحاسوبية. تتبع الأهداف الفعالة معايير SMART:

المعيارما يعنيه
محدد (Specific)حدد أهدافاً واضحة ومفصلة.
قابل للقياس (Measurable)تأكد من أن الأهداف يمكن قياسها كمياً.
قابل للتحقيق (Achievable)ضع أهدافاً واقعية ضمن إمكانياتك.
ذو صلة (Relevant)قم بمواءمة الأهداف مع أهداف مشروعك العامة.
محدد زمنياً (Time-bound)حدد مواعيد نهائية لكل هدف.

بالنسبة لمثال تقدير سرعة الطرق السريعة، يمكن أن تكون أهداف SMART كالتالي:

  • تحقيق دقة لا تقل عن 95% في اكتشاف السرعة في غضون ستة أشهر، باستخدام مجموعة بيانات مكونة من 10,000 صورة للمركبات.
  • يجب أن يكون النظام قادراً على معالجة خلاصات الفيديو في الوقت الفعلي بمعدل 30 إطاراً في الثانية مع الحد الأدنى من التأخير.

من خلال تحديد أهداف محددة وقابلة للقياس الكمي، يمكنك تتبع التقدم بفعالية، وتحديد مجالات التحسين، وضمان بقاء المشروع على المسار الصحيح.

Link to this sectionكيفية اختيار مهمة الرؤية الحاسوبية المناسبة#

يساعدك بيان المشكلة في تصور أي مهمة رؤية حاسوبية يمكنها حل مشكلتك. تشمل المهام الأكثر شيوعاً تصنيف الصور، واكتشاف الأشياء، وتجزئة الصور - راجع صفحة مهام Ultralytics للحصول على مقارنة مفصلة.

Comparison of image classification, object detection, and image segmentation outputs

على سبيل المثال، إذا كانت مشكلتك هي مراقبة سرعات المركبات على طريق سريع، فإن المهمة ذات الصلة هي تتبع الأشياء. التتبع مناسب لأنه يتابع كل مركبة عبر إطارات الفيديو باستخدام معرف دائم، وهو ما يتطلبه حساب السرعة.

YOLO object tracking of vehicles on a highway with persistent track IDs

المهام الأخرى أقل ملاءمة بمفردها. على سبيل المثال، يقوم اكتشاف الأشياء بتحديد موقع المركبات في كل إطار ولكنه لا يحافظ على هوية كل مركبة عبر الإطارات - وبدون هذه الهوية، لا يمكن للنظام قياس الحركة بمرور الوقت. بمجرد تحديد مهمة الرؤية الحاسوبية المناسبة، فإنها توجه العديد من الجوانب الحاسمة في مشروعك، مثل اختيار النموذج، وإعداد مجموعة البيانات، وأساليب تدريب النموذج.

Link to this sectionما الذي يأتي أولاً: النموذج، أم البيانات، أم أسلوب التدريب؟#

يعتمد ترتيب اختيار النموذج، وإعداد مجموعة البيانات، وأسلوب التدريب على تفاصيل مشروعك:

موقفكابدأ بـمثال
مشكلة وأهداف محددة بوضوحاختيار النموذجبالنسبة لنظام مراقبة المرور الذي يقدر سرعات المركبات، اختر نموذج تتبع أشياء، واجمع فيديوهات الطرق السريعة وقم بتعليقها (annotate)، ثم تدرب باستخدام تقنيات لمعالجة الفيديو في الوقت الفعلي.
بيانات فريدة أو محدودةإعداد مجموعة البياناتبالنسبة لنظام التعرف على الوجوه بمجموعة بيانات صغيرة، قم بتعليق البيانات أولاً، ثم اختر نموذجاً يعمل بشكل جيد مع البيانات المحدودة - مثل نموذج مدرب مسبقاً لـ التعلم بنقل المعرفة - وخطط لـ تعزيز البيانات لتوسيع مجموعة البيانات.
التجريب أمر حاسم (بحث)أسلوب التدريبفي مشروع يستكشف طرقاً جديدة لاكتشاف عيوب التصنيع، جرب على مجموعة فرعية صغيرة من البيانات أولاً. بمجرد العثور على تقنية واعدة، اختر نموذجاً مصمماً خصيصاً لهذه النتائج وقم بإعداد مجموعة بيانات شاملة.

إذا بدأت بالبيانات، فإن منصة Ultralytics تبسط تنظيم مجموعة البيانات، والتعليق عليها، والتدريب مع تطور مشروعك.

Link to this sectionكيف تؤثر خيارات النشر على مشروعك#

تؤثر خيارات نشر النموذج بشكل حاسم على أداء مشروع الرؤية الحاسوبية الخاص بك، لذا ضعها في الاعتبار منذ البداية. يجب أن تتعامل بيئة النشر مع الحمل الحسابي لنموذجك:

خيار النشرالأفضل لـتقنيات مثال
أجهزة الحافة (Edge devices)الهواتف الذكية وأجهزة IoT ذات الموارد الحسابية المحدودة؛ نماذج خفيفة الوزنTensorFlow Lite، ONNX Runtime
خوادم السحابةنماذج معقدة ذات متطلبات حسابية أكبر؛ أجهزة تتوسع مع المشروعAWS، Google Cloud، Azure
خوادم داخلية (On-premise)احتياجات عالية لـ خصوصية البيانات والأمان؛ تحكم كامل في البيانات والبنية التحتيةخوادم GPU مدارة ذاتياً
حلول هجينةموازنة الأداء مع التكلفة وزمن الاستجابة؛ معالجة الحافة بالإضافة إلى تحليل السحابةمزيج من بيئات تشغيل الحافة ومنصات السحابة

يقدم كل خيار مزايا وتحديات مختلفة، ويعتمد الاختيار على متطلبات المشروع المحددة مثل الأداء، والتكلفة، والأمان.

Link to this sectionالخلاصة#

يبدأ مشروع الرؤية الحاسوبية الناجح ببيان مشكلة واضح، وأهداف SMART قابلة للقياس، ومهمة الرؤية الحاسوبية المناسبة للمهمة - هذه القرارات توجه كل ما يلي، من اختيار النموذج إلى النشر. كخطوة تالية، تعلم كيفية جمع البيانات وتعليقها، أو ناقش مشروعك مع مطورين آخرين على GitHub وخادم Discord الخاص بـ Ultralytics.

Link to this sectionالأسئلة الشائعة#

Link to this sectionكيف أحدد بيان مشكلة واضح لمشروع الرؤية الحاسوبية الخاص بي؟#

يحدد بيان المشكلة الواضح القضية الجوهرية التي يحلها مشروعك، ونطاقه، والمستخدمين النهائيين وأصحاب المصلحة، ومواردك وقيودك التنظيمية. اعمل على تلك الأجزاء الأربعة بالترتيب، ثم تحقق من صحة البيان مع أصحاب المصلحة قبل اتخاذ القرارات الفنية. راجع كيفية كتابة بيان مشكلة الرؤية الحاسوبية للحصول على التفصيل الكامل ومثال عملي.

Link to this sectionكيف أختار مهمة الرؤية الحاسوبية المناسبة لمشكلتي؟#

طابق المخرجات التي تحتاجها مشكلتك مع المهمة التي تنتجها: تصنيف واحد لكل صورة يشير إلى تصنيف الصور، ومواقع الأشياء تشير إلى اكتشاف الأشياء، وحدود مستوى البكسل تشير إلى تجزئة الصور، والحفاظ على الهويات عبر إطارات الفيديو يشير إلى تتبع الأشياء. مراقبة سرعات المركبات، على سبيل المثال، تتطلب التتبع لأن السرعة يتم حسابها من حركة كل مركبة بمرور الوقت. راجع صفحة مهام Ultralytics للحصول على جميع المهام المدعومة.

Link to this sectionكيف أضع أهدافاً فعالة قابلة للقياس لمشروع الرؤية الحاسوبية الخاص بي؟#

استخدم معايير SMART: محدد (Specific)، قابل للقياس (Measurable)، قابل للتحقيق (Achievable)، ذو صلة (Relevant)، ومحدد زمنياً (Time-bound). على سبيل المثال، "تحقيق دقة 95% في اكتشاف السرعة خلال ستة أشهر باستخدام مجموعة بيانات مكونة من 10,000 صورة للمركبات." يساعد هذا النهج في تتبع التقدم وتحديد مجالات التحسين. اقرأ المزيد حول وضع أهداف قابلة للقياس.

Link to this sectionهل يمكن للنموذج المدرب مسبقاً تذكر الفئات التي عرفها قبل التدريب المخصص؟#

لا، النماذج المدربة مسبقاً لا "تتذكر" الفئات بالمعنى التقليدي. فهي تتعلم الأنماط من مجموعات بيانات ضخمة، وأثناء التدريب المخصص (الضبط الدقيق)، يتم تعديل هذه الأنماط لمهمتك المحددة. قدرة النموذج محدودة، والتركيز على معلومات جديدة يمكن أن يكتب فوق بعض التعلم السابق.

Overview of transfer learning from a pretrained model to a custom model

إذا كنت ترغب في استخدام الفئات التي تم تدريب النموذج مسبقاً عليها، فإن النهج العملي هو استخدام نموذجين: أحدهما يحتفظ بالأداء الأصلي، والآخر يتم ضبطه بدقة لمهمتك المحددة. بهذه الطريقة، يمكنك دمج مخرجات كلا النموذجين. هناك خيارات أخرى مثل تجميد الطبقات، واستخدام النموذج المدرب مسبقاً كمستخرج للميزات، والتفرع الخاص بالمهمة، لكن هذه حلول أكثر تعقيداً وتتطلب خبرة أكبر.

Link to this sectionكيف تؤثر خيارات النشر على مشروع الرؤية الحاسوبية الخاص بي؟#

تحدد خيارات النشر أحجام وتنسيقات النماذج القابلة للتطبيق، لذا فهي تشكل مشروعك منذ البداية. تحتاج أجهزة الحافة إلى نماذج خفيفة الوزن يتم تقديمها من خلال تنسيقات وبيئات تشغيل مثل TensorFlow Lite أو ONNX Runtime، وتتعامل خوادم السحابة مع النماذج المعقدة على أجهزة قابلة للتوسع، وتمنح الخوادم الداخلية تحكماً كاملاً في البيانات للمشاريع الحساسة للخصوصية، وتوازن الإعدادات الهجينة بين الاثنين. قارن بينها في جدول خيارات النشر، أو راجع دليل خيارات نشر النموذج للحصول على التفاصيل.

Link to this sectionما هي التحديات الأكثر شيوعاً في تحديد مشكلة الرؤية الحاسوبية؟#

تشمل التحديات الشائعة ما يلي:

  • بيانات مشكلة غامضة أو واسعة النطاق بشكل مفرط.
  • أهداف غير واقعية.
  • نقص مواءمة أصحاب المصلحة.
  • فهم غير كافٍ للقيود التقنية.
  • التقليل من شأن متطلبات البيانات.

عالج هذه التحديات من خلال بحث أولي شامل، وتواصل واضح مع أصحاب المصلحة، وتحسين متكرر لبيان المشكلة والأهداف. للحصول على سير عمل المشروع بالكامل، راجع الخطوات الرئيسية في مشروع الرؤية الحاسوبية.

التعليقات