Link to this sectionDAMO-YOLO مقابل YOLOv9#
يستمر مشهد الكشف عن الأشياء في الوقت الفعلي في التطور بوتيرة متسارعة. وبينما يسعى الفرق الهندسية والباحثون لتحقيق التوازن المثالي بين الدقة وسرعة الاستدلال والكفاءة الحسابية، ظهرت بنيتان بارزتان من المجتمع البحثي: DAMO-YOLO وYOLOv9. يقدم كلا النموذجين ابتكارات معمارية كبيرة تهدف إلى دفع حدود ما هو ممكن في الرؤية الحاسوبية.
يقدم هذا الدليل التقني المفصل تحليلاً معمقاً لهذين النموذجين، مع مقارنة مناهجهما المعمارية الفريدة ومنهجيات التدريب وقدرات النشر في العالم الحقيقي. سنستكشف أيضاً كيف يلعب النظام البرمجي الأوسع دوراً حاسماً في تطوير الذكاء الاصطناعي الحديث، مع تسليط الضوء على مزايا المنصات المتكاملة مثل Ultralytics Platform والجيل الأحدث من النماذج مثل YOLO26.
Link to this sectionملخص تنفيذي: اختيار البنية الصحيحة#
على الرغم من أن كلا النموذجين يمثلان علامات فارقة في أبحاث التعلم العميق، إلا أنهما يلبيان فلسفات نشر مختلفة قليلاً.
يتفوق DAMO-YOLO في البيئات التي يمكن فيها استخدام البحث عن البنية العصبية (NAS) لاستخلاص ملفات تعريف أداء محددة، مما يجعله دراسة مثيرة للاهتمام للنشر المخصص على الحافة. في المقابل، يركز YOLOv9 بشكل كبير على حل اختناقات المعلومات في التعلم العميق، مما يوفر كفاءة استثنائية في المعاملات.
ومع ذلك، بالنسبة للنشر الجاهز للإنتاج، توصي الفرق الهندسية باستمرار بالاستفادة من Ultralytics ecosystem الموحد. بالنسبة للمشاريع الجديدة، يوفر أحدث نموذج YOLO26 أفضل ما في العالمين: دقة متطورة مدمجة مع تصميم أصلي شامل يلغي الحاجة إلى معالجة لاحقة معقدة.
على الرغم من أن DAMO-YOLO وYOLOv9 هما نموذجان أكاديميان قويان، إلا أن نشرهما في الإنتاج غالباً ما يتطلب هندسة مخصصة كبيرة. يوفر استخدام Ultralytics YOLO26 إمكانية الوصول إلى أداء متطور مع API انسيابي وقابل للصيانة.
Link to this sectionالمواصفات الفنية والتأليف#
يوفر فهم أصول وتركيز تطوير هذه النماذج سياقاً أساسياً لنقاط قوتها الخاصة.
Link to this sectionDAMO-YOLO#
تم تطوير DAMO-YOLO بواسطة باحثين في مجموعة Alibaba، ويركز بشكل كبير على توليد البنية المؤتمتة ودمج الميزات بكفاءة.
- المؤلفون: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, و Xiuyu Sun
- المؤسسة: Alibaba Group
- تاريخ الإصدار: 23 نوفمبر 2022
- ورقة بحثية على Arxiv: DAMO-YOLO Research Paper
- GitHub الرسمي: tinyvision/DAMO-YOLO Repository
- التوثيق: DAMO-YOLO README
Link to this sectionYOLOv9#
تم تقديمه كحل لفقدان المعلومات في الشبكات التلافيفية العميقة، ويدفع YOLOv9 الحدود النظرية للحفاظ على التدرج أثناء التدريب.
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
- تاريخ الإصدار: 21 فبراير 2024
- ورقة بحثية على Arxiv: YOLOv9 Research Paper
- GitHub الرسمي: WongKinYiu/yolov9 Repository
- التوثيق: YOLOv9 Ultralytics Docs
Link to this sectionالابتكارات المعمارية#
Link to this sectionDAMO-YOLO: مدفوع بالبحث عن البنية العصبية#
يميز DAMO-YOLO نفسه من خلال مكونات مخصصة للغاية تم إنشاؤها بواسطة الآلة. يتم إنشاء بنيته الأساسية باستخدام البحث عن البنية العصبية (NAS)، والذي يستهدف بشكل خاص الاستدلال بزمن انتقال منخفض على أجهزة متنوعة.
تتميز البنية بـ RepGFPN فعال (شبكة هرمية ميزات عامة معاد تحديد معلماتها) لدمج الميزات، مما يعزز اكتشاف الأشياء متعدد المقاييس دون زيادة العبء الحسابي بشكل مفرط. علاوة على ذلك، فإنه يستخدم تصميم ZeroHead لتبسيط رأس الكشف ويستخدم AlignedOTA لتخصيص التسميات، مقترناً بعملية تعزيز تقطير متطورة أثناء التدريب. في حين أن هذه التقنيات تؤدي إلى استدلال سريع، فإن عملية التقطير متعددة المراحل تتطلب غالباً VRAM كبيرة وأوقات تدريب ممتدة.
Link to this sectionYOLOv9: حل اختناق المعلومات#
يعالج YOLOv9 مشكلة أساسية في الشبكات العميقة: الفقد التدريجي لمعلومات بيانات الإدخال أثناء مرورها عبر طبقات متتالية.
ولمكافحة ذلك، قدم المؤلفون Programmable Gradient Information (PGI)، وهو إطار عمل إشرافي مساعد مصمم للاحتفاظ بالتفاصيل الحيوية للطبقات العميقة، مما يولد تدرجات موثوقة للغاية لتحديثات الأوزان. يرافق PGI بنية GELAN (Generalized Efficient Layer Aggregation Network). يعمل GELAN على تحسين كفاءة المعاملات من خلال الجمع بين نقاط قوة CSPNet وELAN، مما يزيد من تدفق المعلومات مع تقليل عمليات الفاصلة العائمة (FLOPs) بصرامة.
Link to this sectionتحليل الأداء والمقاييس#
عند تقييم الأداء، يظهر كلا النموذجين متوسط دقة متوسط (mAP) قوياً في المعايير القياسية مثل COCO. يحقق YOLOv9 دقة مطلقة أعلى عبر أحجام النماذج المتكافئة، مستفيداً من بنية PGI الخاصة به للحفاظ على دقة عالية في مجموعات البيانات الصعبة.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
كما هو موضح أعلاه، يحقق YOLOv9-E أعلى دقة، بينما تحافظ متغيرات DAMO-YOLO وYOLOv9 الأصغر على سرعات استدلال تنافسية للغاية عبر TensorRT optimizations.
Link to this sectionمنهجيات التدريب والنظام البيئي#
في حين أن البنية الخام مهمة، فإن سهولة الاستخدام وكفاءة التدريب اللتين يمليهما النظام البيئي للنموذج أمران بالغا الأهمية للتطبيق في العالم الحقيقي.
غالباً ما يتطلب اعتماد DAMO-YOLO على تقطير المعرفة تدريب نموذج "معلم" مرهق قبل نقل المعرفة إلى نموذج "طالب" مستهدف. يزيد هذا النهج البحثي التقليدي بشكل كبير من متطلبات الذاكرة وأوقات دورة التدريب. وبالمثل، يتطلب مستودع YOLOv9 الأصلي التنقل في ملفات تكوين معقدة يمكن أن تبطئ التطوير السريع.
في المقابل، فإن دمج النماذج في Ultralytics Platform يغير تجربة المطور تماماً. تعمل حزمة Python الخاصة بـ Ultralytics على تجريد التعليمات البرمجية القياسية، مما يسمح للفرق بمعالجة زيادة البيانات وضبط المعلمات الفائقة وتصدير النموذج بسهولة.
Link to this sectionتطبيقات وحالات استخدام في العالم الحقيقي#
تتفوق البنى المختلفة بشكل طبيعي في صناعات معينة بناءً على متطلبات مواردها وملفات تعريف الدقة الخاصة بها.
- DAMO-YOLO في الذكاء الاصطناعي للحافة: نظراً لبنيتها الأساسية المحسنة بواسطة NAS، يتم استكشاف DAMO-YOLO بشكل متكرر في الأنظمة المضمنة حيث تعد إعادة تحديد المعلمات الخاصة بالأجهزة ضرورة صارمة، مثل نشر ASIC المخصص في manufacturing quality control الأساسي.
- YOLOv9 في التحليلات الدقيقة: بفضل كفاءتها العالية في المعاملات والاحتفاظ بالتدرج المدفوع بـ PGI، يعد YOLOv9 ممتازاً لسيناريوهات الكشف عن الأشياء الكثيفة، مثل analyzing aerial imagery أو تتبع الأشياء الصغيرة في بيئات البيع بالتجزئة المزدحمة.
Link to this sectionحالات الاستخدام والتوصيات#
يعتمد الاختيار بين DAMO-YOLO وYOLOv9 على متطلبات مشروعك المحددة وقيود النشر وتفضيلات النظام البيئي.
Link to this sectionمتى تختار DAMO-YOLO#
يعد DAMO-YOLO خياراً قوياً لما يلي:
- تحليلات الفيديو ذات الإنتاجية العالية: معالجة تدفقات الفيديو ذات معدل الإطارات العالي على بنية تحتية ثابتة لوحدات GPU من NVIDIA حيث يكون إنتاجية الدفعة-1 هو المقياس الأساسي.
- خطوط التصنيع الصناعية: السيناريوهات ذات قيود زمن انتقال GPU صارمة على أجهزة مخصصة، مثل فحص الجودة في الوقت الفعلي على خطوط التجميع.
- أبحاث البحث في البنية العصبية: دراسة تأثيرات البحث الآلي في البنية (MAE-NAS) والهياكل الأساسية المعاد برمجتها بكفاءة على أداء الاكتشاف.
Link to this sectionمتى تختار YOLOv9#
يوصى بـ YOLOv9 لـ:
- أبحاث اختناق المعلومات: المشاريع الأكاديمية التي تدرس معمارية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
- دراسات تحسين تدفق التدرج: الأبحاث التي تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
- قياس أداء الكشف عالي الدقة: السيناريوهات التي تكون فيها أداء معيار COCO القوي لـ YOLOv9 مطلوباً كنقطة مرجعية للمقارنات المعمارية.
Link to this sectionمتى تختار Ultralytics (YOLO26)#
بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
- بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
Link to this sectionميزة Ultralytics: التقدم نحو YOLO26#
بالنسبة للمستخدمين الذين يقارنون البنى القديمة، فإن الانتقال إلى نظام Ultralytics البيئي الحديث—وتحديداً latest YOLO26 models—يوفر ميزة لا تضاهى.
يغير YOLO26 مشهد النشر بشكل أساسي من خلال End-to-End NMS-Free Design. من خلال القضاء تماماً على المعالجة اللاحقة لـ Non-Maximum Suppression (NMS)، فإنه يقدم بنيات نشر أسرع وأبسط بشكل كبير. إلى جانب إزالة Distribution Focal Loss (DFL)، يوفر YOLO26 توافقاً فائقاً للحافة والأجهزة منخفضة الطاقة.
علاوة على ذلك، يدمج YOLO26 مُحسِّن MuSGD الثوري، وهو مزيج من Stochastic Gradient Descent وتحسينات Muon المستوحاة من ابتكارات تدريب LLM. ينتج عن هذا تقارب تدريب مستقر للغاية مع الحفاظ على استخدام منخفض للذاكرة بشكل ملحوظ مقارنة بالبدائل الثقيلة التي تعتمد على المحولات.
بفضل واجهة برمجة تطبيقات Ultralytics البديهية، يمكنك تدريب نموذج YOLO26 متطور مع تتبع مدمج للتجارب في بضعة أسطر فقط من Python.
from ultralytics import YOLO
# Load the latest NMS-free YOLO26 model
model = YOLO("yolo26n.pt")
# Train on your custom dataset efficiently
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to ONNX format
model.export(format="onnx")سواء كنت بحاجة إلى instance segmentation متقدم، أو pose estimation دقيق للغاية، أو الكشف القياسي عن مربع الإحاطة، فإن تعدد استخدامات إطار عمل Ultralytics يضمن أن يقضي فريقك وقتاً أقل في تكوين بيئات التعلم العميق ووقتاً أطول في نشر حلول الذكاء الاصطناعي القوية. مع تحسينات المهام المتخصصة مثل ProgLoss + STAL للتعرف المعزز على الأشياء الصغيرة، يقف YOLO26 كخيار أول للجيل القادم من تطبيقات الرؤية.