Link to this sectionYOLO26 مقابل YOLOv9: التطور التالي في اكتشاف الكائنات في الوقت الفعلي#
يتقدم مشهد الرؤية الحاسوبية بسرعة، حيث تدفع البنى الجديدة باستمرار حدود السرعة والدقة. في هذه المقارنة التقنية، ندرس الاختلافات بين YOLO26 و YOLOv9، وهما نموذجان مؤثران للغاية في مجال اكتشاف الكائنات في الوقت الفعلي. بينما يقدم كلا النموذجين ابتكارات معمارية متميزة، فإن فهم مقايضات الأداء الخاصة بهما، وقدرات النشر، ومتطلبات الأجهزة أمر بالغ الأهمية لاختيار الأداة المناسبة لمشروع الرؤية القادم الخاص بك.
Link to this sectionYOLO26: القوة المحسّنة للحافة#
تم إصدار Ultralytics YOLO26 في أوائل عام 2026، وهو يمثل قفزة جيلية في كفاءة النشر واستقرار تدريب النماذج. صُمم ليكون إطار عمل شاملاً (end-to-end) بشكل أصلي، وهو يعالج مباشرةً عنق الزجاجة في النشر الذي لطالما أثر على تطبيقات الذكاء الاصطناعي على الحافة (edge AI).
تفاصيل النموذج:
- المؤلفون: Glenn Jocher و Jing Qiu
- المنظمة: Ultralytics
- التاريخ: 2026-01-14
- GitHub: مستودع Ultralytics
- التوثيق: توثيق YOLO26
Link to this sectionالبنية والابتكارات#
يعيد YOLO26 تصميم خط معالجة ما بعد المعالجة (post-processing) بشكل جذري من خلال تقديم تصميم نهائي بدون NMS. من خلال إلغاء الحاجة إلى خوارزمية كبت غير الأقصى (NMS)، يحقق النموذج تبايناً أقل بكثير في زمن الانتقال. وهذا يجعل النشر على منصات الهاتف المحمول والحافة أسهل بكثير، خاصة عند التصدير إلى إطارات عمل مثل ONNX و Apple CoreML.
بالإضافة إلى ذلك، فإن إزالة Distribution Focal Loss (DFL) تبسط عملية التصدير وتعزز التوافق مع وحدات التحكم الدقيقة منخفضة الطاقة. لتحسين استقرار التدريب، يدمج YOLO26 المحسّن الجديد MuSGD Optimizer، وهو هجين بين Stochastic Gradient Descent (SGD) و Muon (المستوحى من الابتكارات في تدريب نماذج اللغات الكبيرة). يؤدي هذا إلى تقارب أسرع واستخراج ميزات أكثر قوة عبر مجموعات البيانات الصعبة.
بفضل التبسيطات المعمارية وإزالة DFL، يحقق YOLO26 استدلالاً على وحدة المعالجة المركزية (CPU) أسرع بنسبة تصل إلى 43%، مما يجعله الخيار الأمثل لأجهزة الحافة المحدودة الموارد مثل Raspberry Pi أو NVIDIA Jetson Nano.
لاكتشاف العناصر شديدة التحدي في مشاهد مثل صور الطائرات بدون طيار الجوية، يستخدم YOLO26 وظائف الخسارة المحدثة ProgLoss + STAL. توفر هذه الوظائف تحسينات ملحوظة في استدعاء التعرف على الكائنات الصغيرة. علاوة على ذلك، فهو يتميز بتحسينات خاصة بالمهمة، بما في ذلك multi-scale proto لـ تجزئة المثيلات، و Residual Log-Likelihood Estimation (RLE) لـ تقدير الوضع، وخسارة زاوية متخصصة لاكتشاف صناديق التحديد الموجهة (OBB).
Link to this sectionYOLOv9: معلومات التدرج القابلة للبرمجة#
تم تقديم YOLOv9 في أوائل عام 2024، وقد جلب تطورات نظرية للطريقة التي تتعامل بها الشبكات العصبية مع تدفق التدرج أثناء مرحلة التدريب، مع التركيز على كفاءة المعلمات والاحتفاظ بالميزات العميقة.
تفاصيل النموذج:
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المنظمة: معهد علوم المعلومات، أكاديمية سينيكا، تايوان
- التاريخ: 21-02-2024
- Arxiv: ورقة بحث YOLOv9
- GitHub: مستودع YOLOv9
- التوثيق: توثيق YOLOv9
Link to this sectionالمعمارية ونقاط القوة#
بُني YOLOv9 حول مفهوم معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN). تعالج هذه المفاهيم مشكلة اختناق المعلومات التي تلاحظ غالباً في الشبكات العصبية العميقة. من خلال الحفاظ على المعلومات الأساسية خلال عملية التغذية الأمامية، تضمن GELAN أن التدرجات المستخدمة لتحديثات الوزن تظل موثوقة. توفر هذه البنية دقة عالية وتجعل YOLOv9 مرشحاً قوياً للبحث الأكاديمي في نظرية الشبكات العصبية وتحسين مسار التدرج باستخدام إطار عمل PyTorch.
Link to this sectionالقيود#
على الرغم من كفاءة معاملاته الممتازة، يعتمد YOLOv9 بشكل كبير على NMS التقليدي لمعالجة صناديق التحديد، مما قد يخلق اختناقات حسابية أثناء الاستدلال على أجهزة الحافة. علاوة على ذلك، يركز المستودع الرسمي بشكل كبير على اكتشاف الكائنات، مما يتطلب هندسة مخصصة كبيرة لتكييفه مع المهام المتخصصة مثل التتبع أو تقدير الوضع.
Link to this sectionمقارنة الأداء#
عند تقييم هذه النماذج للنشر في العالم الحقيقي، يعد الموازنة بين الدقة (mAP)، وسرعة الاستدلال، واستخدام الذاكرة أمراً بالغ الأهمية. تشتهر نماذج Ultralytics بمتطلبات الذاكرة المنخفضة أثناء التدريب والاستدلال، مما يتطلب ذاكرة CUDA memory أقل بكثير من البدائل القائمة على المحولات (transformer) مثل RT-DETR.
فيما يلي مقارنة مباشرة لأداء YOLO26 و YOLOv9 على مجموعة بيانات COCO. يتم تمييز أفضل القيم في كل عمود بـ الخط العريض.
| النموذج | الحجم (بكسل) | mAPval 50-95 | السرعة CPU ONNX (ms) | السرعة T4 TensorRT10 (ms) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
ملاحظة: تم حذف سرعات وحدة المعالجة المركزية (CPU) لـ YOLOv9 لأنها تختلف كثيراً بناءً على تكوين NMS وهي بشكل عام أبطأ من تنفيذ YOLO26 الأصلي الخالي من NMS.
Link to this sectionحالات الاستخدام والتوصيات#
يعتمد الاختيار بين YOLO26 و YOLOv9 على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.
Link to this sectionمتى تختار YOLO26#
YOLO26 هو خيار قوي لـ:
- نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
- بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
- اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.
Link to this sectionمتى تختار YOLOv9#
يوصى بـ YOLOv9 لـ:
- أبحاث اختناق المعلومات: المشاريع الأكاديمية التي تدرس معمارية معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
- دراسات تحسين تدفق التدرج: الأبحاث التي تركز على فهم وتخفيف فقدان المعلومات في طبقات الشبكة العميقة أثناء التدريب.
- قياس أداء الكشف عالي الدقة: السيناريوهات التي تكون فيها أداء معيار COCO القوي لـ YOLOv9 مطلوباً كنقطة مرجعية للمقارنات المعمارية.
Link to this sectionميزة Ultralytics#
يتضمن اختيار النموذج أكثر من مجرد قراءة معيار الدقة؛ يحدد نظام برمجيات النظام المحيط مدى السرعة التي يمكنك الانتقال بها من جمع البيانات إلى الإنتاج.
Link to this sectionسهولة الاستخدام والنظام البيئي#
يوفر واجهة برمجة تطبيقات Ultralytics Python تجربة سلسة "من الصفر إلى الاحتراف". بدلاً من استنساخ المستودعات المعقدة أو تكوين نصوص التدريب الموزعة يدوياً، يمكن للمطورين تثبيت الحزمة عبر pip وبدء التدريب فوراً. يضمن نظام Ultralytics البيئي المدار بنشاط تحديثات متكررة، وتكاملات آلية مع منصات تعلم الآلة مثل Weights & Biases، ووثائق شاملة.
Link to this sectionتعدد الاستخدامات عبر مهام الرؤية#
بينما يعد YOLOv9 محرك اكتشاف في المقام الأول، فإن YOLO26 هو أداة رؤية للأغراض العامة. باستخدام بناء جملة موحد واحد، يمكنك بسهولة الانتقال من اكتشاف الكائنات إلى تجزئة الصور بدقة البكسل أو تصنيف الصورة بالكامل. يقلل تعدد الاستخدامات هذا من الديون التقنية الناتجة عن صيانة قواعد بيانات كود متعددة ومنفصلة لميزات الرؤية الحاسوبية المختلفة.
Link to this sectionالتدريب والنشر الفعال#
تعد كفاءة التدريب حجر الزاوية في فلسفة Ultralytics. يستخدم YOLO26 أوزاناً مدربة مسبقاً ومتاحة بسهولة ويفتخر باستهلاك ذاكرة أقل بكثير مقارنة بمحولات الرؤية الضخمة. بمجرد التدريب، تسمح خطوط أنابيب التصدير المدمجة بإجراء تحويلات بنقرة واحدة إلى تنسيقات محسّنة مثل TensorRT أو TensorFlow Lite، مما يمهد الطريق للإنتاج.
Link to this sectionمثال على الكود: البدء مع YOLO26#
تنفيذ YOLO26 واضح ومباشر بشكل ملحوظ. يوضح مقتطف Python التالي كيفية تحميل نموذج مدرب مسبقاً، وتدريبه على بيانات مخصصة، وتشغيل الاستدلال باستخدام واجهة برمجة تطبيقات Ultralytics.
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Uses GPU 0, or use 'cpu' for CPU training
)
# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the bounding boxes and confidences
predictions[0].show()من خلال الاستفادة من السرعة والبنية المبسطة والنظام البيئي القوي لـ YOLO26، يمكن للفرق طرح تطبيقات رؤية الذكاء الاصطناعي المتقدمة في السوق بشكل أسرع وبعقبات تقنية أقل من أي وقت مضى.