YOLO26 مقابل YOLOv9: التطور التالي في اكتشاف الكائنات في الوقت الفعلي
تطورت بنى الكشف عن الأجسام بفضل السعي المستمر لتحقيق السرعة والدقة والكفاءة. مقارنة بين YOLO26 و YOLOv9 يبرز هذا التقدم السريع. في حين أن YOLOv9 حدود الاحتفاظ بالمعلومات مع التدرجات القابلة للبرمجة، فإن YOLO26 الأحدث يعيد تعريف المشهد بهيكلية شاملة NMS ومُحسّنة خصيصًا لأداء الحافة CPU بشكل كبير.
نظرة عامة على النموذج
YOLO26
يمثل YOLO26 أحدث ما توصلت إليه تقنية الذكاء الاصطناعي في مجال الرؤية في أوائل عام 2026. تم تطويره بواسطة Ultralytics، ويقدم تصميمًا أصليًا شاملاً يلغي الحاجة إلى Non-Maximum Suppression (NMS)، مما يبسط عمليات النشر. من خلال إزالة Distribution Focal Loss (DFL) ودمج مُحسِّن MuSGDالجديد — وهو مزيج من SGD Muon مستوحى من تدريب LLM — يحقق YOLO26 CPU أسرع بنسبة تصل إلى 43٪ CPU مع الحفاظ على دقة عالية المستوى.
- المؤلفون: Glenn Jocher و Jing Qiu
- المؤسسة:Ultralytics
- التاريخ: 14 يناير 2026
- الميزة الرئيسية: الكشف الشامل NMS، مُحسِّن MuSGD، ProgLoss + STAL
- GitHub:Ultralytics Repository
YOLOv9
صدر في أوائل عام 2024، YOLOv9 مفهوم معلومات التدرج القابلة للبرمجة (PGI) وبنية GELAN. عالجت هذه الابتكارات مشكلة "اختناق المعلومات" في الشبكات العميقة، مما يضمن عدم فقدان البيانات الهامة أثناء عملية التغذية الأمامية. ولا يزال هذا النموذج قويًا، خاصة بالنسبة لتطبيقات البحث التي تتطلب كفاءة عالية في المعلمات.
- المؤلفون: Chien-Yao Wang و Hong-Yuan Mark Liao
- المؤسسة: معهد علوم المعلومات، أكاديميا سينيكا
- التاريخ: 21 فبراير 2024
- الميزة الرئيسية: معلومات التدرج القابلة للبرمجة (PGI)، بنية GELAN
- Arxiv:YOLOv9
- GitHub:مستودع YOLOv9
مقارنة البنية التقنية
يشير الاختلاف المعماري بين هذين النموذجين إلى تحول من تحسين تدفق المعلومات النظري إلى كفاءة التنفيذ العملي.
YOLO26: الكفاءة والتصميم الذي يركز على الحافة
يركز YOLO26 على تقليل العبء الحسابي للمعالجة اللاحقة وحساب الخسارة.
- NMS من البداية إلى النهاية: على عكس أجهزة الكشف التقليدية التي تنتج مربعات حدودية زائدة عن الحاجة تتطلب NMS، تتنبأ YOLO26 بمجموعة الأجسام الدقيقة مباشرة. وهذا يقلل من تباين زمن الاستجابة ويبسط عملية التصدير إلى تنسيقات مثل ONNX TensorRT حيث لم تعد هناك حاجة إلى NMS المخصصة المعقدة.
- ProgLoss + STAL: أدى إدخال تقنية Progressive Loss و Soft-Target Anchor Labeling إلى تحسين كبير في اكتشاف الأجسام الصغيرة، وهو مطلب أساسي لصور الطائرات بدون طيار والتفتيش الآلي.
- MuSGD Optimizer: من خلال إدخال ابتكارات من تدريب نماذج اللغة الكبيرة إلى الرؤية الحاسوبية، يعمل هذا المحسن الهجين على استقرار زخم التدريب، مما يتيح تقاربًا أسرع مع ضبط أقل للمعلمات الفائقة.
YOLOv9: الاحتفاظ بالمعلومات
تم تصميم بنية YOLOv9 بهدف حل مشكلة المعلومات المفقودة في الشبكات العميقة.
- PGI (معلومات التدرج القابلة للبرمجة): يقوم فرع الإشراف الإضافي بإنشاء تدرجات موثوقة لتحديث أوزان الشبكة، مما يضمن احتفاظ الطبقات العميقة بالمعلومات الدلالية.
- GELAN (شبكة تجميع الطبقات الفعالة المعممة): تعمل هذه الشبكة الأساسية على تحسين استخدام المعلمات، مما يسمح YOLOv9 دقة عالية باستخدام معلمات أقل من بعض سابقاتها، على الرغم من أن ذلك غالبًا ما يكون على حساب تعقيد حسابي أعلى (FLOPs) مقارنةً بـ YOLO26 المبسطة.
بساطة النشر
إزالة NMS YOLO26 هو عامل تغيير قواعد اللعبة بالنسبة لنشر الحافة. في النماذج القديمة مثل YOLOv9، تعمل NMS على CPU إذا كان النموذج يعمل على وحدة GPU، مما يخلق عنق زجاجة. ناتج YOLO26 جاهز للاستخدام على الفور، مما يجعله أسرع بكثير على Raspberry Pi والأجهزة المحمولة.
مقاييس الأداء
يقارن الجدول التالي النماذج على معايير قياسية. لاحظ الميزة الكبيرة لـ YOLO26 من حيث السرعة على CPU وهي نتيجة مباشرة لتحسينات هندستها.
| النموذج | الحجم (بالبكسل) | mAPval 50-95 | السرعة وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية) | السرعة T4 TensorRT10 (بالمللي ثانية) | المعلمات (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
مزايا نظام Ultralytics البيئي
بينما YOLOv9 أسسًا نظرية قوية، فإن استخدام YOLO26 ضمن Ultralytics يوفر مزايا واضحة للمطورين والشركات.
سهولة استخدام لا مثيل لها
تحولPython Ultralytics Python سير العمل التدريبي المعقد إلى بضع أسطر من التعليمات البرمجية. تتناقض هذه التجربة "من الصفر إلى القمة" مع الإعداد المتمركز حول البحث في العديد من المستودعات الأخرى.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
تعدد الاستخدامات عبر المهام
على عكس YOLOv9 الذي يركز بشكل أساسي على الكشف، يدعم Ultralytics و YOLO26 بشكل أساسي مجموعة واسعة من مهام الرؤية الحاسوبية. وهذا يتيح لك استخدام واجهة برمجة تطبيقات موحدة واحدة من أجل:
- تجزئة المثيل: إخفاء دقيق للكائنات على مستوى البكسل.
- تقدير الوضع: الكشف عن النقاط الرئيسية لتحليل نشاط الإنسان.
- OBB (مربع الحدود الموجه): الكشف عن الأجسام الدوارة مثل السفن في صور الأقمار الصناعية.
- التصنيف: تصنيف الصورة بأكملها.
التدريب وكفاءة الذاكرة
تم تصميم Ultralytics لتكون موفرة للموارد. عادةً ما يتطلب YOLO26 GPU (VRAM) أقل أثناء التدريب مقارنة بالبدائل التي تعتمد بشكل كبير على المحولات. تتيح هذه الكفاءة ما يلي:
- أحجام دفعات أكبر على الأجهزة الاستهلاكية.
- تكاليف حوسبة سحابية أقل.
- دورات تجريبية أسرع مع أوزان مسبقة التدريب متاحة بسهولة.
تطبيقات عملية في أرض الواقع
يعتمد اختيار النموذج المناسب على قيود النشر الخاصة بك.
الحوسبة الطرفية وIoT
YOLO26 هو البطل بلا منازع للأجهزة الطرفية. إن CPU الأسرع بنسبة 43٪ يجعله قابلاً للتطبيق للمراقبة في الوقت الفعلي على أجهزة مثل Raspberry Pi أو NVIDIA Nano دون الحاجة إلى تكمية ثقيلة. على سبيل المثال، يستفيد نظام وقوف السيارات الذكي الذي يعمل على الأجهزة المحلية بشكل كبير من التصميم NMS مما يقلل من ارتفاعات زمن الوصول.
التفتيش على ارتفاعات عالية
في مجال المراقبة الزراعية أو فحص البنية التحتية باستخدام الطائرات بدون طيار، يتفوق YOLO26 بفضل وظائف ProgLoss + STAL. وقد تم ضبط هذه الوظائف خصيصًا للتعامل مع الأجسام الصغيرة ونسب العرض إلى الارتفاع الصعبة بشكل أفضل من الأجيال السابقة، مما يضمن اكتشاف الشقوق في الأنابيب أو الآفات على المحاصيل بدقة أعلى.
البحوث الأكاديمية
YOLOv9 لا يزال مرشحًا قويًا للبحوث الأكاديمية، لا سيما الدراسات التي تركز على تدفق التدرج ونظرية بنية الشبكات. يوفر مفهوم PGI الخاص به وسيلة رائعة لاستكشاف كيفية احتفاظ الشبكات العصبية بعمق المعلومات.
الخلاصة
تعد كلتا البنيتين علامات فارقة مهمة في مجال الرؤية الحاسوبية. YOLOv9 أهمية معلومات التدرج في الشبكات العميقة. ومع ذلك، فإن YOLO26 تترجم تلك الدروس إلى قوة إنتاجية جاهزة. بفضل تصميمها الشامل NMS CPU الفائقة والتكامل السلس مع Ultralytics توفر YOLO26 أفضل توازن بين السرعة والدقة وسهولة الاستخدام لتطبيقات الذكاء الاصطناعي الحديثة.
بالنسبة للمطورين الذين يرغبون في البقاء في الطليعة، نوصي بالانتقال إلى YOLO26 للاستفادة من أحدث التطورات في استقرار المحسن وأداء الحافة.
مزيد من القراءة
إذا كنت مهتمًا بغيرها من الطرز عالية الأداء في Ultralytics ، فراجع YOLO11 للمهام العامة أو RT-DETR للكشف في الوقت الفعلي القائم على المحولات.