YOLO26 مقابل YOLOv6.0: دليل شامل لاكتشاف الكائنات في الوقت الفعلي

تستمر سرعة تطور الرؤية الحاسوبية في التزايد، مما يوفر للمطورين أدوات جديدة قوية لتطبيقات التعلم الآلي. غالبًا ما يحدد اختيار البنية المناسبة للنشر نجاح المشروع. في هذه المقارنة الفنية، سوف نستكشف الاختلافات الرئيسية بين YOLO26 المتطورة و YOLOv6. YOLOv6 الصناعية للغاية، ونقيّم بنيتيهما ومنهجيات التدريب وسيناريوهات النشر المثالية.

أصول النموذج وتفاصيله

قبل الخوض في مقاييس الأداء، من المفيد فهم الخلفية والتركيز على التطوير وراء هذين النموذجين القويين للرؤية.

YOLO26

المؤلفون: جلين جوشر وجينغ تشيو
المنظمة: Ultralytics
التاريخ: 2026-01-14
GitHub: مستودعUltralytics
المستندات: الوثائق الرسمية لـ YOLO26

تعرف على المزيد حول YOLO26

YOLOv6-3.0

المؤلفون: تشوي لي، لولو لي، ييفي جينغ، هونغليانغ جيانغ، مينغ تشينغ، بو تشانغ، زيدان كي، شياومينغ شو، وشيانغشيانغ تشو
المنظمة: Meituan
التاريخ: 2023-01-13
Arxiv: ورقةYOLOv6 .0
GitHub: مستودعYOLOv6
المستندات: YOLOv6

تعرف على المزيد حول YOLOv6-3.0

الابتكارات المعمارية والاختلافات

تم تصميم كلا النموذجين لاكتشاف الأجسام بسرعة عالية، ولكنهما يتبعان نهجين مختلفين تمامًا لتحقيق أدائهما.

Ultralytics : النموذج الأصلي الشامل الذي يركز على الحافة

تم إصدار YOLO26 في أوائل عام 2026، وهو يمثل قفزة هائلة إلى الأمام في كفاءة النموذج. وأهم تحديث في البنية هو تصميمه الأصلي NMS من البداية إلى النهاية. من خلال التخلص من خطوة المعالجة اللاحقة التقليدية لـ Non-Maximum Suppression (NMS) — وهو مفهوم تم تطويره بنجاح في YOLOv10— يقلل YOLO26 بشكل كبير من تقلب زمن الاستجابة، مما يجعله قابلاً للتنبؤ بدرجة عالية في عمليات النشر في الوقت الفعلي.

بالإضافة إلى ذلك، يتميز YOLO26 بإزالة DFL. من خلال إزالة Distribution Focal Loss، يبسط النموذج عملية التصدير ويعزز بشكل كبير التوافق مع أجهزة الحوسبة الطرفية منخفضة الطاقة. وينتج عن ذلك CPU أسرع بنسبة تصل إلى 43٪ CPU ، مما يجعل YOLO26 قوة مطلقة للبيئات التي لا تحتوي على وحدات معالجة رسومات مخصصة (GPUs) مثل Raspberry Pi أو الأجهزة المحمولة.

YOLOv6.0: المتخصص الصناعي

تم تطوير YOLOv6. YOLOv6 بواسطة فريق الرؤية في Meituan، وهو عبارة عن شبكة CNN صناعية عالية الكفاءة ومُحسّنة بشكل كبير من أجل TensorRT على NVIDIA . يعتمد بشكل كبير على تقنيات التقطير الذاتي وتصميم بنية عصبية مدركة للأجهزة. على الرغم من سرعته المذهلة على وحدات معالجة الرسومات T4 أو A100 الثقيلة، إلا أنه يعتمد على NMS التقليدية، والتي يمكن أن تسبب اختناقات في بيئات الأجهزة المقيدة.

توازن الأداء والمعايير

الاختبار الحقيقي لأي نموذج هو كيفية موازنته بين متوسط الدقة (mAP) وسرعة الاستدلال وعدد المعلمات. تشتهر Ultralytics بمتطلباتها الاستثنائية من الذاكرة وتوازن أدائها، وغالبًا ما تتفوق على النماذج القائمة على المحولات التي تتطلب CUDA ضخمة.

النموذج	الحجم ^{(بالبكسل)}	mAP^val 50-95	السرعة ^{وحدة المعالجة المركزية CPU ONNX (بالمللي ثانية)}	السرعة ^{T4 TensorRT10 (بالمللي ثانية)}	المعلمات ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

كما يتضح من البيانات، يحقق YOLO26 باستمرار معدل mAP أعلى mAP حو نصف عدد المعلمات mAP YOLOv6 . على سبيل المثال، يتفوق YOLO26s على YOLOv6. YOLOv6 بـ 3.6 mAP مع استخدام ما يقرب من نصف المعلمات (9.5 مليون مقابل 18.5 مليون).

كفاءة الذاكرة

يعني انخفاض عدد المعلمات وعمليات FLOP في YOLO26 انخفاضًا كبيرًا في استخدام الذاكرة أثناء التدريب والاستدلال مقارنةً بـ YOLOv6، مما يسمح بأحجام دفعات أكبر على الأجهزة الاستهلاكية القياسية.

كفاءة التدريب ومنهجياته

تختلف منهجيات التدريب بشكل كبير بين الإطارين. يقدم YOLO26 محسن MuSGD، وهو مزيج من SGD Muon مستوحى من Kimi K2 من Moonshot AI. وهذا يجلب ابتكارات تدريب LLM مباشرة إلى الرؤية الحاسوبية، مما يؤدي إلى تدريب أكثر استقرارًا ومعدلات تقارب سريعة للغاية.

علاوة على ذلك، يستخدم YOLO26 وظائف الخسارة ProgLoss + STAL. توفر وظائف الخسارة المتقدمة هذه تحسينات ملحوظة في التعرف على الأجسام الصغيرة، وهو أمر بالغ الأهمية للذكاء الاصطناعي في الزراعة وصور الطائرات بدون طيار على ارتفاعات عالية.

على العكس من ذلك، يستخدم YOLOv6. YOLOv6 استراتيجية التقطير الذاتي المكثف. ورغم فعاليتها، فإنها تتطلب عمومًا جداول تدريب أطول ومزيدًا من الأعباء الحسابية للوصول إلى الدقة المثلى.

النظام البيئي وسهولة الاستخدام

واحدة من أكبر مزايا اختيار YOLO26 هي النظام البيئي الجيد الصيانة Ultralytics . Ultralytics بسهولة استخدامها "من الصفر إلى القمة". يمكن للمطورين تثبيت Python والبدء في التدريب في غضون دقائق.

في المقابل، YOLOv6 استنساخ مستودع الأبحاث وإدارة التبعيات يدويًا والتنقل بين نصوص تشغيل معقدة، مما قد يبطئ عملية النشر بالنسبة لفرق الهندسة سريعة الوتيرة.

مثال على الكود: البدء مع YOLO26

يعد التدريب وتشغيل الاستدلال باستخدام Ultralytics أمرًا بسيطًا للغاية. تتولى Python القوية جميع المهام الصعبة:

from ultralytics import YOLO

# Load the highly efficient YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run end-to-end NMS-free inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export seamlessly to ONNX for CPU deployment
model.export(format="onnx")

تنوع لا مثيل له في مهام الرؤية

في حين أن YOLOv6. YOLOv6 هو مجرد كاشف كائنات مربع حدودي، فإن YOLO26 يتميز بتنوع مذهل. باستخدام نفس واجهة برمجة التطبيقات البسيطة، يمكن للمطورين إجراء تقسيم المثيلات وتصنيف الصور وتقدير الوضع وكشف المربع الحدودي الموجه (OBB).

يتضمن YOLO26 تحسينات محددة للمهام على جميع الأصعدة، مثل فقدان التجزئة الدلالية لإخفاء البكسلات بشكل مثالي، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لنقاط مرجعية فائقة الدقة، وفقدان الزاوية المتخصص لحل مشكلات حدود OBB.

حالات الاستخدام المثالية

متى تستخدم YOLO26

YOLO26 هو البطل بلا منازع في مجال الأجهزة الطرفية وإنترنت الأشياء (IoT) والروبوتات. بفضل CPU التي تزيد بنسبة 43٪ وبنيته NMS فإنه مثالي لأنظمة الإنذار الأمني في الوقت الفعلي التي تعمل على وحدات المعالجة المركزية القياسية أو رقائق ARM منخفضة الطاقة. كما أن قدرته الفائقة على اكتشاف الأجسام الصغيرة (بفضل ProgLoss + STAL) تجعله الخيار المثالي لاكتشاف الحيوانات البرية من الجو وتحليل الصور الملتقطة بالأقمار الصناعية.

متى تستخدم YOLOv6.0

يتميز YOLOv6.YOLOv6 في البيئات الصناعية الخاضعة لرقابة صارمة حيث تكون الخوادم مزودة NVIDIA متطورة (مثل T4 أو A100) تعمل على TensorRT محسّنة للغاية. وهو مناسب للغاية لاكتشاف العيوب في خطوط الإنتاج عالية السرعة حيث تكون بيئة الأجهزة ثابتة وتكون تباينات NMS مقبولة.

استكشاف نماذج أخرى

إذا كنت تستكشف المجال الأوسع للرؤية الحاسوبية، فقد تهتم أيضًا بنماذج أخرى تدعمها Ultralytics . على سبيل المثال، YOLO11 لا يزال نموذجًا رائعًا للأغراض العامة يحظى بدعم كبير من المجتمع. إذا كنت مهتمًا بشكل خاص بهياكل المحولات، فإن RT-DETR أداءً قويًا قائمًا على الانتباه، على الرغم من أنه يتطلب ذاكرة تدريب أكبر بكثير من YOLO26. للحصول على إمكانات بدون تدريب، يوفر YOLO إمكانية الكشف الفوري عن المفردات المفتوحة.

ملخص

يمثل كل من YOLOv6. YOLOv6 و YOLO26 إنجازات هندسية هائلة. ومع ذلك، بالنسبة للتطبيقات الحديثة التي تتطلب تطويرًا سريعًا، وعبء ذاكرة منخفضًا، ونشرًا سلسًا عبر أجهزة طرفية غير متجانسة، فإن Ultralytics هو الخيار الأفضل. إن تصميمه الأصلي الشامل، ومحسن MuSGD الثوري، وتكامله مع Ultralytics القوي، يمكّن الفرق من تقديم أحدث تقنيات الذكاء الاصطناعي للرؤية إلى الإنتاج بشكل أسرع من أي وقت مضى.