Meet YOLO26: next-gen vision AI.

Link to this sectionمقارنة بين YOLOv6-3.0 و EfficientDet#

يتطلب اختيار البنية المثلى لمشاريع الرؤية الحاسوبية فهماً عميقاً للمقايضات بين السرعة والدقة وجدوى النشر. توفر صفحة المقارنة هذه تحليلاً متعمقاً لنموذجين متميزين للكشف عن الكائنات: YOLOv6-3.0 و EfficientDet. بينما ساهم كلا النموذجين بشكل كبير في هذا المجال، فإن عمليات النشر الحديثة على الحافة والنماذج الأولية السريعة غالباً ما تستفيد من أطر عمل أكثر توحيداً مثل Ultralytics Platform.

فيما يلي مخطط تفاعلي يوضح فروق الأداء بين هذه النماذج لمساعدتك في فهم ملفات تعريف التأخير والدقة الخاصة بكل منها.

Link to this sectionYOLOv6-3.0: إنتاجية بمستوى صناعي#

صُمم YOLOv6-3.0 بشكل صريح من قبل Meituan ليكون إطار عمل عالي الأداء للكشف عن الكائنات في مرحلة واحدة ومصمم للتطبيقات الصناعية. وهو يركز بشكل كبير على تعظيم الإنتاجية على أجهزة GPU، مما يجعله مرشحاً قوياً لخطوط التصنيع عالية السرعة وتحليلات الفيديو دون اتصال بالإنترنت.

  • المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
  • المنظمة: Meituan
  • التاريخ: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Link to this sectionأبرز ميزات البنية#

تعتمد بنية YOLOv6-3.0 على وحدة الربط ثنائي الاتجاه (BiC) لتحسين دمج الميزات عبر المقاييس المختلفة. ولضمان سرعات استدلال عالية، فإنه يستفيد من عمود فقري EfficientRep، وهو محسن للغاية لتنفيذ GPU. علاوة على ذلك، فإنه يستخدم استراتيجية التدريب بمساعدة المرساة (AAT)، مما يدمج مزايا كلاً من كاشفات الرساة وكاشفات خالية من المرساة خلال مرحلة التدريب، مع الحفاظ على خط استدلال خالٍ من المرساة لتقليل التأخير.

Link to this sectionنقاط القوة والضعف#

يتألق YOLOv6-3.0 في البيئات التي تتوفر فيها أجهزة GPU مخصصة، حيث يوفر استدلالاً فورياً سريعاً جداً باستخدام TensorRT. ومع ذلك، فإن اعتماده الكبير على تحسينات الأجهزة المحددة يمكن أن يؤدي إلى أداء دون المستوى الأمثل على أجهزة الذكاء الاصطناعي للحافة التي تعتمد على CPU فقط. بالإضافة إلى ذلك، على الرغم من أنه يدعم بعض الكمية (quantization)، فإن النظام البيئي يفتقر إلى البساطة الشاملة الموجودة في أطر عمل Ultralytics الحديثة.

اعرف المزيد حول YOLOv6

Link to this sectionEfficientDet: بنية تعلم آلي قابلة للتوسع#

تم تطوير EfficientDet بواسطة Google Research، وهو يتبع نهجاً مختلفاً جذرياً. فبدلاً من صياغة الشبكة يدوياً، استخدم المؤلفون التعلم الآلي المؤتمت (AutoML) لتصميم بنية قابلة للتوسع توازن بين المعلمات، و FLOPs، والدقة.

Link to this sectionأبرز ميزات البنية#

قدم EfficientDet شبكة هرم الميزات ثنائية الاتجاه (BiFPN)، والتي تسمح بدمج ميزات متعدد المقاييس بسهولة وسرعة. وبالاقتران مع طريقة توسيع مركبة تقوم بتوسيع الدقة والعمق والعرض بشكل موحد لجميع الشبكات الأساسية وشبكة الميزات وشبكات التنبؤ بالصناديق/الفئات، تتراوح نماذج EfficientDet من d0 المدمج للغاية إلى d7 الضخم.

Link to this sectionنقاط القوة والضعف#

يعتبر EfficientDet فعالاً جداً من حيث المعلمات. فهو يحقق متوسط دقة متوسط (mAP) قوياً بعدد قليل نسبياً من المعلمات مقارنة بكاشفات الكائنات القديمة. ومع ذلك، فإن البنية متجذرة بعمق في أنظمة TensorFlow القديمة. وهذا يؤدي إلى إدارة معقدة للتبعية، ودورات تدريب أبطأ، ومتطلبات ذاكرة أعلى أثناء التدريب مقارنة بتنفيذات PyTorch المحسنة. علاوة على ذلك، فإن سرعة استدلاله على وحدات GPU الحديثة أبطأ بكثير من بنيات YOLO الحديثة.

اعرف المزيد عن EfficientDet

Link to this sectionمقارنة مفصلة للأداء#

يقارن الجدول أدناه المواصفات الفنية لـ YOLOv6-3.0 و EfficientDet عبر مقاييس مختلفة. لاحظ كيف يتفوق YOLOv6-3.0 في سرعة GPU، بينما يتوسع EfficientDet إلى mAP أعلى على حساب تأخير كبير.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
التأخير مقابل الإنتاجية

عند مقارنة النماذج، تذكر أن FLOPs وعدد المعلمات لا ترتبط دائماً بشكل مثالي بالتأخير في العالم الحقيقي. تم تحسين YOLOv6-3.0 لـ TensorRT، مما يحقق سرعات بالميلي ثانية على الرغم من احتوائه على عدد FLOPs أعلى من نماذج EfficientDet ذات المستوى الأدنى.

Link to this sectionميزة نظام Ultralytics البيئي#

بينما يخدم YOLOv6-3.0 و EfficientDet مجالات محددة، تتطلب مشاريع الرؤية الحاسوبية الحديثة التنوع وسهولة الاستخدام ونظاماً بيئياً يتم صيانته جيداً. وهنا تتفوق نماذج Ultralytics YOLO حقاً.

Link to this sectionسهولة الاستخدام وكفاءة التدريب#

على عكس EfficientDet، الذي يتطلب التنقل في تكوينات TensorFlow المعقدة، تم بناء نماذج Ultralytics على أساس PyTorch بديهي. توفر Ultralytics Platform واجهة برمجة تطبيقات مبسطة تعمل على تبسيط دورة حياة التعلم الآلي بأكملها. يتطلب تدريب نموذج Ultralytics ذاكرة CUDA أقل بشكل كبير، مما يسرع التجريب ويقلل تكاليف الحوسبة.

Link to this sectionتنوع لا مثيل له#

يقتصر YOLOv6-3.0 و EfficientDet بشكل أساسي على الكشف عن الكائنات. في المقابل، فإن بنيات Ultralytics الحديثة متعددة الوسائط بطبيعتها. تسمح لك واجهة واحدة بتدريب نماذج لمهام تجزئة المثيل، وتقدير الوضع، وتصنيف الصور، وصندوق التحديد الموجه (OBB).

Link to this sectionتقديم Ultralytics YOLO26#

بالنسبة للمطورين الذين يسعون للحصول على توازن الأداء النهائي، يمثل Ultralytics YOLO26 تحولاً نموذجياً. تم إصداره في يناير 2026، ويقدم العديد من الابتكارات الرائدة التي تتفوق على كل من YOLOv6 و EfficientDet:

  • تصميم بدون NMS من البداية إلى النهاية: يلغي YOLO26 الحاجة إلى معالجة لاحقة لإلغاء القمع غير الأقصى (NMS)، مما يقلل بشكل كبير من تباين التأخير ويبسط منطق النشر على أجهزة الحافة.
  • مُحسِّن MuSGD: مستوحى من تدريب LLM، يضمن هذا المحسن الهجين تدريباً مستقراً وتقارباً سريعاً للغاية.
  • استدلال أسرع بنسبة تصل إلى 43٪ على CPU: مع إزالة Distribution Focal Loss (DFL)، يعد YOLO26 أكثر كفاءة بكثير على وحدات CPU وأجهزة IoT منخفضة الطاقة مقارنة بالنماذج القديمة.
  • ProgLoss + STAL: توفر دوال الخسارة المتقدمة هذه تحسينات هائلة في التعرف على الكائنات الصغيرة، مما يجعل YOLO26 مثالياً لتطبيقات الطائرات بدون طيار والتصوير الجوي.

تعرف على المزيد حول YOLO26

Link to this sectionحالات الاستخدام والتوصيات#

يعتمد الاختيار بين YOLOv6 و EfficientDet على متطلبات مشروعك المحددة، وقيود النشر، وتفضيلات النظام البيئي.

Link to this sectionمتى تختار YOLOv6#

يعتبر YOLOv6 خياراً قوياً لـ:

  • النشر المدرك للأجهزة الصناعية: السيناريوهات التي يوفر فيها التصميم المدرك للأجهزة وإعادة تحديد المعلمات الفعال للنموذج أداءً محسناً على أجهزة مستهدفة محددة.
  • الكشف السريع في مرحلة واحدة: التطبيقات التي تعطي الأولوية لسرعة الاستدلال الخام على GPU لمعالجة الفيديو الفوري في بيئات خاضعة للتحكم.
  • تكامل نظام Meituan البيئي: الفرق التي تعمل بالفعل ضمن مكدس التكنولوجيا والبنية التحتية للنشر الخاصة بـ Meituan.

Link to this sectionمتى تختار EfficientDet#

يُنصح باستخدام EfficientDet في الحالات التالية:

  • خطوط أنابيب Google Cloud وTPU: الأنظمة المتكاملة بعمق مع واجهات برمجة تطبيقات Google Cloud Vision أو بنية TPU التحتية حيث يتمتع EfficientDet بتحسين أصلي.
  • أبحاث القياس المركب (Compound Scaling): المقارنة المعيارية الأكاديمية التي تركز على دراسة تأثيرات موازنة عمق الشبكة، وعرضها، وتوسيع نطاق الدقة.
  • النشر عبر الهاتف المحمول باستخدام TFLite: المشاريع التي تتطلب تحديداً تصدير TensorFlow Lite لأجهزة Android أو أجهزة Linux المدمجة.

Link to this sectionمتى تختار Ultralytics (YOLO26)#

بالنسبة لمعظم المشاريع الجديدة، يقدم Ultralytics YOLO26 أفضل مزيج من الأداء وتجربة المطور:

  • نشر الحافة الخالي من NMS: التطبيقات التي تتطلب استنتاجاً متسقاً ومنخفض زمن الانتقال دون تعقيدات معالجة ما بعد المعالجة باستخدام كبت غير الأقصى.
  • بيئات وحدة المعالجة المركزية (CPU) فقط: الأجهزة التي لا تحتوي على تسريع مخصص بوحدة معالجة الرسوميات (GPU)، حيث توفر سرعة استنتاج CPU أسرع بنسبة تصل إلى 43% في YOLO26 ميزة حاسمة.
  • اكتشاف الكائنات الصغيرة: السيناريوهات الصعبة مثل صور الطائرات بدون طيار أو تحليل مستشعرات IoT حيث تعزز ProgLoss و STAL الدقة بشكل كبير على الكائنات الصغيرة جداً.

Link to this sectionمثال على التنفيذ: تدريب YOLO26#

يوضح الكود التالي بساطة نظام Ultralytics البيئي. إن تدريب نموذج متطور سهل مثل تحميل الأوزان وتحديد بياناتك.

from ultralytics import YOLO

# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")

Link to this sectionنماذج أخرى يجب مراعاتها#

إذا كنت تستكشف المشهد الأوسع لنماذج الرؤية الحاسوبية، ففكر في هذه البدائل:

  • YOLO11: السلف الناجح للغاية لـ YOLO26، والذي يوفر قدرات قوية متعددة المهام ودعماً واسعاً من المجتمع.
  • YOLOv10: أول بنية YOLO تقدم تدريباً بدون NMS، مما يمهد الطريق للكشف الحديث من البداية إلى النهاية.
  • RT-DETR: للسيناريوهات التي يفضل فيها استخدام البنيات القائمة على Transformer وآليات الانتباه على CNNs التقليدية.

Link to this sectionالخلاصة#

بينما يوفر YOLOv6-3.0 إنتاجية صناعية ممتازة لـ GPU ويعرض EfficientDet إمكانات AutoML في صياغة شبكات قابلة للتوسع وفعالة من حيث المعلمات، يظهر كلا النموذجين قيوداً في سهولة النشر وتعدد المهام الحديث.

بالنسبة للغالبية العظمى من تطبيقات العالم الحقيقي—من نشر حافة الهاتف المحمول إلى التحليلات القائمة على السحابة—يقدم نظام Ultralytics البيئي توازناً في الأداء لا مثيل له. من خلال اعتماد YOLO26، يكتسب المطورون إمكانية الوصول إلى استدلال متطور بدون NMS، ودوال خسارة متقدمة للكائنات الصغيرة، وخط تدريب موحد وموثق جيداً يعمل على تسريع الطريق من النموذج الأولي إلى الإنتاج بشكل كبير.

المساهمون

التعليقات