Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 في مقابل YOLO26: نظرة متعمقة على اكتشاف الكائنات في الوقت الفعلي#

لقد أحدث تطور اكتشاف الكائنات في الوقت الفعلي ابتكارات مذهلة، وغالبًا ما يوازن الاهتمام بين إنتاجية وحدات معالجة الرسومات (GPU) الصناعية وبين البنى الموجهة والمحسّنة للحوسبة الطرفية. في هذه المقارنة الشاملة، نستكشف الفروق الدقيقة بين عملاقين: YOLOv6-3.0 الذي يركز على الجوانب الصناعية، وUltralytics YOLO26 الذي تم إصداره حديثًا ويعمل بنظام متكامل أصلياً.

سواء كنت تنشر النماذج على وحدات GPU خادم عالية الأداء أو على أجهزة طرفية منخفضة الطاقة، فإن فهم نقاط القوة الهيكلية وحالات الاستخدام المثالية لهذه النماذج أمر بالغ الأهمية لتحسين خطوط معالجة الرؤية الحاسوبية الخاصة بك.

Link to this sectionYOLOv6-3.0: الإنتاجية الصناعية#

تم تطوير YOLOv6-3.0 من قبل قسم الذكاء الاصطناعي للرؤية في Meituan، وصُمم ليكون "كاشف كائنات من الجيل التالي للتطبيقات الصناعية". يركز النموذج بشكل كبير على زيادة الإنتاجية إلى أقصى حد على مسرعات الأجهزة مثل وحدات GPU المخصصة، مما يجعله أداة هائلة لتحليلات الفيديو عالية السرعة دون اتصال بالإنترنت.

  • المؤلفون: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, و Xiangxiang Chu
  • المنظمة: Meituan
  • التاريخ: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6
  • التوثيق: توثيق YOLOv6

Link to this sectionالتركيز الهيكلي#

يستخدم YOLOv6-3.0 وحدة تسلسل ثنائي الاتجاه (Bi-directional Concatenation - BiC) في عنقه لتحسين دمج الميزات، إلى جانب استراتيجية التدريب بمساعدة المرساة (Anchor-Aided Training - AAT). يعتمد هيكله الأساسي (backbone) على EfficientRep، وهي طوبولوجيا مصممة لتكون متوافقة للغاية مع الأجهزة لاستدلال GPU. ورغم أن هذا يجعله سريعًا بشكل استثنائي عند الاستفادة من NVIDIA TensorRT، إلا أنه قد يؤدي إلى زمن انتقال أعلى على الأجهزة التي تعتمد على CPU فقط أو الأجهزة الطرفية التي تفتقر إلى إمكانات المعالجة المتوازية الضخمة.

اعرف المزيد حول YOLOv6-3.0

Link to this sectionYOLO26: المعيار الجديد للحوسبة الطرفية والسحابية#

تم إصدار Ultralytics YOLO26 في يناير 2026، ويمثل تحولًا جذريًا في النموذج. فهو يبتعد عن المعالجة اللاحقة المعقدة ويتبنى إطار عمل موحدًا متعدد المهام، مما يجعله أسرع وأصغر وأسهل في النشر.

Link to this sectionالإنجازات الهيكلية الرئيسية#

يقدم YOLO26 العديد من التطورات الرائدة التي تميزه عن الأجيال السابقة:

  • تصميم متكامل أصلي (End-to-End) بدون NMS: بناءً على المفاهيم التي تم طرحها لأول مرة في YOLOv10، يعمل YOLO26 بنظام متكامل أصليًا. فهو يلغي تمامًا المعالجة اللاحقة لـ قمع غير الحد الأقصى (NMS)، مما يؤدي إلى انخفاض كبير في تباين زمن الانتقال ومنطق نشر أبسط بكثير.
  • أسرع بنسبة تصل إلى 43% في استدلال CPU: تم تحسينه بشكل صريح للحوسبة الطرفية، ويتفوق YOLO26 على الأجهزة التي لا تحتوي على وحدات GPU، مما يجعله مثاليًا للهواتف المحمولة ومستشعرات إنترنت الأشياء والروبوتات.
  • إزالة DFL: تم إزالة فقدان التوزيع البؤري (Distribution Focal Loss)، مما يبسط عملية تصدير النموذج ويعزز التوافق مع الأجهزة الطرفية منخفضة الطاقة.
  • مُحسِّن MuSGD: مستوحى من ابتكارات تدريب النماذج اللغوية الكبيرة (LLM) مثل Kimi K2 من Moonshot AI، يوفر مُحسِّن MuSGD الجديد (وهو مزيج من خوارزمية الانحدار المتدرج العشوائي وMuon) استقرارًا واسع النطاق لمهام الرؤية، مما يضمن تقاربًا أسرع.
  • ProgLoss + STAL: تحقق وظائف الخسارة المتقدمة تحسينات ملحوظة في التعرف على الكائنات الصغيرة، وهو تعزيز بالغ الأهمية للتطبيقات التي تتعامل مع الصور الجوية والمشاهد المزدحمة.

تعرف على المزيد حول YOLO26

القدرات متعددة المهام

على عكس YOLOv6-3.0، الذي يتعامل فقط مع مربعات الإحاطة، يتميز YOLO26 بتحسينات خاصة بالمهمة على كافة الأصعدة. يشمل ذلك خسارة التجزئة الدلالية (semantic segmentation loss) وproto متعدد المقاييس لـ تجزئة المثيلات، وتقدير الاحتمالية اللوغاريتمية المتبقية (RLE) لـ تقدير الوضعية، وخسارة الزاوية المتخصصة لحل مشكلات حدود مربع الإحاطة الموجه (OBB).

Link to this sectionمقارنة مفصلة للأداء#

عند تقييم النماذج، يعد التوازن بين السرعة والدقة وكفاءة المعلمات أمرًا بالغ الأهمية. يسلط الجدول أدناه الضوء على كيفية أداء هذه النماذج على مجموعة بيانات COCO.

النموذجالحجم
(بكسل)
mAPval
50-95
السرعة
CPU ONNX
(ms)
السرعة
T4 TensorRT10
(ms)
المعلمات
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

كما يظهر في البيانات، يحقق YOLO26 باستمرار توازن أداء متفوق. على سبيل المثال، يوفر YOLO26n زيادة قدرها +3.4 في mAP مقارنة بـ YOLOv6-3.0n مع تطلب ما يقرب من نصف المعلمات وFLOPs.

Link to this sectionميزة Ultralytics#

يتضمن اختيار النموذج تقييم النظام البيئي البرمجي المحيط. هنا، توفر مجموعة Ultralytics مزايا حاسمة مقارنة بمستودعات الأبحاث الثابتة:

  • سهولة الاستخدام: توفر Ultralytics تجربة مطور "من الصفر إلى الاحتراف". تسمح واجهة برمجة تطبيقات Python الموحدة الخاصة بها للمستخدمين بالتبديل بين المهام والنماذج ببساطة عن طريق تغيير معلمة نصية واحدة.
  • نظام بيئي جيد الصيانة: من خلال منصة Ultralytics، يحصل المطورون على إمكانية الوصول إلى بيئة محدثة بنشاط تدعم إدارة مجموعات البيانات المستمرة، والتدريب السحابي، وتصدير النموذج بسلاسة إلى تنسيقات مثل ONNX و OpenVINO.
  • متطلبات الذاكرة: يتميز YOLO26 بمنهجية تدريب عالية الكفاءة مع متطلبات ذاكرة أقل بكثير أثناء التدريب والاستدلال. وهذا يتناقض بشكل إيجابي مع البنى القائمة على المحولات (transformer-based)، مثل RT-DETR، التي تتطلب تخصيصات ذاكرة CUDA ضخمة.
  • تعدد الاستخدامات: من خلال دعم أصلي لـ التصنيف، والاكتشاف، والتجزئة، وتقدير الوضعية، يعمل YOLO26 كوجهة شاملة لتطبيقات الرؤية المعقدة والمتعددة الوسائط.
استكشاف البدائل

إذا كنت تبني خط أنابيب تعلم آلي عام وترغب في استكشاف خيارات قوية أخرى داخل النظام البيئي، فإن Ultralytics YOLO11 يظل أساسًا مستقرًا للغاية ومعتمدًا على نطاق واسع للنشر في المؤسسات.

Link to this sectionمثال على الكود: جعل التدريب بسيطًا#

يتطلب النشر والتدريب باستخدام مكتبة Ultralytics كودًا أدنى، مما يقلل من الغلايات البرمجية المعقدة المطلوبة بواسطة أطر العمل المستندة مباشرة إلى PyTorch الخام. يوضح المقتطف أدناه كيفية تحميل وتدريب والتحقق من صحة نموذج YOLO26.

from ultralytics import YOLO

# Load the highly efficient, end-to-end YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset with the advanced MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Utilizes GPU for accelerated training
)

# Validate the trained model's performance
metrics = model.val()
print(f"Validation mAP: {metrics.box.map}")

# Run NMS-free inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")

Link to this sectionحالات الاستخدام المثالية#

يتطلب اختيار البنية الصحيحة ربط نقاط قوة النموذج بالقيود الواقعية:

  • متى تنشر YOLOv6-3.0: مثالي لعمليات النشر الثابتة من جانب الخادم حيث يكون معالجة الدفعات أمرًا بالغ الأهمية. ستستفيد البيئات مثل خطوط التصنيع عالية السرعة أو مراكز فيديو المدن الذكية المركزية المزودة بوحدات GPU مخصصة من طراز A100 أو T4 من هيكله الأساسي EfficientRep.
  • متى تنشر YOLO26: الخيار الذي لا جدال فيه للتطبيقات الحديثة والقابلة للتوسع. يجعله استدلال CPU الأسرع بنسبة 43% وهيكله الخالي من NMS مثاليًا لتحليلات الطائرات بدون طيار، ومستشعرات إنترنت الأشياء عن بُعد، والروبوتات المتنقلة، وأي سيناريو للحوسبة الطرفية حيث يجب أن يتعايش زمن الانتقال المنخفض والدقة العالية ضمن قيود طاقة صارمة.

Link to this sectionالخلاصة#

بينما يحتفظ YOLOv6-3.0 بفائدته في خطوط أنابيب صناعية محددة وعالية الإنتاجية تعمل بتكوينات TensorRT القديمة، يمثل Ultralytics YOLO26 مستقبل الرؤية الحاسوبية. من خلال جلب تحسينات التدريب المستوحاة من LLM (مثل MuSGD) والقضاء على اختناقات المعالجة اللاحقة، يوفر YOLO26 مرونة وسرعة ودقة لا مثيل لها. إلى جانب نظام Ultralytics البيئي القوي وسهل الاستخدام، فإنه يُمكِّن المطورين من بناء ونشر تطبيقات رؤية متطورة بسهولة غير مسبوقة.

المساهمون

التعليقات