Link to this sectionEfficientDet مقابل PP-YOLOE+#

لقد تشكل مشهد الرؤية الحاسوبية بشكل كبير من خلال التطور المستمر لنماذج اكتشاف الأجسام. وتعد EfficientDet من جوجل وPP-YOLOE+ من بايدو محطتين مهمتين في هذه الرحلة. وبينما صُممت كلتا البنيتين لتحقيق التوازن الدقيق بين الكفاءة الحسابية ودقة الاكتشاف، إلا أنهما تتعاملان مع هذا التحدي من خلال فلسفات تصميم مختلفة جذرياً.

يقوم هذا الدليل الشامل بتحليل بنيتيهما، ومنهجيات التدريب، وسيناريوهات النشر في العالم الحقيقي لمساعدتك في اختيار الشبكة العصبية المثلى لـ تطبيق الرؤية الحاسوبية القادم الخاص بك.

Link to this sectionالابتكارات المعمارية وفلسفات التصميم#

يعد فهم البنية الأساسية لهذه النماذج أمراً بالغ الأهمية لنشرها بفعالية في بيئات الإنتاج، سواء على أجهزة الحافة أو خوادم السحاب.

Link to this sectionEfficientDet: قوة التحجيم المركب#

قدمت EfficientDet، التي طورتها Google Research، تحولاً جذرياً من خلال التعامل مع تحجيم النموذج ليس كعملية مخصصة، بل كطريقة تحجيم مركب قائمة على مبادئ رياضية.

المؤلفون: Mingxing Tan, Ruoming Pang, و Quoc V. Le
المنظمة: Google Research
التاريخ: 2019-11-20
Arxiv: 1911.09070
GitHub: google/automl
المستندات: توثيق EfficientDet

اعرف المزيد عن EfficientDet

يكمن الابتكار الجوهري في EfficientDet في شبكة هرم الميزات ثنائية الاتجاه (BiFPN). على عكس شبكات FPN التقليدية التي تجمع الميزات من الأعلى إلى الأسفل فقط، تقدم BiFPN أوزاناً قابلة للتعلم لإجراء دمج للميزات عبر المقاييس في كلا الاتجاهين من الأعلى إلى الأسفل ومن الأسفل إلى الأعلى. وهذا يسمح للشبكة بفهم أهمية ميزات الإدخال المختلفة بشكل حدسي. وبالاقتران مع بنية EfficientNet الأساسية، تقوم EfficientDet بتحجيم الدقة والعمق والعرض في وقت واحد، مما يخلق عائلة من النماذج (من d0 إلى d7) تلبي ميزانيات حسابية متفاوتة.

تحجيم EfficientDet

عند نشر EfficientDet، ضع في اعتبارك الأجهزة المستهدفة بعناية. فبينما يعد d0 مناسباً للأجهزة المحمولة، يتطلب التحجيم حتى d7 ذاكرة GPU وقوة حوسبة كبيرة.

Link to this sectionPP-YOLOE+: تجاوز حدود PaddlePaddle#

بناءً على نجاح سابقاتها، تم هندسة PP-YOLOE+ بواسطة فريق PaddlePaddle في Baidu لتقديم أداء متطور، تم تحسينه خصيصاً لعمليات نشر الخوادم ذات الإنتاجية العالية.

المؤلفون: مؤلفو PaddlePaddle
المؤسسة: Baidu
التاريخ: 2022-04-02
Arxiv: 2203.16250
GitHub: PaddlePaddle/PaddleDetection
المستندات: تكوين PP-YOLOE+

تعرف على المزيد حول PP-YOLOE+

تتميز PP-YOLOE+ ببنية أساسية من نوع CSPRepResNet، والتي تستفيد من شبكات Cross Stage Partial المدمجة مع تقنيات إعادة المعايرة لتعزيز استخراج الميزات دون زيادة زمن وصول الاستدلال. كما يعمل رأس ET-head (رأس فعال محاذٍ للمهمة) الخاص بها على تحسين المحاذاة بشكل كبير بين مهام التصنيف والتموضع. علاوة على ذلك، فهي تستخدم تصميماً خالياً من المراسي مدمجاً مع تعيين التسميات الديناميكي (TAL)، مما يبسط عملية التدريب ويحسن التعميم عبر مجموعات بيانات متنوعة.

Link to this sectionمقاييس الأداء والمعايير#

عند اختيار نموذج لـ الاستدلال في الوقت الفعلي، يعد تقييم التوازن بين متوسط دقة الاكتشاف (mAP) والسرعة الحسابية أمراً بالغ الأهمية. يوضح الجدول أدناه مقاييس الأداء الرئيسية لعائلتي النماذج.

النموذج	الحجم ^(بكسل)	mAP^val 50-95	السرعة ^{CPU ONNX (ms)}	السرعة ^{T4 TensorRT10 (ms)}	المعلمات ^(M)	FLOPs ^(B)
EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

كما لوحظ، تحقق PP-YOLOE+ عموماً ذروة دقة أعلى عند نفس عدد المعلمات، خاصة في متغيراتها الأكبر (l و x). وهي محسنة للغاية لإنتاجية GPU، مما يجعلها مرشحاً ممتازاً لـ عمليات نشر الخوادم ذات المعالجة المجمعة. في المقابل، توفر نماذج EfficientDet الأصغر نسبة كفاءة ممتازة للمعلمات مقابل FLOP، وهو ما يمكن أن يكون ميزة في البيئات ذات الذاكرة المحدودة للغاية.

Link to this sectionحالات الاستخدام المثالية واستراتيجيات النشر#

غالباً ما يعتمد الاختيار بين هذه البنيات بشكل كبير على تقنياتك الحالية وأجهزة النشر لديك.

متى تختار EfficientDet:

سير عمل AutoML: إذا كنت تستثمر بكثافة في نظام جوجل البيئي وتعتمد على إمكانيات البحث المعماري المؤتمت.
الحافة ذات الموارد المحدودة: توفر النماذج ذات المستوى الأدنى (d0، d1) أداءً متوقعاً على وحدات المعالجة المركزية للهواتف المحمولة حيث تعد مساحة المعلمات قيداً صارماً.

متى تختار PP-YOLOE+:

خوادم GPU عالية الأداء: السيناريوهات التي تتطلب أقصى إنتاجية على أجهزة NVIDIA، مثل معالجة مئات تدفقات الفيديو المتزامنة لـ المراقبة في المدن الذكية.
نظام PaddlePaddle البيئي: إذا كان فريق التطوير الخاص بك يستخدم بالفعل إطار عمل التعلم العميق الخاص بـ Baidu، فإن دمج PP-YOLOE+ سيكون سلساً.

Link to this sectionميزة Ultralytics: تقديم YOLO26#

بينما تعتبر EfficientDet وPP-YOLOE+ نماذج هائلة، فإن الوتيرة السريعة لابتكار الذكاء الاصطناعي تتطلب حلولاً توفر أداءً متطوراً وسهولة استخدام لا مثيل لها. وهنا يتفوق Ultralytics YOLO26، حيث يثبت نفسه كخيار أول لتطبيقات الرؤية الحاسوبية الحديثة.

أعيد إصدار YOLO26 في عام 2026، وهو يعيد تعريف اكتشاف الأجسام في الوقت الفعلي تماماً من خلال تقديم تصميم أصلي End-to-End NMS-Free. من خلال القضاء على معالجة NMS اللاحقة—وهي عنق زجاجة مستمر في النماذج القديمة—يوفر YOLO26 نشراً أبسط بشكل كبير ويقلل من تذبذب زمن وصول الاستدلال.

علاوة على ذلك، تم تحسين YOLO26 خصيصاً لعمليات نشر الحافة. حيث تعمل إزالة Distribution Focal Loss (DFL) على تبسيط عملية التصدير إلى تنسيقات مثل ONNX وTensorRT، مما ينتج عنه استدلال أسرع بنسبة تصل إلى 43% على وحدة المعالجة المركزية مقارنة بالأجيال السابقة. وهذا يجعله قوة مطلقة لـ أجهزة إنترنت الأشياء التي تعمل بالبطارية.

استقرار التدريب مع MuSGD

يدمج YOLO26 مُحسِّن MuSGD المبتكر، وهو هجين بين SGD وMuon. وبإلهام من التطورات في تدريب نماذج اللغة الكبيرة، يضمن هذا المُحسِّن تدريباً مستقراً للغاية وتقارباً سريعاً، مما يوفر ساعات ثمينة من حوسبة GPU.

يمكن للمطورين أيضاً الاستفادة من وظائف الخسارة المتقدمة في YOLO26، بما في ذلك ProgLoss + STAL، والتي تظهر تحسينات ملحوظة في التعرف على الأجسام الصغيرة—وهو مطلب حاسم للصور الجوية وتطبيقات الزراعة الدقيقة.

Link to this sectionنشر سلس مع Ultralytics#

تكمن القوة الحقيقية لـ Ultralytics في نظامها البيئي الموحد. على عكس النماذج التي تتطلب نصوص تدريب برمجية معقدة ومخصصة، يوفر YOLO26 واجهة برمجة تطبيقات (API) مبسطة بشكل لا يصدق. يتطلب تدريب نموذج على مجموعة بياناتك المخصصة بضعة أسطر فقط من كود Python:

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an inference on a new image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

سواء كنت تحتاج إلى اكتشاف قياسي، أو مهام متخصصة مثل تجزئة الأجزاء وتقدير الوضع، يدعم YOLO26 هذه المهام أصلياً مع نماذج أولية متعددة المقاييس وResidual Log-Likelihood Estimation (RLE)، كل ذلك ضمن نفس إطار العمل سهل الاستخدام.

Link to this sectionاستكشاف نماذج بارزة أخرى#

إذا كنت تقوم بتقييم بنيات لمتطلبات مؤسسية محددة، فمن الجدير بالنظر أيضاً في الجيل السابق Ultralytics YOLO11، والذي لا يزال حصان عمل قوياً ومختبراً في الإنتاج. بالنسبة للتطبيقات التي تُطلب فيها البنيات القائمة على Transformer، يقدم RT-DETR بديلاً مثيراً للاهتمام، على الرغم من أنه يتطلب عادةً ذاكرة CUDA أكبر أثناء التدريب مقارنة بمتغيرات YOLO عالية الكفاءة.

في الختام، بينما تقدم EfficientDet تحجيماً قائماً على المبادئ وتوفر PP-YOLOE+ إنتاجية GPU ممتازة ضمن إطار عملها المحدد، فإن Ultralytics YOLO26 يقدم الحل الأكثر توازناً وتعدداً في الاستخدامات وصداقة للمطورين المتاح اليوم. إن بنيته الأصلية الشاملة وقدرات التكامل الواسعة تجعله الأساس الموصى به لرؤية الذكاء الاصطناعي من الجيل التالي.

المساهمون

GLglenn-jocher¹⁴ SEsergiuwaxmann¹

تم الإنشاء 27 يناير 2025تم التحديث قبل 3 أسابيع