Meituan YOLOv6

Q: What are the different versions of YOLOv6 and their performance metrics?

YOLOv6 कई संस्करण प्रदान करता है, प्रत्येक को विभिन्न प्रदर्शन आवश्यकताओं के लिए अनुकूलित किया गया है: इन मॉडलों का मूल्यांकन COCO डेटासेट पर एक का उपयोग करके किया जाता है NVIDIA टेस्ला T4 GPU. प्रदर्शन मीट्रिक के बारे में अधिक जानकारी के लिए, प्रदर्शन मीट्रिक अनुभाग देखें.

विहंगावलोकन

मीतुआन YOLOv6 एक अत्याधुनिक ऑब्जेक्ट डिटेक्टर है जो गति और सटीकता के बीच उल्लेखनीय संतुलन प्रदान करता है, जिससे यह रीयल-टाइम अनुप्रयोगों के लिए एक लोकप्रिय विकल्प बन जाता है। यह मॉडल अपनी वास्तुकला और प्रशिक्षण योजना पर कई उल्लेखनीय संवर्द्धन का परिचय देता है, जिसमें द्वि-दिशात्मक संयोजन (बीआईसी) मॉड्यूल, एक एंकर-एडेड प्रशिक्षण (एएटी) रणनीति, और अत्याधुनिक सटीकता के लिए एक बेहतर रीढ़ और गर्दन डिजाइन शामिल है।

Meituan YOLOv6 मॉडल उदाहरण छवि YOLOv6 का अवलोकन। मॉडल आर्किटेक्चर आरेख पुन: डिज़ाइन किए गए नेटवर्क घटकों और प्रशिक्षण रणनीतियों को दिखा रहा है जिससे महत्वपूर्ण प्रदर्शन सुधार हुए हैं। (a) YOLOv6 की गर्दन (N और S दिखाए गए हैं)। M/L के लिए नोट, RepBlocks को CSPStackRep से बदल दिया गया है। (b) BiC मॉड्यूल की संरचना। (c) एक SimCSPSPPF ब्लॉक। (मूल).

प्रमुख विशेषताऐं

द्विदिश संयोजन (बीआईसी) मॉड्यूल: YOLOv6 डिटेक्टर की गर्दन में एक BiC मॉड्यूल पेश करता है, स्थानीयकरण संकेतों को बढ़ाता है और नगण्य गति गिरावट के साथ प्रदर्शन लाभ प्रदान करता है।
एंकर-एडेड ट्रेनिंग (AAT) रणनीति: यह मॉडल अनुमान दक्षता से समझौता किए बिना एंकर-आधारित और एंकर-मुक्त दोनों प्रतिमानों के लाभों का आनंद लेने के लिए एएटी का प्रस्ताव करता है।
बढ़ी हुई रीढ़ और गर्दन डिजाइन: रीढ़ और गर्दन में एक और चरण को शामिल करने के लिए YOLOv6 को गहरा करके, यह मॉडल उच्च-रिज़ॉल्यूशन इनपुट पर COCO डेटासेट पर अत्याधुनिक प्रदर्शन प्राप्त करता है।
स्व-आसवन रणनीति: YOLOv6 के छोटे मॉडलों के प्रदर्शन को बढ़ावा देने के लिए एक नई स्व-आसवन रणनीति लागू की गई है, प्रशिक्षण के दौरान सहायक प्रतिगमन शाखा को बढ़ाया गया है और एक चिह्नित गति में गिरावट से बचने के लिए इसे अनुमान पर हटा दिया गया है।

प्रदर्शन मेट्रिक्स

YOLOv6 विभिन्न पैमानों के साथ विभिन्न पूर्व-प्रशिक्षित मॉडल प्रदान करता है:

YOLOv6-N: COCO val2017 पर 37.5% AP 1187 FPS के साथ NVIDIA टेस्ला T4 GPU.
YOLOv6-S: 484 FPS पर 45.0% AP।
YOLOv6-M: 50.0 FPS पर 226% AP।
YOLOv6-L: 52.8% AP 116 FPS पर।
YOLOv6-L6: वास्तविक समय में अत्याधुनिक सटीकता।

YOLOv6 मोबाइल प्लेटफॉर्म के लिए अनुकूलित विभिन्न परिशुद्धता और मॉडल के लिए मात्रात्मक मॉडल भी प्रदान करता है।

उपयोग के उदाहरण

यह उदाहरण सरल YOLOv6 प्रशिक्षण और अनुमान उदाहरण प्रदान करता है। इन और अन्य मोड पर पूर्ण प्रलेखन के लिए भविष्यवाणी, ट्रेन, वैल और निर्यात डॉक्स पृष्ठ देखें।

उदाहरण

PythonCLI

PyTorch पूर्व-प्रशिक्षित *.pt मॉडल के साथ-साथ कॉन्फ़िगरेशन *.yaml फ़ाइलों को पास किया जा सकता है YOLO() में एक मॉडल उदाहरण बनाने के लिए वर्ग python:

from ultralytics import YOLO

# Build a YOLOv6n model from scratch
model = YOLO("yolov6n.yaml")

# Display model information (optional)
model.info()

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLOv6n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

CLI मॉडल को सीधे चलाने के लिए कमांड उपलब्ध हैं:

# Build a YOLOv6n model from scratch and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolov6n.yaml data=coco8.yaml epochs=100 imgsz=640

# Build a YOLOv6n model from scratch and run inference on the 'bus.jpg' image
yolo predict model=yolov6n.yaml source=path/to/bus.jpg

समर्थित कार्य और मोड

YOLOv6 श्रृंखला कई प्रकार के मॉडल प्रदान करती है, जिनमें से प्रत्येक उच्च-प्रदर्शन ऑब्जेक्ट डिटेक्शन के लिए अनुकूलित है। ये मॉडल अलग-अलग कम्प्यूटेशनल आवश्यकताओं और सटीकता आवश्यकताओं को पूरा करते हैं, जिससे वे अनुप्रयोगों की एक विस्तृत श्रृंखला के लिए बहुमुखी हो जाते हैं।

मॉडल प्रकार	पूर्व-प्रशिक्षित वजन	समर्थित कार्य	अनुमान	मान्यता	प्रशिक्षण	निर्यातित माल
योलोव6-एन	`yolov6-n.pt`	वस्तु का पता लगाना	✅	✅	✅	✅
योलोव6-एस	`yolov6-s.pt`	वस्तु का पता लगाना	✅	✅	✅	✅
योलोव6-एम	`yolov6-m.pt`	वस्तु का पता लगाना	✅	✅	✅	✅
योलोव6-एल	`yolov6-l.pt`	वस्तु का पता लगाना	✅	✅	✅	✅
योलोव6-एल6	`yolov6-l6.pt`	वस्तु का पता लगाना	✅	✅	✅	✅

यह तालिका YOLOv6 मॉडल वेरिएंट का विस्तृत अवलोकन प्रदान करती है, ऑब्जेक्ट डिटेक्शन कार्यों में उनकी क्षमताओं और अनुमान, सत्यापन, प्रशिक्षण और निर्यात जैसे विभिन्न परिचालन मोड के साथ उनकी संगतता को उजागर करती है। यह व्यापक समर्थन सुनिश्चित करता है कि उपयोगकर्ता ऑब्जेक्ट डिटेक्शन परिदृश्यों की एक विस्तृत श्रृंखला में YOLOv6 मॉडल की क्षमताओं का पूरी तरह से लाभ उठा सकते हैं।

प्रशंसा पत्र और पावती

हम लेखकों को वास्तविक समय वस्तु का पता लगाने के क्षेत्र में उनके महत्वपूर्ण योगदान के लिए स्वीकार करना चाहते हैं:

बिबटेक्स

@misc{li2023yolov6,
      title={YOLOv6 v3.0: A Full-Scale Reloading},
      author={Chuyi Li and Lulu Li and Yifei Geng and Hongliang Jiang and Meng Cheng and Bo Zhang and Zaidan Ke and Xiaoming Xu and Xiangxiang Chu},
      year={2023},
      eprint={2301.05586},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

मूल YOLOv6 पेपर arXiv पर पाया जा सकता है। लेखकों ने अपना काम सार्वजनिक रूप से उपलब्ध कराया है, और कोडबेस को GitHub पर एक्सेस किया जा सकता है। हम क्षेत्र को आगे बढ़ाने और उनके काम को व्यापक समुदाय के लिए सुलभ बनाने में उनके प्रयासों की सराहना करते हैं।

अक्सर पूछे जाने वाले प्रश्न

मीतुआन YOLOv6 क्या है और क्या इसे अद्वितीय बनाता है?

Meituan YOLOv6 एक अत्याधुनिक ऑब्जेक्ट डिटेक्टर है जो गति और सटीकता को संतुलित करता है, जो वास्तविक समय के अनुप्रयोगों के लिए आदर्श है। इसमें द्वि-दिशात्मक संयोजन (BiC) मॉड्यूल और एक एंकर-एडेड ट्रेनिंग (AAT) रणनीति जैसे उल्लेखनीय वास्तुशिल्प संवर्द्धन शामिल हैं। ये नवाचार न्यूनतम गति गिरावट के साथ पर्याप्त प्रदर्शन लाभ प्रदान करते हैं, जिससे YOLOv6 ऑब्जेक्ट डिटेक्शन कार्यों के लिए एक प्रतिस्पर्धी विकल्प बन जाता है।

YOLOv6 में द्वि-दिशात्मक संयोजन (BiC) मॉड्यूल प्रदर्शन में सुधार कैसे करता है?

YOLOv6 में द्वि-दिशात्मक संयोजन (BiC) मॉड्यूल डिटेक्टर की गर्दन में स्थानीयकरण संकेतों को बढ़ाता है, नगण्य गति प्रभाव के साथ प्रदर्शन में सुधार प्रदान करता है। यह मॉड्यूल प्रभावी रूप से विभिन्न फीचर मानचित्रों को जोड़ता है, जिससे वस्तुओं का सटीक पता लगाने की मॉडल की क्षमता बढ़ जाती है। YOLOv6 की विशेषताओं के बारे में अधिक जानकारी के लिए, मुख्य विशेषताएं अनुभाग देखें।

मैं YOLOv6 मॉडल का उपयोग करके कैसे प्रशिक्षित कर सकता हूं Ultralytics?

आप YOLOv6 मॉडल का उपयोग करके प्रशिक्षित कर सकते हैं Ultralytics सरल के साथ Python नहीं तो CLI आदेश। उदाहरणार्थ:

उदाहरण

PythonCLI

from ultralytics import YOLO

# Build a YOLOv6n model from scratch
model = YOLO("yolov6n.yaml")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

yolo train model=yolov6n.yaml data=coco8.yaml epochs=100 imgsz=640

अधिक जानकारी के लिए, ट्रेन पृष्ठ पर जाएं।

YOLOv6 के विभिन्न संस्करण और उनके प्रदर्शन मीट्रिक क्या हैं?

YOLOv6 कई संस्करण प्रदान करता है, प्रत्येक विभिन्न प्रदर्शन आवश्यकताओं के लिए अनुकूलित है:

YOLOv6-N: 37.5% AP 1187 FPS पर
YOLOv6-S: 484 एफपीएस पर 45.0% एपी
YOLOv6-M: 226 एफपीएस पर 50.0% एपी
YOLOv6-L: 116 एफपीएस पर 52.8% एपी
YOLOv6-L6: वास्तविक समय परिदृश्यों में अत्याधुनिक सटीकता

इन मॉडलों का मूल्यांकन COCO डेटासेट पर एक का उपयोग करके किया जाता है NVIDIA टेस्ला T4 GPU. प्रदर्शन मीट्रिक के बारे में अधिक जानकारी के लिए, प्रदर्शन मीट्रिक अनुभाग देखें.

एंकर-एडेड ट्रेनिंग (AAT) रणनीति YOLOv6 को कैसे लाभ पहुंचाती है?

YOLOv6 में एंकर-एडेड ट्रेनिंग (AAT) एंकर-आधारित और एंकर-मुक्त दृष्टिकोण के तत्वों को जोड़ती है, जो अनुमान दक्षता से समझौता किए बिना मॉडल की पहचान क्षमताओं को बढ़ाती है। यह रणनीति बाउंडिंग बॉक्स भविष्यवाणियों को बेहतर बनाने के लिए प्रशिक्षण के दौरान एंकरों का लाभ उठाती है, जिससे YOLOv6 विविध ऑब्जेक्ट डिटेक्शन कार्यों में प्रभावी हो जाता है।

कौन से परिचालन मोड YOLOv6 मॉडल द्वारा समर्थित हैं Ultralytics?

YOLOv6 अनुमान, सत्यापन, प्रशिक्षण और निर्यात सहित विभिन्न परिचालन मोड का समर्थन करता है। यह लचीलापन उपयोगकर्ताओं को विभिन्न परिदृश्यों में मॉडल की क्षमताओं का पूरी तरह से फायदा उठाने की अनुमति देता है। प्रत्येक मोड के विस्तृत ओवरव्यू के लिए समर्थित कार्य और मोड अनुभाग देखें।

बनाया गया 2023-11-12, अपडेट किया गया 2024-07-04
लेखक: ग्लेन-जोचर (10)