Link to this sectionTìm hiểu sâu về các chỉ số hiệu năng#

Link to this sectionGiới thiệu#

Các chỉ số hiệu năng là công cụ then chốt để đánh giá độ chính xác và hiệu quả của các model phát hiện đối tượng. Chúng giúp làm rõ mức độ hiệu quả của model trong việc xác định và định vị đối tượng bên trong hình ảnh. Ngoài ra, chúng còn hỗ trợ việc hiểu cách model xử lý các trường hợp dương tính giả (false positives) và âm tính giả (false negatives). Những thông tin này cực kỳ quan trọng để đánh giá và cải thiện hiệu năng của model. Trong hướng dẫn này, chúng ta sẽ khám phá các chỉ số hiệu năng khác nhau liên quan đến YOLO26, ý nghĩa của chúng và cách diễn giải chúng.

Watch: Ultralytics YOLO26 Performance Metrics | MAP, F1 Score, Precision, IoU & Accuracy

Link to this sectionCác chỉ số phát hiện đối tượng#

Hãy bắt đầu bằng việc thảo luận một số chỉ số không chỉ quan trọng đối với YOLO26 mà còn áp dụng rộng rãi cho nhiều model phát hiện đối tượng khác nhau.

Intersection over Union (IoU): IoU là một thước đo giúp định lượng sự chồng lấp giữa một bounding box được dự đoán và một bounding box thực tế (ground truth). Nó đóng vai trò nền tảng trong việc đánh giá độ chính xác của quá trình định vị đối tượng.
Average Precision (AP): AP tính toán diện tích dưới đường cong precision-recall, cung cấp một giá trị duy nhất tóm tắt hiệu năng về precision và recall của model.
Mean Average Precision (mAP): mAP mở rộng khái niệm AP bằng cách tính giá trị AP trung bình trên nhiều lớp đối tượng. Chỉ số này rất hữu ích trong các kịch bản phát hiện đối tượng đa lớp để cung cấp đánh giá toàn diện về hiệu năng của model.
Precision và Recall: Precision định lượng tỷ lệ các dự đoán dương tính đúng trong tổng số các dự đoán dương tính, nhằm đánh giá khả năng tránh dương tính giả của model. Mặt khác, Recall tính toán tỷ lệ các dự đoán dương tính đúng trong tổng số các đối tượng thực tế, nhằm đo lường khả năng phát hiện tất cả các trường hợp thuộc một lớp của model.
F1 Score: F1 Score là trung bình điều hòa của precision và recall, cung cấp đánh giá cân bằng về hiệu năng của model khi cân nhắc cả dương tính giả và âm tính giả.

Link to this sectionCách tính toán các chỉ số cho model YOLO26#

Bây giờ, chúng ta có thể khám phá Chế độ xác thực (Validation mode) của YOLO26, chế độ này có thể được sử dụng để tính toán các chỉ số đánh giá đã thảo luận ở trên.

Việc sử dụng chế độ xác thực rất đơn giản. Khi bạn đã có một model đã được train, bạn có thể gọi hàm model.val(). Hàm này sau đó sẽ xử lý dataset xác thực và trả về nhiều chỉ số hiệu năng khác nhau. Nhưng các chỉ số này có ý nghĩa gì? Và bạn nên diễn giải chúng như thế nào?

Link to this sectionDiễn giải kết quả đầu ra#

Hãy phân tích kết quả đầu ra của hàm model.val() và hiểu từng phần của kết quả.

Link to this sectionCác chỉ số theo lớp (Class-wise Metrics)#

Một trong những phần của kết quả đầu ra là bảng phân tích các chỉ số hiệu năng theo từng lớp. Thông tin chi tiết này rất hữu ích khi bạn đang cố gắng tìm hiểu xem model hoạt động tốt như thế nào đối với từng lớp cụ thể, đặc biệt là trong các dataset có phạm vi danh mục đối tượng đa dạng. Đối với mỗi lớp trong dataset, các thông tin sau sẽ được cung cấp:

Class: Chỉ tên của lớp đối tượng, ví dụ: "person", "car", hoặc "dog".
Images: Chỉ số này cho biết số lượng hình ảnh trong tập xác thực có chứa lớp đối tượng đó.
Instances: Chỉ số này cung cấp số lượng lần xuất hiện của lớp đối tượng đó trên tất cả các hình ảnh trong tập xác thực.
Box(P, R, mAP50, mAP50-95): Chỉ số này cung cấp thông tin chi tiết về hiệu năng phát hiện đối tượng của model:
- P (Precision): Độ chính xác của các đối tượng được phát hiện, cho biết bao nhiêu phần trăm số lượng phát hiện là chính xác.
- R (Recall): Khả năng của model trong việc nhận diện tất cả các trường hợp đối tượng trong hình ảnh.
- mAP50: Mean average precision được tính tại ngưỡng intersection over union (IoU) là 0.50. Đây là thước đo độ chính xác của model khi chỉ xét đến các trường hợp phát hiện "dễ".
- mAP50-95: Giá trị trung bình của mean average precision được tính tại các ngưỡng IoU khác nhau, trải dài từ 0.50 đến 0.95. Nó mang lại cái nhìn toàn diện về hiệu năng của model qua các mức độ khó khác nhau của quá trình phát hiện.

Link to this sectionCác chỉ số tốc độ#

Tốc độ inference có thể quan trọng ngang bằng với độ chính xác, đặc biệt trong các kịch bản phát hiện đối tượng thời gian thực. Phần này phân tích thời gian thực hiện cho các giai đoạn khác nhau của quá trình xác thực, từ tiền xử lý đến hậu xử lý.

Link to this sectionĐánh giá các chỉ số COCO#

Đối với người dùng xác thực trên dataset COCO, các chỉ số bổ sung sẽ được tính toán bằng script đánh giá COCO. Những chỉ số này cung cấp thông tin về precision và recall tại các ngưỡng IoU khác nhau và cho các đối tượng có kích thước khác nhau.

Link to this sectionĐầu ra trực quan#

Hàm model.val(), ngoài việc tạo ra các chỉ số dạng số, còn tạo ra các đầu ra trực quan giúp hiểu rõ hơn về hiệu năng của model. Dưới đây là phân tích về các kết quả đầu ra trực quan mà bạn có thể thấy:

F1 Score Curve (BoxF1_curve.png): Đường cong này biểu thị F1 score qua các ngưỡng khác nhau. Việc giải thích đường cong này có thể cung cấp thông tin chi tiết về sự cân bằng của model giữa các kết quả dương tính giả (false positives) và âm tính giả (false negatives) trên các ngưỡng khác nhau.
Precision-Recall Curve (BoxPR_curve.png): Là một công cụ trực quan không thể thiếu cho bất kỳ bài toán phân loại nào, đường cong này thể hiện sự đánh đổi giữa độ chính xác (precision) và độ hồi tưởng (recall) tại các ngưỡng khác nhau. Nó trở nên đặc biệt quan trọng khi làm việc với các class không cân bằng.
Precision Curve (BoxP_curve.png): Một biểu diễn đồ họa của các giá trị precision tại các ngưỡng khác nhau. Đường cong này giúp hiểu rõ cách thức precision thay đổi khi ngưỡng thay đổi.
Recall Curve (BoxR_curve.png): Tương ứng, biểu đồ này minh họa cách các giá trị recall thay đổi qua các ngưỡng khác nhau.
Confusion Matrix (confusion_matrix.png): Ma trận nhầm lẫn cung cấp cái nhìn chi tiết về các kết quả, hiển thị số lượng true positives, true negatives, false positives và false negatives cho mỗi lớp.
Ma trận nhầm lẫn chuẩn hóa (confusion_matrix_normalized.png): Trực quan hóa này là một phiên bản đã chuẩn hóa của ma trận nhầm lẫn. Nó biểu diễn dữ liệu theo tỷ lệ thay vì số đếm thô. Định dạng này giúp so sánh hiệu năng giữa các lớp dễ dàng hơn.
Nhãn Batch xác thực (val_batchX_labels.jpg): Những hình ảnh này mô tả các nhãn ground truth cho các batch riêng biệt từ dataset xác thực. Chúng cung cấp bức tranh rõ ràng về các đối tượng là gì và vị trí tương ứng của chúng theo dataset.
Dự đoán Batch xác thực (val_batchX_pred.jpg): Đối lập với các hình ảnh nhãn, các hình ảnh trực quan này hiển thị các dự đoán do model YOLO26 thực hiện cho các batch tương ứng. Bằng cách so sánh chúng với các hình ảnh nhãn, bạn có thể dễ dàng đánh giá mức độ tốt của model trong việc phát hiện và phân loại đối tượng một cách trực quan.

Đối với các tác vụ detection, segmentation, và pose, các biểu đồ đường cong được đặt tiền tố theo loại chỉ số: detection ghi ra các đường cong Box*, segmentation ghi ra cả hai loại đường cong Box* và Mask*, còn pose ghi ra cả hai loại Box* và Pose*.

Link to this sectionLưu trữ kết quả#

Để tham khảo trong tương lai, kết quả được lưu vào một thư mục, thường có tên là runs/detect/val.

Link to this sectionChọn các chỉ số phù hợp#

Việc lựa chọn các chỉ số phù hợp để đánh giá thường phụ thuộc vào ứng dụng cụ thể.

mAP: Phù hợp để đánh giá tổng quát về hiệu năng của model.
IoU: Cần thiết khi vị trí đối tượng chính xác là yếu tố quan trọng.
Precision: Quan trọng khi việc giảm thiểu các phát hiện sai (false detections) là ưu tiên hàng đầu.
Recall: Thiết yếu khi việc phát hiện mọi trường hợp của một đối tượng là quan trọng.
F1 Score: Hữu ích khi cần sự cân bằng giữa precision và recall.

Đối với các ứng dụng thời gian thực, các chỉ số tốc độ như FPS (Khung hình trên giây) và độ trễ (latency) là rất quan trọng để đảm bảo kết quả kịp thời.

Link to this sectionDiễn giải kết quả#

Việc hiểu rõ các chỉ số là rất quan trọng. Dưới đây là ý nghĩa của một số điểm số thấp thường gặp:

mAP thấp: Cho thấy model có thể cần cải tiến tổng quát.
IoU thấp: Model có thể đang gặp khó khăn trong việc xác định chính xác vị trí đối tượng. Các phương pháp bounding box khác có thể giúp ích.
Precision thấp: Model có thể đang phát hiện quá nhiều đối tượng không tồn tại. Việc điều chỉnh ngưỡng tin cậy (confidence thresholds) có thể giảm bớt điều này.
Recall thấp: Model có thể đang bỏ sót các đối tượng thực. Cải thiện feature extraction hoặc sử dụng nhiều dữ liệu hơn có thể giúp ích.
F1 Score mất cân bằng: Có sự chênh lệch giữa precision và recall.
AP theo lớp: Điểm số thấp ở đây có thể làm nổi bật các lớp mà model gặp khó khăn.

Link to this sectionNghiên cứu điển hình#

Các ví dụ thực tế có thể giúp làm rõ cách các chỉ số này hoạt động trong thực tiễn.

Link to this sectionTrường hợp 1#

Tình huống: mAP và F1 Score chưa tối ưu, nhưng trong khi Recall tốt, Precision lại không cao.
Diễn giải & Hành động: Có thể có quá nhiều phát hiện sai. Việc siết chặt ngưỡng tin cậy có thể làm giảm các lỗi này, mặc dù nó cũng có thể làm giảm nhẹ recall.

Link to this sectionTrường hợp 2#

Tình huống: mAP và Recall ở mức chấp nhận được, nhưng IoU lại thấp.
Diễn giải & Hành động: Model phát hiện đối tượng tốt nhưng có thể định vị không chính xác. Việc tinh chỉnh các dự đoán bounding box có thể giúp ích.

Link to this sectionTrường hợp 3#

Tình huống: Một số lớp có AP thấp hơn nhiều so với các lớp khác, ngay cả khi mAP tổng thể khá ổn.
Diễn giải & Hành động: Những lớp này có thể là các lớp thách thức hơn đối với model. Sử dụng thêm dữ liệu cho các lớp này hoặc điều chỉnh trọng số lớp trong quá trình train có thể mang lại kết quả tốt hơn.

Link to this sectionKết nối và Cộng tác#

Tham gia vào cộng đồng những người đam mê và chuyên gia có thể thúc đẩy hành trình của bạn với YOLO26. Dưới đây là một số phương hướng có thể tạo điều kiện cho việc học tập, xử lý sự cố và mở rộng mạng lưới.

Link to this sectionTham gia vào cộng đồng rộng lớn hơn#

GitHub Issues: Kho lưu trữ YOLO26 trên GitHub có một Issues tab nơi bạn có thể đặt câu hỏi, báo cáo lỗi và đề xuất các tính năng mới. Cộng đồng và các nhà bảo trì rất tích cực tại đây, và đây là một nơi tuyệt vời để nhận trợ giúp về các vấn đề cụ thể.
Máy chủ Discord của Ultralytics: Ultralytics có một Discord server nơi bạn có thể tương tác với những người dùng khác và các nhà phát triển.

Link to this sectionTài liệu và Tài nguyên Chính thức:#

Ultralytics YOLO26 Docs: Tài liệu chính thức cung cấp cái nhìn tổng quan toàn diện về YOLO26, cùng với các hướng dẫn về cài đặt, sử dụng và khắc phục sự cố.

Sử dụng các tài nguyên này sẽ không chỉ hướng dẫn bạn qua mọi thử thách mà còn giúp bạn cập nhật các xu hướng mới nhất và các phương pháp tốt nhất trong cộng đồng YOLO26.

Link to this sectionKết luận#

Trong hướng dẫn này, chúng ta đã xem xét kỹ lưỡng các chỉ số hiệu năng thiết yếu cho YOLO26. Những chỉ số này là chìa khóa để hiểu mức độ hoạt động của một model và là điều cần thiết đối với bất kỳ ai đang nhắm đến việc tinh chỉnh model của mình. Chúng cung cấp những thông tin cần thiết để cải tiến và đảm bảo model hoạt động hiệu quả trong các tình huống thực tế.

Hãy nhớ rằng, cộng đồng YOLO26 và Ultralytics là một tài sản vô giá. Việc tương tác với các nhà phát triển và chuyên gia khác có thể mở ra những kiến thức và giải pháp không có trong tài liệu tiêu chuẩn. Khi bạn hành trình cùng quá trình phát hiện đối tượng, hãy giữ vững tinh thần học hỏi, thử nghiệm các chiến lược mới và chia sẻ những phát hiện của mình. Bằng cách đó, bạn đóng góp vào trí tuệ chung của cộng đồng và đảm bảo sự phát triển của nó.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionÝ nghĩa của Mean Average Precision (mAP) trong việc đánh giá hiệu năng model YOLO26 là gì?#

Mean Average Precision (mAP) rất quan trọng để đánh giá các model YOLO26 vì nó cung cấp một chỉ số duy nhất bao hàm độ chính xác (precision) và độ thu hồi (recall) trên nhiều lớp. mAP@0.50 đo lường độ chính xác tại ngưỡng IoU là 0.50, tập trung vào khả năng phát hiện đối tượng chính xác của model. mAP@0.50:0.95 tính trung bình độ chính xác trên một phạm vi ngưỡng IoU, mang lại đánh giá toàn diện về hiệu suất phát hiện. Điểm mAP cao cho thấy model cân bằng hiệu quả giữa độ chính xác và độ thu hồi, điều này rất cần thiết cho các ứng dụng như autonomous driving và các hệ thống giám sát nơi cả việc phát hiện chính xác và giảm thiểu báo động giả đều mang tính quyết định.

Link to this sectionLàm thế nào để tôi diễn giải giá trị Intersection over Union (IoU) cho phát hiện đối tượng YOLO26?#

Intersection over Union (IoU) đo lường sự chồng lấp giữa các bounding box được dự đoán và ground truth. Các giá trị IoU nằm trong khoảng từ 0 đến 1, trong đó các giá trị cao hơn cho thấy độ chính xác định vị tốt hơn. IoU là 1.0 có nghĩa là căn chỉnh hoàn hảo. Thông thường, ngưỡng IoU là 0.50 được sử dụng để xác định các true positives trong các chỉ số như mAP. Các giá trị IoU thấp cho thấy model gặp khó khăn với việc định vị đối tượng chính xác, điều này có thể được cải thiện bằng cách tinh chỉnh hồi quy bounding box hoặc tăng độ chính xác của nhãn trong dataset training của bạn.

Link to this sectionTại sao F1 Score quan trọng để đánh giá các model YOLO26 trong phát hiện đối tượng?#

F1 Score rất quan trọng để đánh giá các model YOLO26 vì nó cung cấp trung bình điều hòa của độ chính xác và độ thu hồi, giúp cân bằng cả false positive và false negative. Chỉ số này đặc biệt có giá trị khi xử lý các tập dữ liệu mất cân bằng hoặc các ứng dụng mà chỉ riêng độ chính xác hoặc độ thu hồi là không đủ. F1 Score cao cho thấy model phát hiện đối tượng hiệu quả đồng thời giảm thiểu cả việc bỏ sót đối tượng và báo động giả, giúp nó phù hợp với các ứng dụng quan trọng như security systems và medical imaging.

Link to this sectionNhững lợi thế chính của việc sử dụng Ultralytics YOLO26 cho phát hiện đối tượng thời gian thực là gì?#

Ultralytics YOLO26 mang lại nhiều lợi thế cho phát hiện đối tượng thời gian thực:

Tốc độ và Hiệu quả: Được tối ưu hóa cho tốc độ inference cao, phù hợp cho các ứng dụng yêu cầu độ trễ thấp.
Độ chính xác cao: Thuật toán tiên tiến đảm bảo điểm mAP và IoU cao, cân bằng giữa precision và recall.
Sự linh hoạt: Hỗ trợ nhiều tác vụ bao gồm phát hiện đối tượng, segmentation đối tượng, semantic segmentation, và phân loại.
Dễ sử dụng: Giao diện thân thiện với người dùng, tài liệu mở rộng và tích hợp liền mạch với các công cụ như Ultralytics Platform (Platform Quickstart).

Điều này làm cho YOLO26 trở nên lý tưởng cho các ứng dụng đa dạng từ xe tự lái đến các giải pháp thành phố thông minh.

Link to this sectionCác chỉ số xác thực từ YOLO26 có thể giúp cải thiện hiệu năng model như thế nào?#

Các chỉ số xác thực từ YOLO26 như precision, recall, mAP và IoU giúp chẩn đoán và cải thiện hiệu năng model bằng cách cung cấp thông tin về các khía cạnh khác nhau của quá trình phát hiện:

Precision: Giúp xác định và giảm thiểu các trường hợp dương tính giả.
Recall: Đảm bảo tất cả các đối tượng liên quan đều được phát hiện.
mAP: Cung cấp bức tranh toàn cảnh về hiệu năng, dẫn dắt các cải tiến tổng thể.
IoU: Giúp tinh chỉnh độ chính xác định vị đối tượng.

Bằng cách phân tích các chỉ số này, các điểm yếu cụ thể có thể được nhắm mục tiêu, chẳng hạn như điều chỉnh ngưỡng tin cậy để cải thiện precision hoặc thu thập dữ liệu đa dạng hơn để tăng cường recall. Để biết giải thích chi tiết về các chỉ số này và cách diễn giải chúng, hãy kiểm tra Các chỉ số phát hiện đối tượng và cân nhắc việc thực hiện tinh chỉnh siêu tham số (hyperparameter tuning) để tối ưu hóa model của bạn.

Người đóng góp

GLglenn-jocher¹² RAraimbekovm² RIRizwanMunawar² MImiles-deans-ultralytics¹ PDpderrenger¹ Y-Y-T-G¹ WIWillieMaddox¹ LEleonnil¹

Đã tạo 12 thg 11, 2023Đã cập nhật tuần trước