Link to this sectionHiểu rõ các bước then chốt trong một dự án thị giác máy tính#

Xây dựng một dự án computer vision đồng nghĩa với việc đi qua một chuỗi các giai đoạn rõ ràng: xác định mục tiêu, thu thập và chú thích dữ liệu, huấn luyện và đánh giá model, sau đó triển khai và duy trì nó trong môi trường production. Hướng dẫn này sẽ đi qua từng bước theo thứ tự và giải thích lý do tại sao chúng quan trọng, giúp bạn có thể lập kế hoạch và vận hành dự án của riêng mình một cách tự tin.

Computer vision là một nhánh của artificial intelligence (AI) giúp máy tính có thể nhìn và hiểu thế giới giống như con người. Nó xử lý và phân tích hình ảnh hoặc video để trích xuất thông tin, nhận dạng các mẫu và đưa ra quyết định dựa trên dữ liệu đó.

Watch: How to Do Computer Vision Projects | A Step-by-Step Guide

Các kỹ thuật thị giác máy tính như object detection, image classification, và instance segmentation có thể được áp dụng trong nhiều ngành công nghiệp khác nhau, từ autonomous driving đến medical imaging để thu được những thông tin giá trị.

Link to this sectionTổng quan về một dự án thị giác máy tính#

Trước khi đi vào chi tiết từng bước trong một dự án thị giác máy tính, hãy cùng xem xét quy trình tổng thể. Nếu bạn bắt đầu một dự án thị giác máy tính hôm nay, bạn sẽ cần thực hiện các bước sau:

Ưu tiên đầu tiên của bạn là hiểu rõ các yêu cầu của dự án.
Sau đó, bạn thu thập và gán nhãn chính xác cho các hình ảnh sẽ giúp huấn luyện model của mình.
Tiếp theo, bạn làm sạch và tăng cường dữ liệu để chuẩn bị cho quá trình huấn luyện model.
Sau khi huấn luyện, bạn cần đánh giá và kiểm thử kỹ lưỡng model của mình để đảm bảo nó hoạt động ổn định trong các điều kiện khác nhau.
Cuối cùng, bạn triển khai model vào môi trường thực tế, đồng thời giám sát và bảo trì nó dựa trên các thông tin chuyên sâu và phản hồi mới.

Computer Vision Project Steps Overview

Bây giờ chúng ta đã biết những gì cần chuẩn bị, hãy đi sâu vào các bước để thúc đẩy dự án của bạn tiến xa hơn.

Link to this sectionBước 1: Xác định mục tiêu dự án#

Bước đầu tiên trong bất kỳ dự án thị giác máy tính nào là xác định rõ ràng vấn đề bạn đang cố gắng giải quyết. Biết được mục tiêu cuối cùng sẽ giúp bạn bắt đầu xây dựng giải pháp. Điều này đặc biệt quan trọng đối với thị giác máy tính vì mục tiêu dự án sẽ ảnh hưởng trực tiếp đến việc bạn cần tập trung vào tác vụ thị giác máy tính nào.

Dưới đây là một số ví dụ về mục tiêu dự án và các tác vụ thị giác máy tính có thể được sử dụng để đạt được những mục tiêu đó:

Mục tiêu: Phát triển hệ thống có khả năng giám sát và quản lý luồng các loại phương tiện khác nhau trên đường cao tốc, nhằm cải thiện công tác quản lý giao thông và an toàn.
- Tác vụ thị giác máy tính: Phát hiện đối tượng là lựa chọn lý tưởng cho giám sát giao thông vì nó định vị và nhận diện hiệu quả nhiều phương tiện cùng lúc. Nó đòi hỏi ít tài nguyên tính toán hơn so với phân đoạn hình ảnh vốn cung cấp chi tiết dư thừa không cần thiết cho tác vụ này, từ đó đảm bảo phân tích nhanh hơn theo thời gian thực.
Mục tiêu: Phát triển công cụ hỗ trợ các bác sĩ chẩn đoán hình ảnh bằng cách cung cấp đường viền chính xác theo từng điểm ảnh của các khối u trong các bản quét hình ảnh y tế.
- Tác vụ thị giác máy tính: Phân đoạn hình ảnh rất phù hợp cho hình ảnh y tế vì nó cung cấp ranh giới chi tiết và chính xác của khối u, yếu tố quan trọng cho việc đánh giá kích thước, hình dạng và lập kế hoạch điều trị.
Mục tiêu: Tạo hệ thống kỹ thuật số phân loại các tài liệu khác nhau (ví dụ: hóa đơn, biên lai, giấy tờ pháp lý) nhằm cải thiện hiệu quả tổ chức và việc truy xuất tài liệu.
- Tác vụ thị giác máy tính: Phân loại hình ảnh là lựa chọn lý tưởng ở đây vì nó xử lý từng tài liệu một mà không cần quan tâm đến vị trí của tài liệu trong ảnh. Phương pháp này giúp đơn giản hóa và tăng tốc quá trình phân loại.

Link to this sectionLựa chọn Model và Phương pháp Huấn luyện phù hợp#

Sau khi hiểu rõ mục tiêu dự án và các tác vụ thị giác máy tính phù hợp, một phần thiết yếu trong việc xác định mục tiêu dự án là chọn model đúng và cách tiếp cận huấn luyện.

Tùy thuộc vào mục tiêu, bạn có thể chọn model trước hoặc sau khi biết dữ liệu nào bạn có khả năng thu thập ở Bước 2. Ví dụ, giả sử dự án của bạn phụ thuộc rất nhiều vào sự sẵn có của các loại dữ liệu cụ thể. Trong trường hợp đó, có thể thực tế hơn nếu thu thập và phân tích dữ liệu trước khi chọn model. Mặt khác, nếu bạn nắm rõ các yêu cầu về model, bạn có thể chọn model trước rồi sau đó thu thập dữ liệu phù hợp với các thông số kỹ thuật đó.

Việc lựa chọn giữa huấn luyện từ đầu hoặc sử dụng học chuyển đổi (transfer learning) ảnh hưởng đến cách bạn chuẩn bị dữ liệu. Huấn luyện từ đầu đòi hỏi một tập dữ liệu đa dạng để xây dựng khả năng hiểu của model từ gốc. Ngược lại, học chuyển đổi cho phép bạn sử dụng một model đã được huấn luyện sẵn và thích nghi nó với một tập dữ liệu nhỏ hơn, cụ thể hơn. Ngoài ra, việc chọn một model cụ thể để huấn luyện sẽ xác định cách bạn cần chuẩn bị dữ liệu, chẳng hạn như thay đổi kích thước hình ảnh hoặc thêm chú thích, tùy theo yêu cầu cụ thể của model đó.

Training From Scratch Vs. Using Transfer Learning

Cân nhắc việc triển khai khi chọn model

Hãy xem xét mục tiêu triển khai của một model để đảm bảo tính tương thích và hiệu năng. Ví dụ, các model nhẹ rất lý tưởng cho edge computing nhờ khả năng hoạt động hiệu quả trên các thiết bị bị hạn chế về tài nguyên.

Để tìm hiểu thêm, hãy đọc hướng dẫn của chúng tôi về cách xác định mục tiêu dự án và chọn model phù hợp.

Trước khi đi vào công việc thực tế của một dự án thị giác máy tính, điều quan trọng là phải hiểu rõ những chi tiết này. Hãy kiểm tra lại xem bạn đã cân nhắc những điều sau trước khi chuyển sang Bước 2 chưa:

Xác định rõ vấn đề bạn đang cố gắng giải quyết.
Xác định mục tiêu cuối cùng của dự án.
Xác định tác vụ thị giác máy tính cụ thể cần thiết (ví dụ: phát hiện đối tượng, phân loại hình ảnh, phân đoạn hình ảnh).
Quyết định xem nên huấn luyện model từ đầu hay sử dụng học chuyển đổi.
Chọn model phù hợp cho tác vụ và nhu cầu triển khai của bạn.

Link to this sectionBước 2: Thu thập và gán nhãn dữ liệu#

Chất lượng của các model thị giác máy tính của bạn phụ thuộc vào chất lượng tập dữ liệu. Bạn có thể thu thập hình ảnh từ internet, tự chụp ảnh hoặc sử dụng các tập dữ liệu có sẵn. Dưới đây là một số tài nguyên tuyệt vời để tải xuống các tập dữ liệu chất lượng cao: Google Dataset Search Engine, UC Irvine Machine Learning Repository, và Kaggle Datasets.

Một số thư viện, chẳng hạn như Ultralytics, cung cấp hỗ trợ tích hợp sẵn cho nhiều tập dữ liệu khác nhau, giúp bạn dễ dàng bắt đầu với dữ liệu chất lượng cao. Các thư viện này thường bao gồm các tiện ích để sử dụng các tập dữ liệu phổ biến một cách liền mạch, giúp bạn tiết kiệm đáng kể thời gian và công sức trong các giai đoạn đầu của dự án.

Tuy nhiên, nếu bạn chọn tự thu thập hoặc tự chụp ảnh, bạn sẽ cần gán nhãn dữ liệu của mình. Gán nhãn dữ liệu (data annotation) là quá trình dán nhãn dữ liệu để truyền đạt kiến thức cho model. Loại gán nhãn dữ liệu bạn thực hiện sẽ phụ thuộc vào kỹ thuật thị giác máy tính cụ thể của bạn. Dưới đây là một số ví dụ:

Phân loại hình ảnh: Bạn sẽ gán nhãn cho toàn bộ hình ảnh thành một lớp duy nhất.
Phát hiện đối tượng: Bạn sẽ vẽ các khung bao quanh từng đối tượng trong hình ảnh và dán nhãn cho mỗi khung.
Phân đoạn hình ảnh: Bạn sẽ dán nhãn từng điểm ảnh trong hình ảnh theo đối tượng mà nó thuộc về, từ đó tạo ra ranh giới đối tượng chi tiết.

Bounding box, polygon, and keypoint annotations

Thu thập và chú thích dữ liệu có thể là một công việc thủ công tốn thời gian. Một công cụ chú thích chuyên dụng sẽ giúp quá trình này nhanh hơn: Ultralytics Platform cung cấp trình chỉnh sửa chú thích tích hợp với tính năng chú thích thông minh hỗ trợ bởi SAM cho dữ liệu detection, segmentation và OBB, cho phép lưu nhãn trực tiếp theo định dạng YOLO.

Link to this sectionBước 3: Tăng cường dữ liệu và phân chia tập dữ liệu#

Sau khi thu thập và gán nhãn dữ liệu hình ảnh, điều quan trọng là phải chia tập dữ liệu của bạn thành các tập huấn luyện, xác thực và kiểm thử trước khi thực hiện tăng cường dữ liệu (data augmentation). Việc chia tập dữ liệu trước khi tăng cường là rất quan trọng để kiểm tra và xác thực model trên dữ liệu gốc, chưa qua thay đổi. Điều này giúp đánh giá chính xác khả năng khái quát hóa của model đối với dữ liệu mới, chưa từng thấy.

Dưới đây là cách chia dữ liệu của bạn:

Tập huấn luyện (Training Set): Đây là phần lớn nhất trong dữ liệu của bạn, thường chiếm 70-80% tổng số, được sử dụng để huấn luyện model.
Tập xác thực (Validation Set): Thường chiếm khoảng 10-15% dữ liệu; tập này được sử dụng để tinh chỉnh siêu tham số và xác thực model trong quá trình huấn luyện, giúp ngăn ngừa quá mức (overfitting).
Tập kiểm thử (Test Set): 10-15% dữ liệu còn lại được dành riêng làm tập kiểm thử. Nó được sử dụng để đánh giá hiệu suất của model trên dữ liệu chưa từng thấy sau khi quá trình huấn luyện hoàn tất.

Sau khi chia dữ liệu, bạn có thể thực hiện tăng cường dữ liệu bằng cách áp dụng các phép biến đổi như xoay, thay đổi tỷ lệ và lật ảnh để tăng kích thước tập dữ liệu một cách nhân tạo. Tăng cường dữ liệu giúp model của bạn trở nên bền bỉ hơn với các biến thể và cải thiện hiệu suất trên các hình ảnh mới.

Data augmentation examples

Các thư viện như OpenCV, Albumentations, và TensorFlow cung cấp các hàm tăng cường linh hoạt mà bạn có thể sử dụng. Ngoài ra, một số thư viện, chẳng hạn như Ultralytics, có sẵn các cài đặt tăng cường tích hợp ngay trong hàm huấn luyện model, giúp đơn giản hóa quy trình này.

To understand your data better, you can use tools like Matplotlib or Seaborn to visualize the images and analyze their distribution and characteristics. Visualizing your data helps identify patterns, anomalies, and the effectiveness of your augmentation techniques. The Ultralytics Platform Charts tab can surface many of these insights without any code by automatically generating split distribution, class counts, image-dimension histograms, and annotation-position heatmaps for every uploaded dataset.

Bằng cách hiểu, phân tách và tăng cường dữ liệu của bạn một cách hợp lý, bạn có thể phát triển một model được huấn luyện, kiểm chứng và thử nghiệm kỹ lưỡng, đảm bảo hiệu suất tốt trong các ứng dụng thực tế.

Link to this sectionBước 4: Huấn luyện model#

Khi tập dữ liệu của bạn đã sẵn sàng cho việc huấn luyện, bạn có thể tập trung vào việc thiết lập môi trường cần thiết, quản lý tập dữ liệu và huấn luyện model.

Trước tiên, bạn cần đảm bảo môi trường của mình được cấu hình chính xác. Thông thường, việc này bao gồm các bước sau:

Cài đặt các thư viện và framework thiết yếu như TensorFlow, PyTorch, hoặc Ultralytics.
Nếu bạn đang sử dụng GPU, việc cài đặt các thư viện như CUDA và cuDNN sẽ giúp kích hoạt tính năng tăng tốc GPU và đẩy nhanh quá trình huấn luyện.

Sau đó, bạn có thể tải các tập dữ liệu huấn luyện và xác thực vào môi trường của mình. Chuẩn hóa và tiền xử lý dữ liệu thông qua thay đổi kích thước, chuyển đổi định dạng hoặc tăng cường. Với model đã chọn, hãy cấu hình các lớp và chỉ định siêu tham số. Biên dịch model bằng cách thiết lập hàm mất mát (loss function), trình tối ưu hóa và các chỉ số hiệu suất.

Các thư viện như Ultralytics giúp đơn giản hóa quá trình huấn luyện. Bạn có thể bắt đầu huấn luyện bằng cách nạp dữ liệu vào model với mã code tối thiểu. Các thư viện này tự động xử lý việc điều chỉnh trọng số, lan truyền ngược (backpropagation) và xác thực. Chúng cũng cung cấp các công cụ để theo dõi tiến trình và điều chỉnh siêu tham số một cách dễ dàng. Sau khi huấn luyện, hãy lưu model và trọng số của nó chỉ với vài lệnh.

Điều quan trọng cần ghi nhớ là quản lý tập dữ liệu đúng cách là yếu tố sống còn cho việc huấn luyện hiệu quả. Sử dụng kiểm soát phiên bản cho các tập dữ liệu để theo dõi các thay đổi và đảm bảo tính tái lập. Các công cụ như DVC (Data Version Control) có thể giúp quản lý các tập dữ liệu lớn.

Link to this sectionBước 5: Đánh giá và Tinh chỉnh Model#

Điều quan trọng là phải đánh giá hiệu suất của model bằng các chỉ số khác nhau và cải tiến nó để nâng cao độ chính xác (accuracy). Việc đánh giá (evaluating) giúp xác định những điểm model làm tốt và những điểm cần cải thiện. Tinh chỉnh (fine-tuning) đảm bảo model được tối ưu hóa để đạt hiệu suất tốt nhất có thể.

Chỉ số hiệu suất (Performance Metrics): Sử dụng các chỉ số như độ chính xác, độ chính xác (precision), độ thu hồi (recall) và F1-score để đánh giá hiệu suất của model. Các chỉ số này cung cấp thông tin chi tiết về mức độ dự đoán của model.
Tinh chỉnh siêu tham số (Hyperparameter Tuning): Điều chỉnh các siêu tham số để tối ưu hóa hiệu suất model. Các kỹ thuật như tìm kiếm lưới (grid search) hoặc tìm kiếm ngẫu nhiên (random search) có thể giúp tìm ra các giá trị siêu tham số tốt nhất.
Tinh chỉnh (Fine-Tuning): Thực hiện các điều chỉnh nhỏ đối với kiến trúc model hoặc quy trình huấn luyện để tăng cường hiệu suất. Điều này có thể bao gồm việc điều chỉnh tốc độ học (learning rates), kích thước batch (batch sizes), hoặc các tham số model khác.

Để hiểu sâu hơn về các kỹ thuật đánh giá và tinh chỉnh model, hãy xem hướng dẫn về các thông tin chuyên sâu trong đánh giá model của chúng tôi.

Link to this sectionBước 6: Kiểm thử model#

Kiểm thử model giúp xác nhận rằng model của bạn hoạt động tốt trên các dữ liệu hoàn toàn mới, từ đó xác minh mức độ sẵn sàng cho việc triển khai. Sự khác biệt giữa kiểm thử model và đánh giá model nằm ở chỗ kiểm thử tập trung vào việc xác nhận hiệu suất của model cuối cùng thay vì cải thiện nó một cách lặp đi lặp lại.

Điều quan trọng là phải kiểm thử và gỡ lỗi kỹ lưỡng bất kỳ vấn đề phổ biến nào có thể phát sinh. Kiểm thử model của bạn trên một tập dữ liệu kiểm thử riêng biệt không được sử dụng trong quá trình huấn luyện hoặc xác thực. Tập dữ liệu này phải đại diện cho các kịch bản thực tế để đảm bảo hiệu suất của model nhất quán và đáng tin cậy.

Ngoài ra, hãy giải quyết các vấn đề phổ biến như quá mức (overfitting), thiếu hụt (underfitting) và rò rỉ dữ liệu. Sử dụng các kỹ thuật như kiểm chứng chéo (cross-validation) và phát hiện bất thường (anomaly detection) để xác định và khắc phục các vấn đề này. Để có các chiến lược kiểm thử toàn diện, hãy tham khảo hướng dẫn kiểm thử model của chúng tôi.

Link to this sectionBước 7: Triển khai model#

Khi model của bạn đã được kiểm thử kỹ lưỡng, đã đến lúc triển khai nó. Triển khai model (model deployment) bao gồm việc làm cho model của bạn sẵn sàng để sử dụng trong môi trường sản xuất. Dưới đây là các bước để triển khai một model thị giác máy tính:

Thiết lập môi trường: Cấu hình cơ sở hạ tầng cần thiết cho tùy chọn triển khai bạn đã chọn, dù là dựa trên đám mây (AWS, Google Cloud, Azure) hay dựa trên thiết bị biên (thiết bị cục bộ, IoT).
Xuất model (Exporting): Xuất model của bạn sang định dạng thích hợp (ví dụ: ONNX, TensorRT, CoreML cho YOLO26) để đảm bảo tính tương thích với nền tảng triển khai của bạn.
Triển khai model: Triển khai model bằng cách thiết lập các API hoặc endpoint và tích hợp nó với ứng dụng của bạn.
Đảm bảo tính mở rộng: Triển khai bộ cân bằng tải, các nhóm tự động mở rộng (auto-scaling) và các công cụ giám sát để quản lý tài nguyên và xử lý dữ liệu cũng như yêu cầu người dùng ngày càng tăng.

Để biết hướng dẫn chi tiết hơn về các chiến lược triển khai và phương pháp thực hành tốt nhất, hãy xem hướng dẫn triển khai model của chúng tôi. Ultralytics Platform cũng cung cấp các điểm cuối triển khai được quản lý với tính năng tự động mở rộng trên 42 khu vực toàn cầu, giúp xử lý việc thiết lập cơ sở hạ tầng một cách tự động.

Link to this sectionBước 8: Giám sát, bảo trì và tài liệu hóa#

Khi model của bạn đã được triển khai, điều quan trọng là phải liên tục giám sát hiệu suất của nó, bảo trì để xử lý mọi vấn đề phát sinh và tài liệu hóa toàn bộ quy trình để tham khảo và cải tiến trong tương lai.

Các công cụ giám sát có thể giúp bạn theo dõi các chỉ số hiệu suất chính (KPI) và phát hiện các điểm bất thường hoặc sự sụt giảm độ chính xác. Bằng cách giám sát model, bạn có thể nhận biết được sự trôi dạt model (model drift), nơi hiệu suất của model suy giảm theo thời gian do các thay đổi trong dữ liệu đầu vào. Định kỳ huấn luyện lại model với dữ liệu cập nhật để duy trì độ chính xác và tính liên quan.

Model monitoring and maintenance lifecycle

Ngoài việc giám sát và bảo trì, tài liệu hóa cũng là chìa khóa. Hãy ghi chép kỹ lưỡng toàn bộ quy trình, bao gồm kiến trúc model, quy trình huấn luyện, siêu tham số, các bước tiền xử lý dữ liệu và bất kỳ thay đổi nào được thực hiện trong quá trình triển khai và bảo trì. Tài liệu tốt đảm bảo tính tái lập và giúp việc cập nhật hoặc khắc phục sự cố trong tương lai trở nên dễ dàng hơn. Bằng cách giám sát, bảo trì và tài liệu hóa model của bạn một cách hiệu quả, bạn có thể đảm bảo nó luôn chính xác, đáng tin cậy và dễ dàng quản lý trong suốt vòng đời của mình.

Link to this sectionTham gia cộng đồng#

Kết nối với một cộng đồng những người đam mê thị giác máy tính có thể giúp bạn giải quyết mọi vấn đề gặp phải khi làm việc trên dự án của mình một cách tự tin. Dưới đây là một số cách để học hỏi, khắc phục sự cố và kết nối hiệu quả.

Link to this sectionTài nguyên cộng đồng#

GitHub Issues: Hãy xem kho lưu trữ YOLO26 trên GitHub và sử dụng tab Issues để đặt câu hỏi, báo cáo lỗi và đề xuất các tính năng mới. Cộng đồng tích cực và các nhà bảo trì luôn sẵn sàng trợ giúp về các vấn đề cụ thể.
Máy chủ Ultralytics Discord: Tham gia máy chủ Discord của Ultralytics để tương tác với những người dùng và nhà phát triển khác, nhận hỗ trợ và chia sẻ kiến thức.

Link to this sectionTài liệu chính thức#

Tài liệu YOLO26 của Ultralytics: Khám phá tài liệu YOLO26 chính thức để biết các hướng dẫn chi tiết với các mẹo hữu ích về các tác vụ và dự án thị giác máy tính khác nhau.

Sử dụng các tài nguyên này sẽ giúp bạn vượt qua những thách thức và cập nhật các xu hướng cũng như các biện pháp thực hành tốt nhất mới nhất trong cộng đồng thị giác máy tính.

Link to this sectionCác bước tiếp theo#

Giờ đây, bạn đã có một lộ trình cho từng giai đoạn của một dự án computer vision, từ việc xác định mục tiêu đến giám sát một model đã được triển khai. Hãy đưa nó vào thực tế bằng cách huấn luyện model YOLO đầu tiên, hoặc tìm hiểu sâu hơn về bất kỳ giai đoạn nào thông qua các hướng dẫn được liên kết ở trên. Để chạy toàn bộ quy trình mà không cần viết code, hãy khám phá Ultralytics Platform.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionLàm thế nào để tôi chọn đúng tác vụ thị giác máy tính cho dự án của mình?#

Việc chọn đúng tác vụ thị giác máy tính phụ thuộc vào mục tiêu cuối cùng của dự án. Ví dụ, nếu bạn muốn giám sát giao thông, phát hiện đối tượng (object detection) là phù hợp vì nó có thể định vị và nhận diện nhiều loại phương tiện theo thời gian thực. Đối với chẩn đoán hình ảnh y tế, phân đoạn hình ảnh (image segmentation) là lý tưởng để cung cấp các đường viền chi tiết của khối u, hỗ trợ chẩn đoán và lập kế hoạch điều trị. Tìm hiểu thêm về các tác vụ cụ thể như phát hiện đối tượng, phân đoạn thực thể, phân đoạn ngữ nghĩa, và phân loại hình ảnh.

Link to this sectionTại sao việc gán nhãn dữ liệu lại quan trọng trong các dự án thị giác máy tính?#

Gán nhãn dữ liệu là yếu tố quan trọng để dạy model của bạn nhận diện các mẫu hình. Loại gán nhãn thay đổi tùy theo tác vụ:

Phân loại hình ảnh: Toàn bộ hình ảnh được dán nhãn thành một lớp duy nhất.
Phát hiện đối tượng: Các khung bao quanh được vẽ xung quanh các đối tượng.
Phân đoạn hình ảnh: Mỗi điểm ảnh được dán nhãn theo đối tượng mà nó thuộc về.

Trình chỉnh sửa chú thích tích hợp trong Ultralytics Platform có thể hỗ trợ bạn trong quy trình này. Để biết thêm chi tiết, vui lòng tham khảo hướng dẫn thu thập và chú thích dữ liệu của chúng tôi.

Link to this sectionTôi nên tuân theo những bước nào để tăng cường và phân chia tập dữ liệu của mình một cách hiệu quả?#

Việc chia tập dữ liệu trước khi tăng cường giúp xác thực hiệu suất model trên dữ liệu gốc, chưa qua thay đổi. Hãy làm theo các bước sau:

Tập huấn luyện: 70-80% dữ liệu của bạn.
Tập xác thực: 10-15% dành cho tinh chỉnh siêu tham số.
Tập kiểm thử: 10-15% còn lại dành cho đánh giá cuối cùng.

Sau khi chia tách, hãy áp dụng các kỹ thuật tăng cường dữ liệu như xoay, thay đổi tỷ lệ và lật để tăng tính đa dạng cho tập dữ liệu. Các thư viện như Albumentations và OpenCV có thể hỗ trợ điều này. Ultralytics cũng cung cấp các cài đặt tăng cường tích hợp để thuận tiện hơn.

Link to this sectionLàm thế nào để xuất model thị giác máy tính đã huấn luyện để triển khai?#

Xuất model đã huấn luyện của bạn bằng phương thức export và chọn định dạng phù hợp với mục tiêu triển khai của bạn. Ultralytics hỗ trợ nhiều định dạng, bao gồm ONNX, TensorRT và CoreML. Để xuất model YOLO26 của bạn, hãy làm theo các bước sau:

Sử dụng phương thức export với tham số định dạng mong muốn.
Đảm bảo rằng model đã xuất phù hợp với các thông số kỹ thuật của môi trường triển khai (ví dụ: thiết bị cạnh, đám mây).

Để biết thêm thông tin, hãy xem hướng dẫn xuất model.

Link to this sectionCác phương pháp hay nhất để giám sát và bảo trì model thị giác máy tính đã triển khai là gì?#

Giám sát và bảo trì liên tục là yếu tố cốt lõi cho sự thành công lâu dài của model. Hãy triển khai các công cụ để theo dõi Chỉ số Hiệu suất Chính (KPI) và phát hiện bất thường. Thường xuyên huấn luyện lại model với dữ liệu cập nhật để khắc phục hiện tượng trôi model (model drift). Ghi lại toàn bộ quy trình, bao gồm kiến trúc model, siêu tham số (hyperparameters) và các thay đổi, nhằm đảm bảo khả năng tái lập và thuận tiện cho việc cập nhật trong tương lai. Tìm hiểu thêm trong hướng dẫn giám sát và bảo trì của chúng tôi.

Người đóng góp

GLglenn-jocher¹⁷ RAraimbekovm⁴ RIRizwanMunawar³ Y-Y-T-G² ABabirami-vina² MImiles-deans-ultralytics¹ PDpderrenger¹ WIWillieMaddox¹ LEleonnil¹

Đã tạo 29 thg 5, 2024Đã cập nhật 2 giờ trước