Link to this sectionHiểu rõ các bước then chốt trong một dự án thị giác máy tính#
Link to this sectionGiới thiệu#
Thị giác máy tính là một nhánh con của trí tuệ nhân tạo (AI), giúp máy tính có khả năng quan sát và hiểu thế giới như con người. Nó xử lý và phân tích hình ảnh hoặc video để trích xuất thông tin, nhận diện các mẫu hình và đưa ra quyết định dựa trên dữ liệu đó.
Các kỹ thuật thị giác máy tính như phát hiện đối tượng, phân loại hình ảnh, và phân đoạn thực thể có thể được áp dụng trong nhiều ngành nghề, từ xe tự hành đến chẩn đoán hình ảnh y tế để thu được những thông tin chuyên sâu có giá trị.
Tự thực hiện các dự án thị giác máy tính là cách tuyệt vời để tìm hiểu và nắm vững lĩnh vực này. Tuy nhiên, một dự án thị giác máy tính có thể bao gồm nhiều bước và có vẻ khó hiểu lúc ban đầu. Đến cuối hướng dẫn này, bạn sẽ làm quen với các bước trong một dự án thị giác máy tính. Chúng ta sẽ đi qua mọi khía cạnh từ đầu đến cuối dự án và giải thích tầm quan trọng của từng phần.
Link to this sectionTổng quan về một dự án thị giác máy tính#
Trước khi đi vào chi tiết từng bước trong một dự án thị giác máy tính, hãy cùng xem xét quy trình tổng thể. Nếu bạn bắt đầu một dự án thị giác máy tính hôm nay, bạn sẽ cần thực hiện các bước sau:
- Ưu tiên hàng đầu của bạn là hiểu rõ các yêu cầu của dự án.
- Sau đó, bạn sẽ thu thập và gán nhãn chính xác các hình ảnh giúp huấn luyện model của mình.
- Tiếp theo, bạn sẽ làm sạch dữ liệu và áp dụng các kỹ thuật tăng cường dữ liệu để chuẩn bị cho quá trình huấn luyện model.
- Sau khi huấn luyện, bạn sẽ kiểm thử và đánh giá kỹ lưỡng model để đảm bảo nó hoạt động ổn định trong các điều kiện khác nhau.
- Cuối cùng, bạn sẽ triển khai model vào môi trường thực tế và cập nhật nó dựa trên các thông tin và phản hồi mới.
Bây giờ chúng ta đã biết những gì cần chuẩn bị, hãy đi sâu vào các bước để thúc đẩy dự án của bạn tiến xa hơn.
Link to this sectionBước 1: Xác định mục tiêu dự án#
Bước đầu tiên trong bất kỳ dự án thị giác máy tính nào là xác định rõ ràng vấn đề bạn đang cố gắng giải quyết. Biết được mục tiêu cuối cùng sẽ giúp bạn bắt đầu xây dựng giải pháp. Điều này đặc biệt quan trọng đối với thị giác máy tính vì mục tiêu dự án sẽ ảnh hưởng trực tiếp đến việc bạn cần tập trung vào tác vụ thị giác máy tính nào.
Dưới đây là một số ví dụ về mục tiêu dự án và các tác vụ thị giác máy tính có thể được sử dụng để đạt được những mục tiêu đó:
-
Mục tiêu: Phát triển hệ thống có khả năng giám sát và quản lý luồng các loại phương tiện khác nhau trên đường cao tốc, nhằm cải thiện công tác quản lý giao thông và an toàn.
- Tác vụ thị giác máy tính: Phát hiện đối tượng là lựa chọn lý tưởng cho giám sát giao thông vì nó định vị và nhận diện hiệu quả nhiều phương tiện cùng lúc. Nó đòi hỏi ít tài nguyên tính toán hơn so với phân đoạn hình ảnh vốn cung cấp chi tiết dư thừa không cần thiết cho tác vụ này, từ đó đảm bảo phân tích nhanh hơn theo thời gian thực.
-
Mục tiêu: Phát triển công cụ hỗ trợ các bác sĩ chẩn đoán hình ảnh bằng cách cung cấp đường viền chính xác theo từng điểm ảnh của các khối u trong các bản quét hình ảnh y tế.
- Tác vụ thị giác máy tính: Phân đoạn hình ảnh rất phù hợp cho hình ảnh y tế vì nó cung cấp ranh giới chi tiết và chính xác của khối u, yếu tố quan trọng cho việc đánh giá kích thước, hình dạng và lập kế hoạch điều trị.
-
Mục tiêu: Tạo hệ thống kỹ thuật số phân loại các tài liệu khác nhau (ví dụ: hóa đơn, biên lai, giấy tờ pháp lý) nhằm cải thiện hiệu quả tổ chức và việc truy xuất tài liệu.
- Tác vụ thị giác máy tính: Phân loại hình ảnh là lựa chọn lý tưởng ở đây vì nó xử lý từng tài liệu một mà không cần quan tâm đến vị trí của tài liệu trong ảnh. Phương pháp này giúp đơn giản hóa và tăng tốc quá trình phân loại.
Link to this sectionBước 1.5: Lựa chọn model phù hợp và cách tiếp cận huấn luyện#
Sau khi hiểu rõ mục tiêu dự án và các tác vụ thị giác máy tính phù hợp, một phần thiết yếu trong việc xác định mục tiêu dự án là chọn model đúng và cách tiếp cận huấn luyện.
Tùy thuộc vào mục tiêu, bạn có thể chọn model trước hoặc sau khi biết dữ liệu nào bạn có khả năng thu thập ở Bước 2. Ví dụ, giả sử dự án của bạn phụ thuộc rất nhiều vào sự sẵn có của các loại dữ liệu cụ thể. Trong trường hợp đó, có thể thực tế hơn nếu thu thập và phân tích dữ liệu trước khi chọn model. Mặt khác, nếu bạn nắm rõ các yêu cầu về model, bạn có thể chọn model trước rồi sau đó thu thập dữ liệu phù hợp với các thông số kỹ thuật đó.
Việc lựa chọn giữa huấn luyện từ đầu hoặc sử dụng học chuyển đổi (transfer learning) ảnh hưởng đến cách bạn chuẩn bị dữ liệu. Huấn luyện từ đầu đòi hỏi một tập dữ liệu đa dạng để xây dựng khả năng hiểu của model từ gốc. Ngược lại, học chuyển đổi cho phép bạn sử dụng một model đã được huấn luyện sẵn và thích nghi nó với một tập dữ liệu nhỏ hơn, cụ thể hơn. Ngoài ra, việc chọn một model cụ thể để huấn luyện sẽ xác định cách bạn cần chuẩn bị dữ liệu, chẳng hạn như thay đổi kích thước hình ảnh hoặc thêm chú thích, tùy theo yêu cầu cụ thể của model đó.
Lưu ý: Khi chọn model, hãy cân nhắc việc triển khai để đảm bảo tính tương thích và hiệu suất. Ví dụ, các model nhẹ rất lý tưởng cho điện toán biên (edge computing) do hiệu quả của chúng trên các thiết bị hạn chế về tài nguyên. Để tìm hiểu thêm về các điểm chính liên quan đến việc định nghĩa dự án, hãy đọc hướng dẫn của chúng tôi về cách xác định mục tiêu dự án và chọn model phù hợp.
Trước khi đi vào công việc thực tế của một dự án thị giác máy tính, điều quan trọng là phải hiểu rõ những chi tiết này. Hãy kiểm tra lại xem bạn đã cân nhắc những điều sau trước khi chuyển sang Bước 2 chưa:
- Xác định rõ vấn đề bạn đang cố gắng giải quyết.
- Xác định mục tiêu cuối cùng của dự án.
- Xác định tác vụ thị giác máy tính cụ thể cần thiết (ví dụ: phát hiện đối tượng, phân loại hình ảnh, phân đoạn hình ảnh).
- Quyết định xem nên huấn luyện model từ đầu hay sử dụng học chuyển đổi.
- Chọn model phù hợp cho tác vụ và nhu cầu triển khai của bạn.
Link to this sectionBước 2: Thu thập và gán nhãn dữ liệu#
Chất lượng của các model thị giác máy tính của bạn phụ thuộc vào chất lượng tập dữ liệu. Bạn có thể thu thập hình ảnh từ internet, tự chụp ảnh hoặc sử dụng các tập dữ liệu có sẵn. Dưới đây là một số tài nguyên tuyệt vời để tải xuống các tập dữ liệu chất lượng cao: Google Dataset Search Engine, UC Irvine Machine Learning Repository, và Kaggle Datasets.
Một số thư viện, chẳng hạn như Ultralytics, cung cấp hỗ trợ tích hợp sẵn cho nhiều tập dữ liệu khác nhau, giúp bạn dễ dàng bắt đầu với dữ liệu chất lượng cao. Các thư viện này thường bao gồm các tiện ích để sử dụng các tập dữ liệu phổ biến một cách liền mạch, giúp bạn tiết kiệm đáng kể thời gian và công sức trong các giai đoạn đầu của dự án.
Tuy nhiên, nếu bạn chọn tự thu thập hoặc tự chụp ảnh, bạn sẽ cần gán nhãn dữ liệu của mình. Gán nhãn dữ liệu (data annotation) là quá trình dán nhãn dữ liệu để truyền đạt kiến thức cho model. Loại gán nhãn dữ liệu bạn thực hiện sẽ phụ thuộc vào kỹ thuật thị giác máy tính cụ thể của bạn. Dưới đây là một số ví dụ:
- Phân loại hình ảnh: Bạn sẽ gán nhãn cho toàn bộ hình ảnh thành một lớp duy nhất.
- Phát hiện đối tượng: Bạn sẽ vẽ các khung bao quanh từng đối tượng trong hình ảnh và dán nhãn cho mỗi khung.
- Phân đoạn hình ảnh: Bạn sẽ dán nhãn từng điểm ảnh trong hình ảnh theo đối tượng mà nó thuộc về, từ đó tạo ra ranh giới đối tượng chi tiết.
Thu thập và gán nhãn dữ liệu có thể là một công việc thủ công tốn thời gian. Các công cụ gán nhãn có thể giúp quá trình này dễ dàng hơn. Dưới đây là một số công cụ gán nhãn mở hữu ích: Label Studio, CVAT, và Labelme.
Link to this sectionBước 3: Tăng cường dữ liệu và phân chia tập dữ liệu#
Sau khi thu thập và gán nhãn dữ liệu hình ảnh, điều quan trọng là phải chia tập dữ liệu của bạn thành các tập huấn luyện, xác thực và kiểm thử trước khi thực hiện tăng cường dữ liệu (data augmentation). Việc chia tập dữ liệu trước khi tăng cường là rất quan trọng để kiểm tra và xác thực model trên dữ liệu gốc, chưa qua thay đổi. Điều này giúp đánh giá chính xác khả năng khái quát hóa của model đối với dữ liệu mới, chưa từng thấy.
Dưới đây là cách chia dữ liệu của bạn:
- Tập huấn luyện (Training Set): Đây là phần lớn nhất trong dữ liệu của bạn, thường chiếm 70-80% tổng số, được sử dụng để huấn luyện model.
- Tập xác thực (Validation Set): Thường chiếm khoảng 10-15% dữ liệu; tập này được sử dụng để tinh chỉnh siêu tham số và xác thực model trong quá trình huấn luyện, giúp ngăn ngừa quá mức (overfitting).
- Tập kiểm thử (Test Set): 10-15% dữ liệu còn lại được dành riêng làm tập kiểm thử. Nó được sử dụng để đánh giá hiệu suất của model trên dữ liệu chưa từng thấy sau khi quá trình huấn luyện hoàn tất.
Sau khi chia dữ liệu, bạn có thể thực hiện tăng cường dữ liệu bằng cách áp dụng các phép biến đổi như xoay, thay đổi tỷ lệ và lật ảnh để tăng kích thước tập dữ liệu một cách nhân tạo. Tăng cường dữ liệu giúp model của bạn trở nên bền bỉ hơn với các biến thể và cải thiện hiệu suất trên các hình ảnh mới.
Các thư viện như OpenCV, Albumentations, và TensorFlow cung cấp các hàm tăng cường linh hoạt mà bạn có thể sử dụng. Ngoài ra, một số thư viện, chẳng hạn như Ultralytics, có sẵn các cài đặt tăng cường tích hợp ngay trong hàm huấn luyện model, giúp đơn giản hóa quy trình này.
To understand your data better, you can use tools like Matplotlib or Seaborn to visualize the images and analyze their distribution and characteristics. Visualizing your data helps identify patterns, anomalies, and the effectiveness of your augmentation techniques. The Ultralytics Platform Charts tab can surface many of these insights without any code by automatically generating split distribution, class counts, image-dimension histograms, and annotation-position heatmaps for every uploaded dataset.
Bằng cách hiểu, chia nhỏ và tăng cường dữ liệu của bạn một cách hợp lý, bạn có thể phát triển một model đã được huấn luyện, xác thực và kiểm thử kỹ lưỡng, hoạt động hiệu quả trong các ứng dụng thực tế.
Link to this sectionBước 4: Huấn luyện model#
Khi tập dữ liệu của bạn đã sẵn sàng cho việc huấn luyện, bạn có thể tập trung vào việc thiết lập môi trường cần thiết, quản lý tập dữ liệu và huấn luyện model.
Trước tiên, bạn cần đảm bảo môi trường của mình được cấu hình chính xác. Thông thường, việc này bao gồm các bước sau:
- Cài đặt các thư viện và framework thiết yếu như TensorFlow, PyTorch, hoặc Ultralytics.
- Nếu bạn đang sử dụng GPU, việc cài đặt các thư viện như CUDA và cuDNN sẽ giúp kích hoạt tính năng tăng tốc GPU và đẩy nhanh quá trình huấn luyện.
Sau đó, bạn có thể tải các tập dữ liệu huấn luyện và xác thực vào môi trường của mình. Chuẩn hóa và tiền xử lý dữ liệu thông qua thay đổi kích thước, chuyển đổi định dạng hoặc tăng cường. Với model đã chọn, hãy cấu hình các lớp và chỉ định siêu tham số. Biên dịch model bằng cách thiết lập hàm mất mát (loss function), trình tối ưu hóa và các chỉ số hiệu suất.
Các thư viện như Ultralytics giúp đơn giản hóa quá trình huấn luyện. Bạn có thể bắt đầu huấn luyện bằng cách nạp dữ liệu vào model với mã code tối thiểu. Các thư viện này tự động xử lý việc điều chỉnh trọng số, lan truyền ngược (backpropagation) và xác thực. Chúng cũng cung cấp các công cụ để theo dõi tiến trình và điều chỉnh siêu tham số một cách dễ dàng. Sau khi huấn luyện, hãy lưu model và trọng số của nó chỉ với vài lệnh.
Điều quan trọng cần ghi nhớ là quản lý tập dữ liệu đúng cách là yếu tố sống còn cho việc huấn luyện hiệu quả. Sử dụng kiểm soát phiên bản cho các tập dữ liệu để theo dõi các thay đổi và đảm bảo tính tái lập. Các công cụ như DVC (Data Version Control) có thể giúp quản lý các tập dữ liệu lớn.
Link to this sectionBước 5: Đánh giá và tinh chỉnh model#
Điều quan trọng là phải đánh giá hiệu suất của model bằng các chỉ số khác nhau và cải tiến nó để nâng cao độ chính xác (accuracy). Việc đánh giá (evaluating) giúp xác định những điểm model làm tốt và những điểm cần cải thiện. Tinh chỉnh (fine-tuning) đảm bảo model được tối ưu hóa để đạt hiệu suất tốt nhất có thể.
- Chỉ số hiệu suất (Performance Metrics): Sử dụng các chỉ số như độ chính xác, độ chính xác (precision), độ thu hồi (recall) và F1-score để đánh giá hiệu suất của model. Các chỉ số này cung cấp thông tin chi tiết về mức độ dự đoán của model.
- Tinh chỉnh siêu tham số (Hyperparameter Tuning): Điều chỉnh các siêu tham số để tối ưu hóa hiệu suất model. Các kỹ thuật như tìm kiếm lưới (grid search) hoặc tìm kiếm ngẫu nhiên (random search) có thể giúp tìm ra các giá trị siêu tham số tốt nhất.
- Tinh chỉnh (Fine-Tuning): Thực hiện các điều chỉnh nhỏ đối với kiến trúc model hoặc quy trình huấn luyện để tăng cường hiệu suất. Điều này có thể bao gồm việc điều chỉnh tốc độ học (learning rates), kích thước batch (batch sizes), hoặc các tham số model khác.
Để hiểu sâu hơn về các kỹ thuật đánh giá và tinh chỉnh model, hãy xem hướng dẫn về các thông tin chuyên sâu trong đánh giá model của chúng tôi.
Link to this sectionBước 6: Kiểm thử model#
Trong bước này, bạn có thể đảm bảo rằng model của mình hoạt động tốt trên dữ liệu hoàn toàn mới, xác nhận tính sẵn sàng để triển khai. Sự khác biệt giữa kiểm thử model và đánh giá model là bước này tập trung vào việc xác minh hiệu suất của model cuối cùng thay vì cải tiến nó theo hướng lặp lại.
Điều quan trọng là phải kiểm thử và gỡ lỗi kỹ lưỡng bất kỳ vấn đề phổ biến nào có thể phát sinh. Kiểm thử model của bạn trên một tập dữ liệu kiểm thử riêng biệt không được sử dụng trong quá trình huấn luyện hoặc xác thực. Tập dữ liệu này phải đại diện cho các kịch bản thực tế để đảm bảo hiệu suất của model nhất quán và đáng tin cậy.
Ngoài ra, hãy giải quyết các vấn đề phổ biến như quá mức (overfitting), thiếu hụt (underfitting) và rò rỉ dữ liệu. Sử dụng các kỹ thuật như kiểm chứng chéo (cross-validation) và phát hiện bất thường (anomaly detection) để xác định và khắc phục các vấn đề này. Để có các chiến lược kiểm thử toàn diện, hãy tham khảo hướng dẫn kiểm thử model của chúng tôi.
Link to this sectionBước 7: Triển khai model#
Khi model của bạn đã được kiểm thử kỹ lưỡng, đã đến lúc triển khai nó. Triển khai model (model deployment) bao gồm việc làm cho model của bạn sẵn sàng để sử dụng trong môi trường sản xuất. Dưới đây là các bước để triển khai một model thị giác máy tính:
- Thiết lập môi trường: Cấu hình cơ sở hạ tầng cần thiết cho tùy chọn triển khai bạn đã chọn, dù là dựa trên đám mây (AWS, Google Cloud, Azure) hay dựa trên thiết bị biên (thiết bị cục bộ, IoT).
- Xuất model (Exporting): Xuất model của bạn sang định dạng thích hợp (ví dụ: ONNX, TensorRT, CoreML cho YOLO26) để đảm bảo tính tương thích với nền tảng triển khai của bạn.
- Triển khai model: Triển khai model bằng cách thiết lập các API hoặc endpoint và tích hợp nó với ứng dụng của bạn.
- Đảm bảo tính mở rộng: Triển khai bộ cân bằng tải, các nhóm tự động mở rộng (auto-scaling) và các công cụ giám sát để quản lý tài nguyên và xử lý dữ liệu cũng như yêu cầu người dùng ngày càng tăng.
Để có hướng dẫn chi tiết hơn về các chiến lược triển khai và các biện pháp thực hành tốt nhất, hãy xem hướng dẫn thực hành triển khai model của chúng tôi. Nền tảng Ultralytics cũng cung cấp các endpoint triển khai được quản lý với khả năng tự động mở rộng trên 43 khu vực toàn cầu, giúp xử lý việc thiết lập cơ sở hạ tầng một cách tự động.
Link to this sectionBước 8: Giám sát, bảo trì và tài liệu hóa#
Khi model của bạn đã được triển khai, điều quan trọng là phải liên tục giám sát hiệu suất của nó, bảo trì để xử lý mọi vấn đề phát sinh và tài liệu hóa toàn bộ quy trình để tham khảo và cải tiến trong tương lai.
Các công cụ giám sát có thể giúp bạn theo dõi các chỉ số hiệu suất chính (KPI) và phát hiện các điểm bất thường hoặc sự sụt giảm độ chính xác. Bằng cách giám sát model, bạn có thể nhận biết được sự trôi dạt model (model drift), nơi hiệu suất của model suy giảm theo thời gian do các thay đổi trong dữ liệu đầu vào. Định kỳ huấn luyện lại model với dữ liệu cập nhật để duy trì độ chính xác và tính liên quan.
Ngoài việc giám sát và bảo trì, tài liệu hóa cũng là chìa khóa. Hãy ghi chép kỹ lưỡng toàn bộ quy trình, bao gồm kiến trúc model, quy trình huấn luyện, siêu tham số, các bước tiền xử lý dữ liệu và bất kỳ thay đổi nào được thực hiện trong quá trình triển khai và bảo trì. Tài liệu tốt đảm bảo tính tái lập và giúp việc cập nhật hoặc khắc phục sự cố trong tương lai trở nên dễ dàng hơn. Bằng cách giám sát, bảo trì và tài liệu hóa model của bạn một cách hiệu quả, bạn có thể đảm bảo nó luôn chính xác, đáng tin cậy và dễ dàng quản lý trong suốt vòng đời của mình.
Link to this sectionTham gia cộng đồng#
Kết nối với một cộng đồng những người đam mê thị giác máy tính có thể giúp bạn giải quyết mọi vấn đề gặp phải khi làm việc trên dự án của mình một cách tự tin. Dưới đây là một số cách để học hỏi, khắc phục sự cố và kết nối hiệu quả.
Link to this sectionTài nguyên cộng đồng#
- GitHub Issues: Hãy xem kho lưu trữ YOLO26 trên GitHub và sử dụng tab Issues để đặt câu hỏi, báo cáo lỗi và đề xuất các tính năng mới. Cộng đồng tích cực và các nhà bảo trì luôn sẵn sàng trợ giúp về các vấn đề cụ thể.
- Máy chủ Ultralytics Discord: Tham gia máy chủ Discord của Ultralytics để tương tác với những người dùng và nhà phát triển khác, nhận hỗ trợ và chia sẻ kiến thức.
Link to this sectionTài liệu chính thức#
- Tài liệu YOLO26 của Ultralytics: Khám phá tài liệu YOLO26 chính thức để biết các hướng dẫn chi tiết với các mẹo hữu ích về các tác vụ và dự án thị giác máy tính khác nhau.
Sử dụng các tài nguyên này sẽ giúp bạn vượt qua những thách thức và cập nhật các xu hướng cũng như các biện pháp thực hành tốt nhất mới nhất trong cộng đồng thị giác máy tính.
Link to this sectionCác bước tiếp theo#
Tham gia một dự án thị giác máy tính có thể là trải nghiệm thú vị và bổ ích. Bằng cách làm theo các bước trong hướng dẫn này, bạn có thể xây dựng nền tảng vững chắc để thành công. Mỗi bước đều rất quan trọng để phát triển một giải pháp đáp ứng mục tiêu của bạn và hoạt động hiệu quả trong các kịch bản thực tế. Khi có thêm kinh nghiệm, bạn sẽ khám phá ra các kỹ thuật và công cụ tiên tiến để cải thiện dự án của mình.
Link to this sectionCâu hỏi thường gặp#
Link to this sectionLàm thế nào để tôi chọn đúng tác vụ thị giác máy tính cho dự án của mình?#
Việc chọn đúng tác vụ thị giác máy tính phụ thuộc vào mục tiêu cuối cùng của dự án. Ví dụ, nếu bạn muốn giám sát giao thông, phát hiện đối tượng (object detection) là phù hợp vì nó có thể định vị và nhận diện nhiều loại phương tiện theo thời gian thực. Đối với chẩn đoán hình ảnh y tế, phân đoạn hình ảnh (image segmentation) là lý tưởng để cung cấp các đường viền chi tiết của khối u, hỗ trợ chẩn đoán và lập kế hoạch điều trị. Tìm hiểu thêm về các tác vụ cụ thể như phát hiện đối tượng, phân đoạn thực thể, phân đoạn ngữ nghĩa, và phân loại hình ảnh.
Link to this sectionTại sao việc gán nhãn dữ liệu lại quan trọng trong các dự án thị giác máy tính?#
Gán nhãn dữ liệu là yếu tố quan trọng để dạy model của bạn nhận diện các mẫu hình. Loại gán nhãn thay đổi tùy theo tác vụ:
- Phân loại hình ảnh: Toàn bộ hình ảnh được dán nhãn thành một lớp duy nhất.
- Phát hiện đối tượng: Các khung bao quanh được vẽ xung quanh các đối tượng.
- Phân đoạn hình ảnh: Mỗi điểm ảnh được dán nhãn theo đối tượng mà nó thuộc về.
Các công cụ như Label Studio, CVAT, và Labelme có thể hỗ trợ trong quá trình này. Để biết thêm chi tiết, hãy tham khảo hướng dẫn thu thập và gán nhãn dữ liệu của chúng tôi.
Link to this sectionTôi nên tuân theo những bước nào để tăng cường và phân chia tập dữ liệu của mình một cách hiệu quả?#
Việc chia tập dữ liệu trước khi tăng cường giúp xác thực hiệu suất model trên dữ liệu gốc, chưa qua thay đổi. Hãy làm theo các bước sau:
- Tập huấn luyện: 70-80% dữ liệu của bạn.
- Tập xác thực: 10-15% dành cho tinh chỉnh siêu tham số.
- Tập kiểm thử: 10-15% còn lại dành cho đánh giá cuối cùng.
Sau khi chia tách, hãy áp dụng các kỹ thuật tăng cường dữ liệu như xoay, thay đổi tỷ lệ và lật để tăng tính đa dạng cho tập dữ liệu. Các thư viện như Albumentations và OpenCV có thể hỗ trợ điều này. Ultralytics cũng cung cấp các cài đặt tăng cường tích hợp để thuận tiện hơn.
Link to this sectionLàm thế nào để xuất model thị giác máy tính đã huấn luyện để triển khai?#
Việc xuất model giúp đảm bảo tính tương thích với các nền tảng triển khai khác nhau. Ultralytics cung cấp nhiều định dạng, bao gồm ONNX, TensorRT và CoreML. Để xuất model YOLO26 của bạn, hãy làm theo hướng dẫn này:
- Sử dụng hàm
exportvới tham số định dạng mong muốn. - Đảm bảo rằng model đã xuất phù hợp với các thông số kỹ thuật của môi trường triển khai (ví dụ: thiết bị cạnh, đám mây).
Để biết thêm thông tin, hãy xem hướng dẫn xuất model.
Link to this sectionCác phương pháp hay nhất để giám sát và bảo trì model thị giác máy tính đã triển khai là gì?#
Giám sát và bảo trì liên tục là yếu tố cốt lõi cho sự thành công lâu dài của model. Hãy triển khai các công cụ để theo dõi Chỉ số Hiệu suất Chính (KPI) và phát hiện bất thường. Thường xuyên huấn luyện lại model với dữ liệu cập nhật để khắc phục hiện tượng trôi model (model drift). Ghi lại toàn bộ quy trình, bao gồm kiến trúc model, siêu tham số (hyperparameters) và các thay đổi, nhằm đảm bảo khả năng tái lập và thuận tiện cho việc cập nhật trong tương lai. Tìm hiểu thêm trong hướng dẫn giám sát và bảo trì của chúng tôi.