Các phương pháp hay nhất và mẹo đào tạo mô hình trong Học máy
Giới thiệu
Một trong những bước quan trọng nhất khi làm việc với dự án thị giác máy tính là đào tạo mô hình. Trước khi thực hiện bước này, bạn cần xác định mục tiêu và thu thập cũng như gắn nhãn dữ liệu của mình. Sau khi tiền xử lý dữ liệu để đảm bảo dữ liệu sạch và nhất quán, bạn có thể chuyển sang bước đào tạo mô hình.
Watch: Model Training Tips | How to Handle Large Datasets | Batch Size, GPU Utilization and Mixed Precision
Vậy, đào tạo mô hình là gì? Đào tạo mô hình là quá trình dạy cho mô hình của bạn nhận diện các mẫu hình ảnh và đưa ra dự đoán dựa trên dữ liệu. Nó ảnh hưởng trực tiếp đến hiệu suất và độ chính xác của ứng dụng. Trong hướng dẫn này, chúng tôi sẽ đề cập đến các phương pháp hay nhất, kỹ thuật tối ưu hóa và mẹo khắc phục sự cố để giúp bạn đào tạo các mô hình thị giác máy tính một cách hiệu quả.
Cách đào tạo một mô hình Học máy
Một mô hình thị giác máy tính được đào tạo bằng cách điều chỉnh các tham số nội bộ để giảm thiểu sai số. Ban đầu, mô hình được cung cấp một tập hợp lớn các hình ảnh đã gắn nhãn. Nó đưa ra dự đoán về nội dung trong các hình ảnh này, sau đó các dự đoán được so sánh với các nhãn hoặc nội dung thực tế để tính toán sai số. Các sai số này cho thấy mức độ lệch giữa dự đoán của mô hình và giá trị thực tế.
Trong quá trình đào tạo, mô hình lặp lại việc đưa ra dự đoán, tính toán sai số và cập nhật các tham số thông qua một quy trình gọi là lan truyền ngược. Trong quy trình này, mô hình điều chỉnh các tham số nội bộ (trọng số và độ lệch) để giảm thiểu sai số. Bằng cách lặp lại chu kỳ này nhiều lần, mô hình dần dần cải thiện độ chính xác. Theo thời gian, nó học cách nhận diện các mẫu phức tạp như hình dạng, màu sắc và kết cấu.
Quá trình học này giúp mô hình thị giác máy tính có thể thực hiện nhiều tác vụ khác nhau, bao gồm phát hiện đối tượng, phân đoạn cá thể và phân loại hình ảnh. Mục tiêu cuối cùng là tạo ra một mô hình có khả năng tổng quát hóa kiến thức cho những hình ảnh mới, chưa từng thấy, để có thể hiểu dữ liệu hình ảnh một cách chính xác trong các ứng dụng thực tế.
Giờ đây, khi đã biết những gì diễn ra đằng sau hậu trường khi chúng ta đào tạo một mô hình, hãy cùng xem xét các điểm cần chú ý khi đào tạo mô hình.
Đào tạo trên các tập dữ liệu lớn
Có một vài khía cạnh khác nhau cần suy nghĩ khi bạn dự định sử dụng tập dữ liệu lớn để đào tạo mô hình. Ví dụ, bạn có thể điều chỉnh kích thước batch, kiểm soát mức sử dụng GPU, chọn sử dụng đào tạo đa quy mô (multiscale), v.v. Hãy cùng đi sâu vào từng tùy chọn này một cách chi tiết.
Kích thước Batch và Mức sử dụng GPU
Khi đào tạo mô hình trên các tập dữ liệu lớn, việc sử dụng GPU hiệu quả là yếu tố then chốt. Kích thước batch là một yếu tố quan trọng. Đây là số lượng mẫu dữ liệu mà một mô hình học máy xử lý trong một vòng lặp đào tạo. Bằng cách sử dụng kích thước batch tối đa mà GPU hỗ trợ, bạn có thể tận dụng tối đa khả năng của nó và giảm thời gian đào tạo mô hình. Tuy nhiên, bạn cần tránh tình trạng hết bộ nhớ GPU. Nếu bạn gặp lỗi bộ nhớ, hãy giảm dần kích thước batch cho đến khi mô hình đào tạo mượt mà.
Watch: How to Use Batch Inference with Ultralytics YOLO26 | Speed Up Object Detection in Python 🎉
Đối với YOLO26, bạn có thể đặt tham số batch_size trong cấu hình đào tạo để phù hợp với dung lượng GPU của mình. Ngoài ra, việc thiết lập batch=-1 trong tập lệnh đào tạo của bạn sẽ tự động xác định kích thước batch có thể được xử lý hiệu quả dựa trên khả năng của thiết bị. Bằng cách tinh chỉnh kích thước batch, bạn có thể tận dụng tối đa tài nguyên GPU và cải thiện quy trình đào tạo tổng thể.
Đào tạo tập con (Subset Training)
Đào tạo tập con là một chiến lược thông minh bao gồm việc đào tạo mô hình trên một tập hợp dữ liệu nhỏ hơn đại diện cho tập dữ liệu lớn hơn. Nó có thể tiết kiệm thời gian và tài nguyên, đặc biệt là trong giai đoạn phát triển và thử nghiệm mô hình ban đầu. Nếu bạn đang thiếu thời gian hoặc đang thử nghiệm với các cấu hình mô hình khác nhau, đào tạo tập con là một lựa chọn tốt.
Khi nói đến YOLO26, bạn có thể dễ dàng triển khai đào tạo tập con bằng cách sử dụng tham số fraction. Tham số này cho phép bạn chỉ định phần nào của tập dữ liệu sẽ được sử dụng để đào tạo. Ví dụ, đặt fraction=0.1 sẽ đào tạo mô hình của bạn trên 10% dữ liệu. Bạn có thể sử dụng kỹ thuật này để lặp lại nhanh và tinh chỉnh mô hình trước khi cam kết đào tạo mô hình bằng tập dữ liệu đầy đủ. Đào tạo tập con giúp bạn đạt được tiến độ nhanh chóng và xác định các vấn đề tiềm ẩn từ sớm.
Đào tạo đa quy mô (Multi-scale Training)
Đào tạo đa quy mô là một kỹ thuật cải thiện khả năng tổng quát hóa của mô hình bằng cách đào tạo nó trên các hình ảnh có kích thước khác nhau. Mô hình của bạn có thể học cách phát hiện đối tượng ở các quy mô và khoảng cách khác nhau và trở nên mạnh mẽ hơn.
Ví dụ, khi bạn đào tạo YOLO26, bạn có thể kích hoạt đào tạo đa quy mô bằng cách đặt tham số scale. Tham số này điều chỉnh kích thước hình ảnh đào tạo theo một hệ số xác định, mô phỏng các đối tượng ở các khoảng cách khác nhau. Ví dụ, đặt scale=0.5 sẽ phóng to/thu nhỏ hình ảnh đào tạo ngẫu nhiên theo hệ số từ 0.5 đến 1.5 trong quá trình đào tạo. Việc cấu hình tham số này cho phép mô hình của bạn trải nghiệm nhiều quy mô hình ảnh khác nhau và cải thiện khả năng phát hiện trên các kích thước đối tượng và kịch bản khác nhau.
Ultralytics cũng hỗ trợ đào tạo đa quy mô kích thước hình ảnh thông qua tham số multi_scale. Không giống như scale (phóng to/thu nhỏ hình ảnh rồi chèn đệm/cắt về imgsz), multi_scale thay đổi chính imgsz cho mỗi batch (được làm tròn theo bước nhảy của mô hình). Ví dụ, với imgsz=640 và multi_scale=0.25, kích thước đào tạo được lấy mẫu từ 480 đến 800 theo các bước nhảy (ví dụ: 480, 512, 544, ..., 800), trong khi multi_scale=0.0 sẽ giữ kích thước cố định.
Bộ nhớ đệm (Caching)
Caching là một kỹ thuật quan trọng để cải thiện hiệu quả đào tạo mô hình học máy. Bằng cách lưu trữ các hình ảnh đã tiền xử lý vào bộ nhớ, caching giảm thời gian GPU phải chờ dữ liệu được tải từ ổ đĩa. Mô hình có thể liên tục nhận dữ liệu mà không bị chậm trễ do các thao tác I/O ổ đĩa.
Caching có thể được kiểm soát khi đào tạo YOLO26 bằng cách sử dụng tham số cache:
cache=True: Lưu trữ hình ảnh tập dữ liệu trong RAM, cung cấp tốc độ truy cập nhanh nhất nhưng phải trả giá bằng việc tăng mức sử dụng bộ nhớ.cache='disk': Lưu trữ hình ảnh trên ổ đĩa, chậm hơn RAM nhưng nhanh hơn việc tải dữ liệu mới mỗi lần.cache=False: Tắt caching, dựa hoàn toàn vào I/O ổ đĩa, đây là tùy chọn chậm nhất.
Đào tạo hỗn hợp độ chính xác (Mixed Precision Training)
Đào tạo hỗn hợp độ chính xác sử dụng cả kiểu số dấu phẩy động 16-bit (FP16) và 32-bit (FP32). Điểm mạnh của cả FP16 và FP32 được tận dụng bằng cách sử dụng FP16 để tính toán nhanh hơn và FP32 để duy trì độ chính xác khi cần. Hầu hết các hoạt động của mạng thần kinh được thực hiện ở FP16 để hưởng lợi từ việc tính toán nhanh hơn và mức sử dụng bộ nhớ thấp hơn. Tuy nhiên, một bản sao chính của trọng số mô hình được giữ ở FP32 để đảm bảo độ chính xác trong các bước cập nhật trọng số. Bạn có thể xử lý các mô hình lớn hơn hoặc kích thước batch lớn hơn trong cùng giới hạn phần cứng.
Để triển khai đào tạo hỗn hợp độ chính xác, bạn cần sửa đổi tập lệnh đào tạo của mình và đảm bảo phần cứng (như GPU) hỗ trợ. Nhiều khung học sâu hiện đại, chẳng hạn như PyTorch và TensorFlow, cung cấp hỗ trợ tích hợp cho hỗn hợp độ chính xác.
Đào tạo hỗn hợp độ chính xác rất đơn giản khi làm việc với YOLO26. Bạn có thể sử dụng flag amp trong cấu hình đào tạo của mình. Đặt amp=True sẽ kích hoạt đào tạo Automatic Mixed Precision (AMP). Đào tạo hỗn hợp độ chính xác là một cách đơn giản nhưng hiệu quả để tối ưu hóa quy trình đào tạo mô hình của bạn.
Weights Tiền huấn luyện
Sử dụng trọng số tiền huấn luyện là một cách thông minh để tăng tốc quá trình đào tạo mô hình. Trọng số tiền huấn luyện đến từ các mô hình đã được đào tạo trên các tập dữ liệu lớn, mang lại cho mô hình của bạn một khởi đầu thuận lợi. Học chuyển đổi thích nghi các mô hình tiền huấn luyện cho các tác vụ mới, liên quan. Việc tinh chỉnh một mô hình tiền huấn luyện bao gồm việc bắt đầu với các trọng số này và sau đó tiếp tục đào tạo trên tập dữ liệu cụ thể của bạn. Phương pháp đào tạo này giúp thời gian đào tạo nhanh hơn và thường có hiệu suất tốt hơn vì mô hình bắt đầu với hiểu biết vững chắc về các tính năng cơ bản.
Tham số pretrained giúp việc học chuyển đổi trở nên dễ dàng với YOLO26. Đặt pretrained=True sẽ sử dụng trọng số tiền huấn luyện mặc định, hoặc bạn có thể chỉ định đường dẫn đến một mô hình tiền huấn luyện tùy chỉnh. Việc sử dụng trọng số tiền huấn luyện và học chuyển đổi giúp tăng cường hiệu quả các khả năng của mô hình và giảm chi phí đào tạo.
Các kỹ thuật khác cần xem xét khi xử lý tập dữ liệu lớn
Có một vài kỹ thuật khác cần xem xét khi xử lý tập dữ liệu lớn:
- Bộ lập lịch tỷ lệ học: Triển khai các bộ lập lịch tỷ lệ học sẽ tự động điều chỉnh tỷ lệ học trong quá trình đào tạo. Một tỷ lệ học được tinh chỉnh tốt có thể ngăn mô hình vượt quá các điểm tối thiểu và cải thiện độ ổn định. Khi đào tạo YOLO26, tham số
lrfgiúp quản lý lập lịch tỷ lệ học bằng cách đặt tỷ lệ học cuối cùng là một phần của tỷ lệ ban đầu. - Đào tạo phân tán: Để xử lý các tập dữ liệu lớn, đào tạo phân tán có thể là một yếu tố thay đổi cuộc chơi. Bạn có thể giảm thời gian đào tạo bằng cách phân bổ khối lượng công việc đào tạo qua nhiều GPU hoặc máy tính. Cách tiếp cận này đặc biệt có giá trị cho các dự án quy mô doanh nghiệp với tài nguyên tính toán đáng kể.
Số lượng Epoch để đào tạo
Khi đào tạo một mô hình, một epoch đề cập đến một lần truyền hoàn chỉnh qua toàn bộ tập dữ liệu đào tạo. Trong một epoch, mô hình xử lý từng ví dụ trong tập đào tạo một lần và cập nhật các tham số của nó dựa trên thuật toán học. Nhiều epoch thường được cần đến để cho phép mô hình học hỏi và tinh chỉnh các tham số của nó theo thời gian.
Một câu hỏi phổ biến đặt ra là làm thế nào để xác định số lượng epoch cần đào tạo mô hình. Một điểm khởi đầu tốt là 300 epoch. Nếu mô hình bị quá khớp (overfit) sớm, bạn có thể giảm số lượng epoch. Nếu quá khớp không xảy ra sau 300 epoch, bạn có thể kéo dài quá trình đào tạo lên 600, 1200 hoặc nhiều hơn thế.
Tuy nhiên, số lượng epoch lý tưởng có thể thay đổi dựa trên kích thước tập dữ liệu và mục tiêu dự án của bạn. Các tập dữ liệu lớn hơn có thể yêu cầu nhiều epoch hơn để mô hình học hiệu quả, trong khi các tập dữ liệu nhỏ hơn có thể cần ít epoch hơn để tránh quá khớp. Đối với YOLO26, bạn có thể đặt tham số epochs trong tập lệnh đào tạo của mình.
Dừng sớm (Early Stopping)
Dừng sớm là một kỹ thuật có giá trị để tối ưu hóa đào tạo mô hình. Bằng cách theo dõi hiệu suất xác thực, bạn có thể dừng đào tạo khi mô hình ngừng cải thiện. Bạn có thể tiết kiệm tài nguyên tính toán và ngăn chặn quá khớp.
Quy trình này liên quan đến việc đặt một tham số kiên nhẫn (patience) xác định số lượng epoch cần chờ để thấy sự cải thiện trong các chỉ số xác thực trước khi dừng đào tạo. Nếu hiệu suất của mô hình không cải thiện trong các epoch này, quá trình đào tạo sẽ bị dừng để tránh lãng phí thời gian và tài nguyên.
Đối với YOLO26, bạn có thể kích hoạt dừng sớm bằng cách đặt tham số patience trong cấu hình đào tạo. Ví dụ, patience=5 có nghĩa là quá trình đào tạo sẽ dừng nếu không có cải thiện trong các chỉ số xác thực trong 5 epoch liên tiếp. Sử dụng phương pháp này đảm bảo quy trình đào tạo vẫn hiệu quả và đạt được hiệu suất tối ưu mà không cần tính toán quá mức.
Lựa chọn giữa Đào tạo trên Cloud và Đào tạo cục bộ
Có hai tùy chọn để đào tạo mô hình của bạn: đào tạo trên cloud và đào tạo cục bộ.
Đào tạo trên cloud cung cấp khả năng mở rộng và phần cứng mạnh mẽ, là lựa chọn lý tưởng để xử lý các tập dữ liệu lớn và mô hình phức tạp. Các nền tảng như Google Cloud, AWS và Azure cung cấp quyền truy cập theo yêu cầu vào các GPU và TPU hiệu suất cao, tăng tốc thời gian đào tạo và cho phép thử nghiệm với các mô hình lớn hơn. Tuy nhiên, đào tạo trên cloud có thể tốn kém, đặc biệt là trong thời gian dài, và truyền dữ liệu có thể làm tăng chi phí và độ trễ.
Đào tạo cục bộ cung cấp khả năng kiểm soát và tùy chỉnh tốt hơn, cho phép bạn điều chỉnh môi trường của mình theo nhu cầu cụ thể và tránh chi phí cloud liên tục. Nó có thể tiết kiệm hơn cho các dự án dài hạn, và vì dữ liệu của bạn ở tại chỗ, nó bảo mật hơn. Tuy nhiên, phần cứng cục bộ có thể có những hạn chế về tài nguyên và yêu cầu bảo trì, có thể dẫn đến thời gian đào tạo dài hơn đối với các mô hình lớn.
Lựa chọn trình tối ưu hóa (Optimizer)
Trình tối ưu hóa là một thuật toán điều chỉnh trọng số của mạng thần kinh của bạn để giảm thiểu hàm mất mát, đo lường mức độ hiệu suất của mô hình. Nói một cách đơn giản hơn, trình tối ưu hóa giúp mô hình học bằng cách tinh chỉnh các tham số của nó để giảm sai số. Việc chọn đúng trình tối ưu hóa ảnh hưởng trực tiếp đến tốc độ và độ chính xác của quá trình học của mô hình.
Bạn cũng có thể tinh chỉnh các tham số của trình tối ưu hóa để cải thiện hiệu suất mô hình. Việc điều chỉnh tỷ lệ học thiết lập kích thước của các bước khi cập nhật các tham số. Để ổn định, bạn có thể bắt đầu với tỷ lệ học trung bình và giảm dần theo thời gian để cải thiện khả năng học lâu dài. Ngoài ra, việc thiết lập momentum xác định mức độ ảnh hưởng của các bản cập nhật trong quá khứ đối với các bản cập nhật hiện tại. Một giá trị phổ biến cho momentum là khoảng 0.9. Nó thường cung cấp một sự cân bằng tốt.
Các trình tối ưu hóa phổ biến
Các trình tối ưu hóa khác nhau có những điểm mạnh và điểm yếu khác nhau. Hãy cùng điểm qua một vài trình tối ưu hóa phổ biến.
-
SGD (Stochastic Gradient Descent):
- Cập nhật các tham số mô hình bằng cách sử dụng gradient của hàm mất mát đối với các tham số.
- Đơn giản và hiệu quả nhưng có thể hội tụ chậm và có thể bị mắc kẹt trong các điểm tối thiểu cục bộ.
-
Adam (Adaptive Moment Estimation):
- Kết hợp lợi ích của cả SGD với momentum và RMSProp.
- Điều chỉnh tỷ lệ học cho từng tham số dựa trên các ước tính của các mô-men thứ nhất và thứ hai của các gradient.
- Rất phù hợp cho dữ liệu nhiễu và các gradient thưa.
- Hiệu quả và thường yêu cầu ít tinh chỉnh hơn, trở thành một trình tối ưu hóa được khuyên dùng cho YOLO26.
-
RMSProp (Root Mean Square Propagation):
- Điều chỉnh tỷ lệ học cho từng tham số bằng cách chia gradient cho một trung bình động của các độ lớn của các gradient gần đây.
- Giúp xử lý vấn đề gradient biến mất (vanishing gradient) và hiệu quả đối với mạng thần kinh tái phát.
-
MuSGD (Hỗn hợp Muon + SGD):
- Kết hợp các bản cập nhật kiểu SGD với hành vi lấy cảm hứng từ Muon để cải thiện độ ổn định trong đào tạo quy mô lớn.
- Một lựa chọn tốt khi bạn muốn khả năng tổng quát hóa giống SGD nhưng cần sự hội tụ mượt mà hơn so với SGD thông thường.
- Đặc biệt phù hợp với các công thức đào tạo YOLO26; nếu không chắc chắn, hãy bắt đầu với
optimizer=autovà so sánh với MuSGD trên tập dữ liệu của bạn.
Đối với YOLO26, tham số optimizer cho phép bạn chọn từ nhiều trình tối ưu hóa khác nhau, bao gồm SGD, MuSGD, Adam, AdamW, NAdam, RAdam và RMSProp, hoặc bạn có thể đặt nó thành auto để lựa chọn tự động dựa trên cấu hình mô hình.
yolo train model=yolo26n.pt data=coco8.yaml optimizer=MuSGDKết nối với Cộng đồng
Trở thành một phần của cộng đồng những người đam mê thị giác máy tính có thể giúp bạn giải quyết vấn đề và học hỏi nhanh hơn. Dưới đây là một số cách để kết nối, nhận trợ giúp và chia sẻ ý tưởng.
Tài nguyên Cộng đồng
- GitHub Issues: Truy cập kho lưu trữ YOLO26 trên GitHub và sử dụng tab Issues để đặt câu hỏi, báo cáo lỗi và đề xuất tính năng mới. Cộng đồng và những người duy trì rất tích cực và sẵn sàng trợ giúp.
- Ultralytics Discord Server: Tham gia Ultralytics Discord server để trò chuyện với những người dùng và nhà phát triển khác, nhận hỗ trợ và chia sẻ kinh nghiệm của bạn.
Tài liệu chính thức
- Tài liệu Ultralytics YOLO26: Xem tài liệu chính thức về YOLO26 để biết các hướng dẫn chi tiết và mẹo hữu ích cho nhiều dự án computer vision khác nhau.
Sử dụng các tài nguyên này sẽ giúp bạn giải quyết các thách thức và cập nhật các xu hướng và phương pháp mới nhất trong cộng đồng thị giác máy tính.
Những Điểm Chính
Đào tạo các mô hình thị giác máy tính bao gồm việc tuân theo các phương pháp tốt, tối ưu hóa chiến lược của bạn và giải quyết các vấn đề khi chúng phát sinh. Các kỹ thuật như điều chỉnh kích thước batch, đào tạo hỗn hợp độ chính xác và bắt đầu với trọng số tiền huấn luyện có thể làm cho mô hình của bạn hoạt động tốt hơn và đào tạo nhanh hơn. Các phương pháp như đào tạo tập con và dừng sớm giúp bạn tiết kiệm thời gian và tài nguyên. Giữ kết nối với cộng đồng và cập nhật các xu hướng mới sẽ giúp bạn tiếp tục cải thiện kỹ năng đào tạo mô hình của mình.
Câu hỏi thường gặp (FAQ)
Làm thế nào tôi có thể cải thiện mức sử dụng GPU khi đào tạo một tập dữ liệu lớn với Ultralytics YOLO?
Để cải thiện mức sử dụng GPU, hãy đặt tham số batch_size trong cấu hình đào tạo của bạn thành kích thước tối đa mà GPU của bạn hỗ trợ. Điều này đảm bảo rằng bạn tận dụng tối đa khả năng của GPU, giúp giảm thời gian đào tạo. Nếu bạn gặp lỗi bộ nhớ, hãy giảm dần kích thước batch cho đến khi quá trình đào tạo chạy mượt mà. Đối với YOLO26, việc đặt batch=-1 trong tập lệnh đào tạo của bạn sẽ tự động xác định kích thước batch tối ưu để xử lý hiệu quả. Để biết thêm thông tin, hãy tham khảo cấu hình đào tạo.
Đào tạo hỗn hợp độ chính xác là gì và làm cách nào để tôi kích hoạt nó trong YOLO26?
Đào tạo hỗn hợp độ chính xác sử dụng cả kiểu số dấu phẩy động 16-bit (FP16) và 32-bit (FP32) để cân bằng giữa tốc độ tính toán và độ chính xác. Cách tiếp cận này tăng tốc quá trình đào tạo và giảm mức sử dụng bộ nhớ mà không làm giảm độ chính xác của mô hình. Để kích hoạt đào tạo hỗn hợp độ chính xác trong YOLO26, hãy đặt tham số amp thành True trong cấu hình đào tạo của bạn. Điều này kích hoạt đào tạo Automatic Mixed Precision (AMP). Để biết thêm chi tiết về kỹ thuật tối ưu hóa này, hãy xem cấu hình đào tạo.
Đào tạo đa quy mô nâng cao hiệu suất mô hình YOLO26 như thế nào?
Đào tạo đa quy mô nâng cao hiệu suất mô hình bằng cách đào tạo trên các hình ảnh có kích thước khác nhau, cho phép mô hình tổng quát hóa tốt hơn trên các quy mô và khoảng cách khác nhau. Trong YOLO26, bạn có thể kích hoạt đào tạo đa quy mô bằng cách đặt tham số scale trong cấu hình đào tạo. Ví dụ, scale=0.5 lấy mẫu một hệ số zoom từ 0.5 đến 1.5, sau đó chèn đệm/cắt về imgsz. Kỹ thuật này mô phỏng các đối tượng ở các khoảng cách khác nhau, làm cho mô hình mạnh mẽ hơn trên nhiều kịch bản. Để biết các cài đặt và chi tiết khác, hãy kiểm tra cấu hình đào tạo.
Làm thế nào tôi có thể sử dụng trọng số tiền huấn luyện để tăng tốc đào tạo trong YOLO26?
Sử dụng trọng số tiền huấn luyện có thể tăng tốc đáng kể quá trình đào tạo và nâng cao độ chính xác của mô hình bằng cách tận dụng một mô hình đã quen thuộc với các tính năng thị giác nền tảng. Trong YOLO26, chỉ cần đặt tham số pretrained thành True hoặc cung cấp đường dẫn đến trọng số tiền huấn luyện tùy chỉnh của bạn trong cấu hình đào tạo. Phương pháp này, được gọi là học chuyển đổi, cho phép các mô hình được đào tạo trên các tập dữ liệu lớn được thích nghi hiệu quả với ứng dụng cụ thể của bạn. Tìm hiểu thêm về cách sử dụng trọng số tiền huấn luyện và lợi ích của chúng trong hướng dẫn cấu hình đào tạo.
Số lượng epoch được khuyến nghị để đào tạo một mô hình là bao nhiêu và làm cách nào để thiết lập điều này trong YOLO26?
Số lượng epoch đề cập đến các lượt truyền hoàn chỉnh qua tập dữ liệu đào tạo trong quá trình đào tạo mô hình. Một điểm khởi đầu điển hình là 300 epoch. Nếu mô hình của bạn quá khớp sớm, bạn có thể giảm số lượng. Ngoài ra, nếu không quan sát thấy quá khớp, bạn có thể kéo dài đào tạo lên 600, 1200 hoặc nhiều hơn thế. Để thiết lập điều này trong YOLO26, hãy sử dụng tham số epochs trong tập lệnh đào tạo của bạn. Để biết thêm lời khuyên về việc xác định số lượng epoch lý tưởng, hãy tham khảo phần này về số lượng epoch.