Link to this sectionCác phương pháp hay nhất về Machine Learning và mẹo huấn luyện mô hình#
Link to this sectionGiới thiệu#
Một trong những bước quan trọng nhất khi thực hiện một dự án thị giác máy tính là huấn luyện mô hình. Trước khi đạt đến bước này, bạn cần xác định mục tiêu và thu thập cũng như chú thích dữ liệu. Sau khi tiền xử lý dữ liệu để đảm bảo dữ liệu sạch và nhất quán, bạn có thể chuyển sang bước huấn luyện mô hình.
Watch: Model Training Tips | How to Handle Large Datasets | Batch Size, GPU Utilization and Mixed Precision
Vậy huấn luyện mô hình là gì? Huấn luyện mô hình là quá trình dạy cho mô hình của bạn nhận diện các mẫu thị giác và đưa ra dự đoán dựa trên dữ liệu của bạn. Nó ảnh hưởng trực tiếp đến hiệu suất và độ chính xác của ứng dụng. Trong hướng dẫn này, chúng tôi sẽ đề cập đến các phương pháp hay nhất, kỹ thuật tối ưu hóa và mẹo khắc phục sự cố để giúp bạn huấn luyện các mô hình thị giác máy tính một cách hiệu quả.
Link to this sectionCách huấn luyện mô hình Machine Learning#
Một mô hình thị giác máy tính được huấn luyện bằng cách điều chỉnh các tham số nội tại của nó để giảm thiểu sai số. Ban đầu, mô hình được cung cấp một tập hợp lớn các hình ảnh đã được dán nhãn. Nó đưa ra dự đoán về những gì có trong các hình ảnh đó, và các dự đoán này được so sánh với các nhãn hoặc nội dung thực tế để tính toán sai số. Các sai số này cho thấy dự đoán của mô hình cách xa các giá trị thực tế bao nhiêu.
Trong quá trình huấn luyện, mô hình liên tục đưa ra dự đoán, tính toán sai số và cập nhật các tham số thông qua một quy trình gọi là lan truyền ngược. Trong quy trình này, mô hình điều chỉnh các tham số nội tại (trọng số và độ chệch) để giảm sai số. Bằng cách lặp lại chu kỳ này nhiều lần, mô hình dần cải thiện độ chính xác. Theo thời gian, nó học cách nhận diện các mẫu phức tạp như hình dạng, màu sắc và kết cấu.
Quá trình học tập này giúp mô hình thị giác máy tính thực hiện các tác vụ khác nhau, bao gồm phát hiện đối tượng, phân đoạn cá thể, phân đoạn ngữ nghĩa và phân loại hình ảnh. Mục tiêu cuối cùng là tạo ra một mô hình có khả năng khái quát hóa những gì đã học cho các hình ảnh mới, chưa từng thấy để nó có thể hiểu chính xác dữ liệu thị giác trong các ứng dụng thực tế.
Bây giờ chúng ta đã biết những gì đang diễn ra phía sau hậu trường khi huấn luyện một mô hình, hãy xem xét các điểm cần chú ý khi thực hiện huấn luyện.
Link to this sectionHuấn luyện trên các tập dữ liệu lớn#
Có một vài khía cạnh khác nhau cần cân nhắc khi bạn dự định sử dụng tập dữ liệu lớn để huấn luyện mô hình. Ví dụ, bạn có thể điều chỉnh batch size, kiểm soát việc sử dụng GPU, chọn sử dụng huấn luyện đa quy mô (multiscale training), v.v. Hãy cùng đi sâu vào từng tùy chọn này.
Link to this sectionBatch Size và sử dụng GPU#
Khi huấn luyện mô hình trên các tập dữ liệu lớn, việc sử dụng GPU hiệu quả là yếu tố then chốt. Batch size là một yếu tố quan trọng. Đây là số lượng mẫu dữ liệu mà mô hình Machine Learning xử lý trong một lần lặp huấn luyện. Sử dụng batch size tối đa mà GPU của bạn hỗ trợ giúp bạn tận dụng tối đa khả năng của nó và giảm thời gian huấn luyện mô hình. Tuy nhiên, bạn cần tránh việc cạn kiệt bộ nhớ GPU. Nếu gặp lỗi bộ nhớ, hãy giảm dần batch size cho đến khi mô hình huấn luyện ổn định.
Watch: How to Use Batch Inference with Ultralytics YOLO26 | Speed Up Object Detection in Python 🎉
Đối với YOLO26, bạn có thể đặt tham số batch trong cấu hình huấn luyện để phù hợp với khả năng của GPU. Ngoài ra, việc đặt batch=-1 trong script huấn luyện của bạn sẽ tự động xác định batch size có thể xử lý hiệu quả dựa trên khả năng của thiết bị. Bằng cách tinh chỉnh batch size, bạn có thể tận dụng tối đa tài nguyên GPU và cải thiện quy trình huấn luyện tổng thể.
Link to this sectionHuấn luyện trên tập con (Subset Training)#
Huấn luyện trên tập con là một chiến lược thông minh bao gồm việc huấn luyện mô hình trên một tập dữ liệu nhỏ hơn đại diện cho tập dữ liệu lớn. Nó có thể tiết kiệm thời gian và tài nguyên, đặc biệt là trong giai đoạn phát triển và thử nghiệm mô hình ban đầu. Nếu bạn đang thiếu thời gian hoặc đang thử nghiệm với các cấu hình mô hình khác nhau, huấn luyện trên tập con là một lựa chọn tốt.
Khi nói đến YOLO26, bạn có thể dễ dàng triển khai huấn luyện trên tập con bằng cách sử dụng tham số fraction. Tham số này cho phép bạn chỉ định phân đoạn tập dữ liệu nào sẽ được sử dụng để huấn luyện. Ví dụ, đặt fraction=0.1 sẽ huấn luyện mô hình của bạn trên 10% dữ liệu. Bạn có thể sử dụng kỹ thuật này để lặp lại nhanh và tinh chỉnh mô hình trước khi cam kết huấn luyện trên toàn bộ tập dữ liệu. Huấn luyện trên tập con giúp bạn đạt được tiến bộ nhanh chóng và sớm xác định các vấn đề tiềm ẩn.
Link to this sectionHuấn luyện đa quy mô (Multi-scale Training)#
Huấn luyện đa quy mô là một kỹ thuật giúp cải thiện khả năng khái quát hóa của mô hình bằng cách huấn luyện nó trên các hình ảnh với kích thước thay đổi. Mô hình của bạn có thể học cách phát hiện đối tượng ở các quy mô và khoảng cách khác nhau và trở nên mạnh mẽ hơn.
Ví dụ, khi bạn huấn luyện YOLO26, bạn có thể bật huấn luyện đa quy mô bằng cách đặt tham số scale. Tham số này điều chỉnh kích thước của hình ảnh huấn luyện theo một hệ số nhất định, mô phỏng các đối tượng ở các khoảng cách khác nhau. Ví dụ, đặt scale=0.5 sẽ ngẫu nhiên thu phóng hình ảnh huấn luyện theo hệ số từ 0.5 đến 1.5 trong quá trình huấn luyện. Việc cấu hình tham số này cho phép mô hình của bạn trải nghiệm nhiều quy mô hình ảnh khác nhau và cải thiện khả năng phát hiện trên các kích thước đối tượng và kịch bản khác nhau.
Ultralytics cũng hỗ trợ huấn luyện đa quy mô theo kích thước hình ảnh thông qua tham số multi_scale. Không giống như scale (vốn thu phóng hình ảnh rồi padding/crop lại về imgsz), multi_scale thay đổi chính imgsz mỗi batch (được làm tròn theo bước nhảy của mô hình). Ví dụ, với imgsz=640 và multi_scale=0.25, kích thước huấn luyện được lấy mẫu từ 480 lên đến 800 theo các bước stride (ví dụ: 480, 512, 544, ..., 800), trong khi multi_scale=0.0 giữ kích thước cố định.
Link to this sectionCaching#
Caching là một kỹ thuật quan trọng để cải thiện hiệu quả huấn luyện các mô hình Machine Learning. Bằng cách lưu trữ các hình ảnh đã tiền xử lý vào bộ nhớ, caching giảm thời gian GPU chờ tải dữ liệu từ đĩa. Mô hình có thể liên tục nhận dữ liệu mà không bị chậm trễ do các thao tác I/O đĩa.
Caching có thể được kiểm soát khi huấn luyện YOLO26 bằng tham số cache:
cache=True: Lưu trữ hình ảnh tập dữ liệu trong RAM, cung cấp tốc độ truy cập nhanh nhất nhưng tốn nhiều bộ nhớ hơn.cache='disk': Lưu trữ hình ảnh trên đĩa, chậm hơn RAM nhưng nhanh hơn so với việc tải dữ liệu mới mỗi lần.cache=False: Vô hiệu hóa caching, phụ thuộc hoàn toàn vào I/O đĩa, đây là tùy chọn chậm nhất.
Link to this sectionHuấn luyện độ chính xác hỗn hợp (Mixed Precision Training)#
Huấn luyện độ chính xác hỗn hợp sử dụng cả kiểu số dấu phẩy động 16-bit (FP16) và 32-bit (FP32). Điểm mạnh của cả FP16 và FP32 được tận dụng bằng cách sử dụng FP16 để tính toán nhanh hơn và FP32 để duy trì độ chính xác khi cần. Hầu hết các thao tác của mạng thần kinh được thực hiện ở FP16 để hưởng lợi từ tính toán nhanh hơn và sử dụng bộ nhớ thấp hơn. Tuy nhiên, một bản sao chính của các trọng số mô hình được giữ ở FP32 để đảm bảo độ chính xác trong các bước cập nhật trọng số. Bạn có thể xử lý các mô hình lớn hơn hoặc batch size lớn hơn trong cùng các ràng buộc phần cứng.
Để triển khai huấn luyện độ chính xác hỗn hợp, bạn sẽ cần sửa đổi các script huấn luyện của mình và đảm bảo phần cứng (như GPU) của bạn hỗ trợ nó. Nhiều framework học sâu hiện đại, chẳng hạn như PyTorch và TensorFlow, cung cấp hỗ trợ tích hợp cho độ chính xác hỗn hợp.
Huấn luyện độ chính xác hỗn hợp khá đơn giản khi làm việc với YOLO26. Bạn có thể sử dụng flag amp trong cấu hình huấn luyện của mình. Đặt amp=True sẽ kích hoạt huấn luyện Automatic Mixed Precision (AMP). Huấn luyện độ chính xác hỗn hợp là một cách đơn giản nhưng hiệu quả để tối ưu hóa quy trình huấn luyện mô hình của bạn.
Link to this sectionTrọng số Pretrained#
Sử dụng trọng số tiền huấn luyện (pretrained weights) là một cách thông minh để tăng tốc quá trình huấn luyện mô hình của bạn. Trọng số tiền huấn luyện đến từ các mô hình đã được huấn luyện trên các tập dữ liệu lớn, mang lại cho mô hình của bạn một khởi đầu tốt. Học chuyển đổi điều chỉnh các mô hình tiền huấn luyện cho các tác vụ mới, liên quan. Tinh chỉnh (fine-tuning) một mô hình tiền huấn luyện bao gồm việc bắt đầu với các trọng số này và sau đó tiếp tục huấn luyện trên tập dữ liệu cụ thể của bạn. Phương pháp huấn luyện này giúp thời gian huấn luyện nhanh hơn và thường có hiệu suất tốt hơn vì mô hình bắt đầu với nền tảng vững chắc về các đặc trưng cơ bản.
Tham số pretrained giúp học chuyển đổi trở nên dễ dàng với YOLO26. Đặt pretrained=True sẽ sử dụng trọng số tiền huấn luyện mặc định, hoặc bạn có thể chỉ định một đường dẫn đến mô hình tiền huấn luyện tùy chỉnh. Sử dụng trọng số tiền huấn luyện và học chuyển đổi giúp tăng cường đáng kể khả năng của mô hình và giảm chi phí huấn luyện.
Link to this sectionCác kỹ thuật khác cần xem xét khi xử lý tập dữ liệu lớn#
Có một vài kỹ thuật khác cần xem xét khi xử lý tập dữ liệu lớn:
- Bộ lập lịch Tốc độ học (Learning Rate Schedulers): Triển khai các bộ lập lịch tốc độ học sẽ điều chỉnh tốc độ học một cách linh hoạt trong quá trình huấn luyện. Một tốc độ học được điều chỉnh tốt có thể ngăn mô hình vượt quá các cực tiểu và cải thiện độ ổn định. Khi huấn luyện YOLO26, tham số
lrfgiúp quản lý việc lập lịch tốc độ học bằng cách thiết lập tốc độ học cuối cùng là một phần nhỏ của tốc độ ban đầu. - Huấn luyện phân tán: Để xử lý các tập dữ liệu lớn, huấn luyện phân tán có thể là một yếu tố thay đổi cuộc chơi. Bạn có thể giảm thời gian huấn luyện bằng cách chia sẻ khối lượng công việc huấn luyện trên nhiều GPU hoặc máy tính. Phương pháp này đặc biệt có giá trị đối với các dự án quy mô doanh nghiệp với tài nguyên tính toán lớn.
Link to this sectionSố lượng Epochs cần huấn luyện#
Khi huấn luyện một mô hình, một epoch đề cập đến một lần truyền hoàn chỉnh qua toàn bộ tập dữ liệu huấn luyện. Trong một epoch, mô hình xử lý từng mẫu trong tập huấn luyện một lần và cập nhật các tham số của nó dựa trên thuật toán học. Nhiều epoch thường cần thiết để cho phép mô hình học và tinh chỉnh các tham số của nó theo thời gian.
Một câu hỏi phổ biến thường gặp là làm thế nào để xác định số lượng epoch cần thiết để huấn luyện mô hình. Điểm khởi đầu tốt là 300 epoch. Nếu mô hình bị overfitting sớm, bạn có thể giảm số lượng epoch. Nếu overfitting không xảy ra sau 300 epoch, bạn có thể kéo dài thời gian huấn luyện lên 600, 1200 hoặc nhiều epoch hơn.
Tuy nhiên, số lượng epoch lý tưởng có thể thay đổi tùy thuộc vào kích thước tập dữ liệu và mục tiêu dự án của bạn. Các tập dữ liệu lớn hơn có thể yêu cầu nhiều epoch hơn để mô hình học hiệu quả, trong khi các tập dữ liệu nhỏ hơn có thể cần ít epoch hơn để tránh overfitting. Đối với YOLO26, bạn có thể đặt tham số epochs trong script huấn luyện của mình.
Link to this sectionDừng sớm (Early Stopping)#
Dừng sớm là một kỹ thuật có giá trị để tối ưu hóa quá trình huấn luyện mô hình. Bằng cách theo dõi hiệu suất trên tập validation, bạn có thể dừng huấn luyện khi mô hình ngừng cải thiện. Bạn có thể tiết kiệm tài nguyên tính toán và ngăn ngừa overfitting.
Quy trình này bao gồm việc đặt tham số patience để xác định số lượng epoch cần chờ sự cải thiện trong các chỉ số validation trước khi dừng huấn luyện. Nếu hiệu suất của mô hình không cải thiện trong các epoch này, quá trình huấn luyện sẽ bị dừng lại để tránh lãng phí thời gian và tài nguyên.
Đối với YOLO26, bạn có thể bật tính năng dừng sớm bằng cách đặt tham số patience trong cấu hình huấn luyện. Ví dụ, patience=5 có nghĩa là quá trình huấn luyện sẽ dừng nếu không có sự cải thiện nào trong các chỉ số validation trong 5 epoch liên tiếp. Sử dụng phương pháp này đảm bảo quy trình huấn luyện vẫn hiệu quả và đạt được hiệu suất tối ưu mà không cần tính toán quá mức.
Link to this sectionLựa chọn giữa huấn luyện trên Cloud và cục bộ#
Có hai tùy chọn để huấn luyện mô hình của bạn: huấn luyện trên cloud và huấn luyện cục bộ.
Huấn luyện trên cloud cung cấp khả năng mở rộng và phần cứng mạnh mẽ, là lựa chọn lý tưởng để xử lý các tập dữ liệu lớn và các mô hình phức tạp. Các nền tảng như Google Cloud, AWS và Azure cung cấp quyền truy cập theo yêu cầu vào các GPU và TPU hiệu năng cao, đẩy nhanh thời gian huấn luyện và cho phép thử nghiệm với các mô hình lớn hơn. Tuy nhiên, huấn luyện trên cloud có thể đắt đỏ, đặc biệt là trong thời gian dài, và việc truyền dữ liệu có thể làm tăng chi phí và độ trễ.
Huấn luyện cục bộ cung cấp khả năng kiểm soát và tùy chỉnh tốt hơn, cho phép bạn điều chỉnh môi trường theo nhu cầu cụ thể và tránh chi phí cloud định kỳ. Nó có thể tiết kiệm hơn cho các dự án dài hạn, và vì dữ liệu của bạn ở tại chỗ, nó bảo mật hơn. Tuy nhiên, phần cứng cục bộ có thể có giới hạn tài nguyên và yêu cầu bảo trì, điều này có thể dẫn đến thời gian huấn luyện lâu hơn đối với các mô hình lớn.
Link to this sectionChọn trình tối ưu hóa (Optimizer)#
Trình tối ưu hóa là một thuật toán điều chỉnh các trọng số của mạng thần kinh của bạn để giảm thiểu hàm mất mát, đo lường mức độ hiệu quả của mô hình. Nói một cách đơn giản, trình tối ưu hóa giúp mô hình học bằng cách điều chỉnh các tham số của nó để giảm sai số. Chọn đúng trình tối ưu hóa ảnh hưởng trực tiếp đến việc mô hình học nhanh và chính xác như thế nào.
Bạn cũng có thể tinh chỉnh các tham số trình tối ưu hóa để cải thiện hiệu suất mô hình. Việc điều chỉnh tốc độ học thiết lập kích thước các bước khi cập nhật tham số. Để ổn định, bạn có thể bắt đầu với tốc độ học vừa phải và dần dần giảm nó theo thời gian để cải thiện khả năng học lâu dài. Ngoài ra, việc đặt momentum xác định mức độ ảnh hưởng của các cập nhật trước đó đến các cập nhật hiện tại. Giá trị phổ biến cho momentum là khoảng 0.9. Nó thường cung cấp sự cân bằng tốt.
Link to this sectionCác trình tối ưu hóa phổ biến#
Các trình tối ưu hóa khác nhau có những điểm mạnh và điểm yếu khác nhau. Hãy cùng điểm qua một vài trình tối ưu hóa phổ biến.
-
SGD (Stochastic Gradient Descent):
- Cập nhật các tham số mô hình bằng cách sử dụng gradient của hàm mất mát đối với các tham số.
- Đơn giản và hiệu quả nhưng có thể hội tụ chậm và có thể bị kẹt trong các cực tiểu cục bộ.
-
Adam (Adaptive Moment Estimation):
- Kết hợp lợi ích của cả SGD với momentum và RMSProp.
- Điều chỉnh tốc độ học cho từng tham số dựa trên ước tính các mô-men thứ nhất và thứ hai của gradient.
- Rất phù hợp cho dữ liệu nhiễu và gradient thưa.
- Hiệu quả và thường yêu cầu ít tinh chỉnh hơn, trở thành trình tối ưu hóa được khuyến nghị cho YOLO26.
-
RMSProp (Root Mean Square Propagation):
- Điều chỉnh tốc độ học cho từng tham số bằng cách chia gradient cho trung bình trượt của độ lớn các gradient gần đây.
- Giúp xử lý vấn đề biến mất gradient và hiệu quả cho mạng thần kinh tái phát.
-
MuSGD (Muon + SGD hybrid):
- Kết hợp các cập nhật kiểu SGD với hành vi lấy cảm hứng từ Muon để cải thiện độ ổn định trong huấn luyện quy mô lớn.
- Một lựa chọn tốt khi bạn muốn khả năng khái quát hóa giống SGD nhưng cần sự hội tụ mượt mà hơn SGD thuần túy.
- Đặc biệt phù hợp cho các công thức huấn luyện YOLO26; nếu không chắc chắn, hãy bắt đầu với
optimizer=autovà so sánh với MuSGD trên tập dữ liệu của bạn.
Đối với YOLO26, tham số optimizer cho phép bạn chọn từ nhiều trình tối ưu hóa khác nhau, bao gồm SGD, MuSGD, Adam, AdamW, NAdam, RAdam và RMSProp, hoặc bạn có thể đặt nó thành auto để chọn tự động dựa trên cấu hình mô hình.
yolo train model=yolo26n.pt data=coco8.yaml optimizer=MuSGDLink to this sectionKết nối với cộng đồng#
Trở thành một phần của cộng đồng những người đam mê thị giác máy tính có thể giúp bạn giải quyết vấn đề và học hỏi nhanh hơn. Dưới đây là một số cách để kết nối, nhận trợ giúp và chia sẻ ý tưởng.
Link to this sectionTài nguyên cộng đồng#
- GitHub Issues: Truy cập YOLO26 GitHub repository và sử dụng tab Issues để đặt câu hỏi, báo cáo lỗi và đề xuất tính năng mới. Cộng đồng và các nhà bảo trì rất tích cực và sẵn sàng giúp đỡ.
- Máy chủ Discord của Ultralytics: Tham gia Ultralytics Discord server để trò chuyện với những người dùng và nhà phát triển khác, nhận hỗ trợ và chia sẻ kinh nghiệm của bạn.
Link to this sectionTài liệu chính thức#
- Tài liệu Ultralytics YOLO26: Kiểm tra tài liệu chính thức về YOLO26 để biết các hướng dẫn chi tiết và mẹo hữu ích về các dự án thị giác máy tính khác nhau.
Sử dụng các tài nguyên này sẽ giúp bạn giải quyết các thách thức và cập nhật các xu hướng cũng như phương pháp mới nhất trong cộng đồng thị giác máy tính.
Link to this sectionNhững điểm chính cần ghi nhớ#
Huấn luyện các mô hình thị giác máy tính bao gồm việc tuân thủ các phương pháp hay nhất, tối ưu hóa chiến lược và giải quyết vấn đề khi chúng phát sinh. Các kỹ thuật như điều chỉnh batch size, huấn luyện độ chính xác hỗn hợp và bắt đầu với trọng số tiền huấn luyện có thể giúp các mô hình của bạn hoạt động tốt hơn và huấn luyện nhanh hơn. Các phương pháp như huấn luyện tập con và dừng sớm giúp bạn tiết kiệm thời gian và tài nguyên. Giữ kết nối với cộng đồng và theo kịp các xu hướng mới sẽ giúp bạn không ngừng cải thiện kỹ năng huấn luyện mô hình của mình.
Link to this sectionCâu hỏi thường gặp#
Link to this sectionLàm thế nào tôi có thể cải thiện việc sử dụng GPU khi huấn luyện tập dữ liệu lớn với Ultralytics YOLO?#
Để cải thiện hiệu suất sử dụng GPU, hãy đặt tham số batch trong cấu hình training của bạn thành kích thước tối đa mà GPU của bạn hỗ trợ. Điều này đảm bảo rằng bạn tận dụng tối đa khả năng của GPU, giúp giảm thời gian training. Nếu gặp lỗi bộ nhớ, hãy giảm dần kích thước batch cho đến khi quá trình training chạy ổn định. Đối với YOLO26, việc đặt batch=-1 trong tập lệnh training sẽ tự động xác định kích thước batch tối ưu để xử lý hiệu quả. Để biết thêm thông tin, hãy tham khảo cấu hình training.
Link to this sectionHuấn luyện độ chính xác hỗn hợp là gì và làm cách nào để kích hoạt nó trong YOLO26?#
Huấn luyện độ chính xác hỗn hợp sử dụng cả kiểu số dấu phẩy động 16-bit (FP16) và 32-bit (FP32) để cân bằng giữa tốc độ tính toán và độ chính xác. Phương pháp này giúp tăng tốc huấn luyện và giảm mức sử dụng bộ nhớ mà không làm giảm độ chính xác của mô hình. Để kích hoạt huấn luyện độ chính xác hỗn hợp trong YOLO26, hãy đặt tham số amp thành True trong cấu hình huấn luyện của bạn. Điều này kích hoạt huấn luyện Automatic Mixed Precision (AMP). Để biết thêm chi tiết về kỹ thuật tối ưu hóa này, hãy xem cấu hình huấn luyện.
Link to this sectionHuấn luyện đa quy mô giúp nâng cao hiệu suất mô hình YOLO26 như thế nào?#
Huấn luyện đa quy mô nâng cao hiệu suất mô hình bằng cách huấn luyện trên các hình ảnh có kích thước thay đổi, cho phép mô hình khái quát hóa tốt hơn trên các quy mô và khoảng cách khác nhau. Trong YOLO26, bạn có thể bật huấn luyện đa quy mô bằng cách đặt tham số scale trong cấu hình huấn luyện. Ví dụ, scale=0.5 lấy mẫu hệ số thu phóng từ 0.5 đến 1.5, sau đó padding/crop về imgsz. Kỹ thuật này mô phỏng các đối tượng ở các khoảng cách khác nhau, giúp mô hình mạnh mẽ hơn trong nhiều kịch bản khác nhau. Để biết cài đặt và chi tiết thêm, hãy kiểm tra cấu hình huấn luyện.
Link to this sectionLàm thế nào tôi có thể sử dụng trọng số tiền huấn luyện để tăng tốc độ huấn luyện trong YOLO26?#
Sử dụng trọng số tiền huấn luyện có thể tăng tốc độ huấn luyện đáng kể và nâng cao độ chính xác của mô hình bằng cách tận dụng một mô hình đã quen thuộc với các đặc trưng thị giác nền tảng. Trong YOLO26, chỉ cần đặt tham số pretrained thành True hoặc cung cấp đường dẫn đến trọng số tiền huấn luyện tùy chỉnh của bạn trong cấu hình huấn luyện. Phương pháp này, được gọi là học chuyển đổi, cho phép các mô hình đã được huấn luyện trên các tập dữ liệu lớn được điều chỉnh hiệu quả cho ứng dụng cụ thể của bạn. Tìm hiểu thêm về cách sử dụng trọng số tiền huấn luyện và lợi ích của chúng trong hướng dẫn cấu hình huấn luyện.
Link to this sectionSố lượng epoch khuyến nghị để huấn luyện mô hình là bao nhiêu và làm cách nào để thiết lập điều này trong YOLO26?#
Số lượng epoch đề cập đến các lần truyền hoàn chỉnh qua tập dữ liệu huấn luyện trong quá trình huấn luyện mô hình. Điểm khởi đầu điển hình là 300 epoch. Nếu mô hình của bạn bị overfitting sớm, bạn có thể giảm số lượng. Ngoài ra, nếu không quan sát thấy overfitting, bạn có thể kéo dài huấn luyện lên 600, 1200 hoặc nhiều epoch hơn. Để thiết lập điều này trong YOLO26, hãy sử dụng tham số epochs trong script huấn luyện của bạn. Để biết thêm lời khuyên về việc xác định số lượng epoch lý tưởng, hãy tham khảo phần số lượng epoch.