Ultralytics 解决方案:利用 YOLO11 解决现实世界的问题
Ultralytics 解决方案提供 YOLO 模型的前沿应用,提供对象计数、模糊处理和安全系统等实际解决方案,从而提高各行各业的效率和准确性。了解 YOLO11 在实际应用中的强大功能。
![]()
观看: 如何从命令行 (CLI) 运行 Ultralytics 解决方案 | Ultralytics YOLO11 🚀
解决方案
以下是我们精心挑选的 Ultralytics 解决方案列表,可用于创建出色的计算机视觉项目。
- 分析:进行全面的数据分析,以发现模式并做出明智的决策,利用YOLO11进行描述性、预测性和指导性分析。
- 距离计算:使用YOLO11中的边界框中心点计算对象之间的距离,这对于空间分析至关重要。
- 热图:利用检测热图来可视化矩阵中的数据强度,从而在计算机视觉任务中提供清晰的见解。
- 结合对象跟踪的实例分割:使用 YOLO11 实现实例分割和对象跟踪,以实现精确的对象边界和连续监控。
- 使用 Streamlit 进行实时推理:通过用户友好的 Streamlit 界面,直接通过 Web 浏览器利用 YOLO11 的强大功能进行实时对象检测。
- 对象模糊:使用 YOLO11 应用对象模糊,以保护图像和视频处理中的隐私。
- 对象计数:学习使用 YOLO11 执行实时对象计数。获得准确计算实时视频流中对象的专业知识。
- 区域对象计数:使用 YOLO11 对特定区域中的对象进行计数,以便在不同区域中进行准确的detect。
- 对象裁剪:掌握使用 YOLO11 进行对象裁剪,以便从图像和视频中精确提取对象。
- 停车管理:使用 YOLO11 组织和引导停车场中的车辆流动,从而优化空间利用率和用户体验。
- 队列管理:实施高效的队列管理系统,以最大限度地减少等待时间,并使用 YOLO11 提高生产力。
- 安全警报系统:创建一个使用 YOLO11 的安全警报系统,该系统在检测到新对象时触发警报。自定义系统以满足您的特定需求。
- 相似度搜索:通过结合OpenAI CLIP嵌入与Meta FAISS技术,实现智能图像检索功能,支持自然语言查询,例如"手持包袋的人"或"行驶中的车辆"。
- 速度估计:使用 YOLO11 和物体追踪技术来估计物体速度,这对于自动驾驶车辆和交通监控等应用至关重要。
- 在区域中 track 对象:了解如何使用 YOLO11 在视频帧的特定区域内 track 对象,以实现精确高效的监控。
- VisionEye View Objects Mapping:开发模仿人眼聚焦于特定对象的系统,从而增强计算机辨别和优先处理细节的能力。
- 锻炼监控:了解如何使用 YOLO11 监控锻炼。 学习实时 track 和分析各种健身项目。
解决方案参数
| 参数 | 类型 | 默认值 | 描述 |
|---|---|---|---|
model | str | None | Ultralytics YOLO 模型文件的路径。 |
region | list | '[(20, 400), (1260, 400)]' | 定义计数区域的点列表。 |
show_in | bool | True | 控制是否在视频流上显示进入计数的标志。 |
show_out | bool | True | 控制是否在视频流上显示离开计数的标志。 |
analytics_type | str | line | 图形类型,即 line, bar, area或 pie. |
colormap | int | cv2.COLORMAP_JET | 用于热图的颜色映射。 |
json_file | str | None | 包含所有停车坐标数据的 JSON 文件路径。 |
up_angle | float | 145.0 | “向上”姿势的角度阈值。 |
kpts | list[int, int, int] | '[6, 8, 10]' | 用于监控锻炼的关键点列表。这些关键点对应于身体关节或部位,例如肩部、肘部和腕部,适用于俯卧撑、引体向上、深蹲、腹部锻炼等运动。 |
down_angle | float | 90.0 | “向下”姿势的角度阈值。 |
blur_ratio | float | 0.5 | 调整模糊强度的百分比,取值范围为 0.1 - 1.0. |
crop_dir | str | 'cropped-detections' | 用于存储裁剪检测结果的目录名。 |
records | int | 5 | 触发带有安全警报系统的电子邮件的总检测计数。 |
vision_point | tuple[int, int] | (20, 20) | 视觉将使用 VisionEye 解决方案track 物体并绘制路径的点。 |
source | str | None | 输入源(视频、RTSP 等)的路径。仅适用于 Solutions 命令行界面 (CLI)。 |
figsize | tuple[int, int] | (12.8, 7.2) | 用于分析图表(如热图或图形)的图形大小。 |
fps | float | 30.0 | 用于速度计算的每秒帧数。 |
max_hist | int | 5 | 用于速度/方向计算的每个物体的最大历史track 点数。 |
meter_per_pixel | float | 0.05 | 用于将像素距离转换为真实世界单位的比例因子。 |
max_speed | int | 120 | 视觉叠加中的最大速度限制(用于警报)。 |
data | str | 'images' | 用于相似性搜索的图像目录的路径。 |
跟踪 args
解决方案还支持来自以下方面的一些参数 track,包括诸如以下的参数 conf, line_width, tracker, model, show, verbose 和 classes.
| 参数 | 类型 | 默认值 | 描述 |
|---|---|---|---|
tracker | str | 'botsort.yaml' | 指定要使用的跟踪算法,例如: bytetrack.yaml 或 botsort.yaml. |
conf | float | 0.3 | 设置检测的置信度阈值;较低的值允许跟踪更多对象,但可能包含误报。 |
iou | float | 0.5 | 设置交叉重叠IoU) 阈值,用于过滤重叠检测。 |
classes | list | None | 按类别索引过滤结果。例如, classes=[0, 2, 3] 仅跟踪指定的类别。 |
verbose | bool | True | 控制跟踪结果的显示,提供被跟踪对象的可视化输出。 |
device | str | None | 指定用于推理的设备(例如, cpu, cuda:0 或 0)。允许用户在 CPU、特定 GPU 或其他计算设备之间进行选择,以执行模型。 |
可视化参数
您可以使用 show_conf, show_labels,以及其他提到的参数来自定义可视化。
| 参数 | 类型 | 默认值 | 描述 |
|---|---|---|---|
show | bool | False | 可视化参数: True,则在窗口中显示带注释的图像或视频。这对于开发或测试期间的即时视觉反馈非常有用。 |
line_width | None or int | None | 指定边界框的线条宽度。 如果 None,则线条宽度会根据图像大小自动调整。 提供视觉自定义以提高清晰度。 |
show_conf | bool | True | 在标签旁边显示每个检测的置信度分数。 可以深入了解模型对每次检测的确定性。 |
show_labels | bool | True | 在可视化输出中显示每个检测的标签。 能够立即理解检测到的对象。 |
SolutionAnnotator 的用法
所有 Ultralytics Solutions 都使用单独的类 SolutionAnnotator,它扩展了主要的 Annotator 类,并具有以下方法:
| 方法 | 返回类型 | 描述 |
|---|---|---|
draw_region() | None | 使用指定的点、颜色和粗细绘制区域。 |
queue_counts_display() | None | 显示指定区域中的队列计数。 |
display_analytics() | None | 显示停车场管理的总体统计信息。 |
estimate_pose_angle() | float | 计算对象姿势中三个点之间的角度。 |
draw_specific_points() | None | 在图像上绘制特定的关键点。 |
plot_workout_information() | None | 在图像上绘制带标签的文本框。 |
plot_angle_and_count_and_stage() | None | 可视化角度、步数和锻炼监控阶段。 |
plot_distance_and_line() | None | 显示质心之间的距离,并用一条线连接它们。 |
display_objects_labels() | None | 使用对象类别标签标注边界框。 |
sweep_annotator() | None | 可视化垂直扫描线和可选标签。 |
visioneye() | None | 将对象质心映射并连接到视觉“眼睛”点。 |
adaptive_label() | None | 在边界框的中心绘制圆形或矩形背景形状标签。 |
使用 SolutionResults
除了 Similarity Search,每个 Solution 调用都会返回一个列表,其中包含 SolutionResults 对象。
- 对于物体计数,结果包括
in_count,out_count和classwise_count.
SolutionResults
import cv2
from ultralytics import solutions
im0 = cv2.imread("path/to/img")
region_points = [(20, 400), (1080, 400), (1080, 360), (20, 360)]
counter = solutions.ObjectCounter(
show=True, # display the output
region=region_points, # pass region points
model="yolo11n.pt", # model="yolo11n-obb.pt" for object counting with OBB model.
# classes=[0, 2], # count specific classes i.e. person and car with COCO pretrained model.
# tracker="botsort.yaml" # Choose trackers i.e "bytetrack.yaml"
)
results = counter(im0)
print(results.in_count) # display in_counts
print(results.out_count) # display out_counts
print(results.classwise_count) # display classwise_count
SolutionResults 对象具有以下属性:
| 属性 | 类型 | 描述 |
|---|---|---|
plot_im | np.ndarray | 带有视觉覆盖的图像,例如计数、模糊效果或特定于解决方案的增强功能。 |
in_count | int | 视频流中检测到的进入定义区域的对象总数。 |
out_count | int | 视频流中检测到的离开定义区域的对象总数。 |
classwise_count | Dict[str, int] | 记录用于高级分析的各类别的对象进/出计数的字典。 |
queue_count | int | 当前在预定义队列或等待区域内的对象数量(适用于队列管理)。 |
workout_count | int | 运动跟踪期间完成的锻炼重复总次数。 |
workout_angle | float | 在锻炼期间计算关节或姿势角度,用于评估姿势。 |
workout_stage | str | 当前的锻炼阶段或运动阶段(例如,“向上”、“向下”)。 |
pixels_distance | float | 两个物体或点(例如,边界框)之间基于像素的距离。(适用于距离计算)。 |
available_slots | int | 监控区域中未占用插槽的数量(适用于停车管理)。 |
filled_slots | int | 监控区域中已占用插槽的数量。(适用于停车管理) |
email_sent | bool | 指示是否已成功发送通知或警报电子邮件(适用于安全警报)。 |
total_tracks | int | 视频分析期间观察到的唯一对象轨迹总数。 |
region_counts | Dict[str, int] | 用户定义区域或区域内的对象计数。 |
speed_dict | Dict[str, float] | 按轨迹计算的对象速度字典,可用于速度分析。 |
total_crop_objects | int | ObjectCropper 解决方案生成的裁剪对象图像总数。 |
speed | Dict[str, float] | 包含用于跟踪和解决方案处理的性能指标的字典。 |
有关更多详细信息,请参阅 SolutionResults 类文档.
通过 CLI 使用解决方案
命令信息
大多数解决方案都可以通过命令行界面直接使用,包括:
Count, Crop, Blur, Workout, Heatmap, Isegment, Visioneye, Speed, Queue, Analytics, Inference
语法
yolo SOLUTIONS SOLUTION_NAME ARGS
- SOLUTIONS 是一个必需的关键词。
- SOLUTION_NAME 是以下之一:
['count', 'crop', 'blur', 'workout', 'heatmap', 'isegment', 'queue', 'speed', 'analytics', 'trackzone', 'inference', 'visioneye']. - ARGS (可选)是自定义的
arg=value键值对,例如show_in=True,用于覆盖默认设置。
yolo solutions count show=True # for object counting
yolo solutions count source="path/to/video.mp4" # specify video file path
贡献我们的解决方案
我们欢迎社区的贡献!如果您掌握了 Ultralytics YOLO 的某个特定方面,但我们的解决方案尚未涵盖,我们鼓励您分享您的专业知识。编写指南是回馈社区的好方法,并帮助我们使文档更全面、更易于使用。
要开始使用,请阅读我们的贡献指南,了解如何发起 Pull Request (PR) 🛠️。我们期待您的贡献!
让我们携手合作,使 Ultralytics YOLO 生态系统更加强大和通用 🙏!
常见问题
如何使用 Ultralytics YOLO 进行实时对象计数?
Ultralytics YOLO11 可以通过利用其先进的对象检测功能来进行实时对象计数。您可以按照我们关于对象计数的详细指南来设置 YOLO11 以进行实时视频流分析。只需安装 YOLO11,加载您的模型,然后处理视频帧以动态地计算对象。
使用 Ultralytics YOLO 进行安全系统有哪些好处?
Ultralytics YOLO11 通过提供实时对象检测和警报机制来增强安全系统。通过使用 YOLO11,您可以创建一个安全警报系统,该系统在监控区域中检测到新对象时触发警报。了解如何使用 YOLO11 设置安全警报系统以进行强大的安全监控。
Ultralytics YOLO 如何改进排队管理系统?
Ultralytics YOLO11 可以通过准确地计算和跟踪队列中的人数来显着改进队列管理系统,从而有助于减少等待时间并优化服务效率。请按照我们关于排队管理的详细指南,了解如何实施 YOLO11 以进行有效的队列监控和分析。
Ultralytics YOLO 可以用于锻炼监控吗?
是的,Ultralytics YOLO11 可以通过实时跟踪和分析健身项目来有效地用于监控锻炼。这可以对运动形式和表现进行精确评估。请浏览我们关于锻炼监控的指南,了解如何使用 YOLO11 设置 AI 驱动的锻炼监控系统。
Ultralytics YOLO 如何帮助创建热图以进行数据可视化?
Ultralytics YOLO11 可以生成热图,以可视化给定区域内的数据强度,突出显示高活动或感兴趣的区域。此功能在理解各种计算机视觉任务中的模式和趋势方面特别有用。了解有关使用 YOLO11 创建和使用热图以进行全面数据分析和可视化的更多信息。