跳转至内容

Ultralytics 解决方案:利用 YOLO11 解决现实世界的问题

Ultralytics 解决方案提供 YOLO 模型的前沿应用,提供对象计数、模糊处理和安全系统等实际解决方案,从而提高各行各业的效率和准确性。了解 YOLO11 在实际应用中的强大功能。

Ultralytics 解决方案缩略图



观看: 如何从命令行 (CLI) 运行 Ultralytics 解决方案 | Ultralytics YOLO11 🚀

解决方案

以下是我们精心挑选的 Ultralytics 解决方案列表,可用于创建出色的计算机视觉项目。

  • 分析:进行全面的数据分析,以发现模式并做出明智的决策,利用YOLO11进行描述性、预测性和指导性分析。
  • 距离计算:使用YOLO11中的边界框中心点计算对象之间的距离,这对于空间分析至关重要。
  • 热图:利用检测热图来可视化矩阵中的数据强度,从而在计算机视觉任务中提供清晰的见解。
  • 结合对象跟踪的实例分割:使用 YOLO11 实现实例分割和对象跟踪,以实现精确的对象边界和连续监控。
  • 使用 Streamlit 进行实时推理:通过用户友好的 Streamlit 界面,直接通过 Web 浏览器利用 YOLO11 的强大功能进行实时对象检测
  • 对象模糊:使用 YOLO11 应用对象模糊,以保护图像和视频处理中的隐私。
  • 对象计数:学习使用 YOLO11 执行实时对象计数。获得准确计算实时视频流中对象的专业知识。
  • 区域对象计数:使用 YOLO11 对特定区域中的对象进行计数,以便在不同区域中进行准确的detect。
  • 对象裁剪:掌握使用 YOLO11 进行对象裁剪,以便从图像和视频中精确提取对象。
  • 停车管理:使用 YOLO11 组织和引导停车场中的车辆流动,从而优化空间利用率和用户体验。
  • 队列管理:实施高效的队列管理系统,以最大限度地减少等待时间,并使用 YOLO11 提高生产力。
  • 安全警报系统:创建一个使用 YOLO11 的安全警报系统,该系统在检测到新对象时触发警报。自定义系统以满足您的特定需求。
  • 相似度搜索:通过结合OpenAI CLIP嵌入与Meta FAISS技术,实现智能图像检索功能,支持自然语言查询,例如"手持包袋的人"或"行驶中的车辆"。
  • 速度估计:使用 YOLO11 和物体追踪技术来估计物体速度,这对于自动驾驶车辆和交通监控等应用至关重要。
  • 在区域中 track 对象:了解如何使用 YOLO11 在视频帧的特定区域内 track 对象,以实现精确高效的监控。
  • VisionEye View Objects Mapping:开发模仿人眼聚焦于特定对象的系统,从而增强计算机辨别和优先处理细节的能力。
  • 锻炼监控:了解如何使用 YOLO11 监控锻炼。 学习实时 track 和分析各种健身项目。

解决方案参数

参数类型默认值描述
modelstrNoneUltralytics YOLO 模型文件的路径。
regionlist'[(20, 400), (1260, 400)]'定义计数区域的点列表。
show_inboolTrue控制是否在视频流上显示进入计数的标志。
show_outboolTrue控制是否在视频流上显示离开计数的标志。
analytics_typestrline图形类型,即 line, bar, areapie.
colormapintcv2.COLORMAP_JET用于热图的颜色映射。
json_filestrNone包含所有停车坐标数据的 JSON 文件路径。
up_anglefloat145.0“向上”姿势的角度阈值。
kptslist[int, int, int]'[6, 8, 10]'用于监控锻炼的关键点列表。这些关键点对应于身体关节或部位,例如肩部、肘部和腕部,适用于俯卧撑、引体向上、深蹲、腹部锻炼等运动。
down_anglefloat90.0“向下”姿势的角度阈值。
blur_ratiofloat0.5调整模糊强度的百分比,取值范围为 0.1 - 1.0.
crop_dirstr'cropped-detections'用于存储裁剪检测结果的目录名。
recordsint5触发带有安全警报系统的电子邮件的总检测计数。
vision_pointtuple[int, int](20, 20)视觉将使用 VisionEye 解决方案track 物体并绘制路径的点。
sourcestrNone输入源(视频、RTSP 等)的路径。仅适用于 Solutions 命令行界面 (CLI)。
figsizetuple[int, int](12.8, 7.2)用于分析图表(如热图或图形)的图形大小。
fpsfloat30.0用于速度计算的每秒帧数。
max_histint5用于速度/方向计算的每个物体的最大历史track 点数。
meter_per_pixelfloat0.05用于将像素距离转换为真实世界单位的比例因子。
max_speedint120视觉叠加中的最大速度限制(用于警报)。
datastr'images'用于相似性搜索的图像目录的路径。

跟踪 args

解决方案还支持来自以下方面的一些参数 track,包括诸如以下的参数 conf, line_width, tracker, model, show, verboseclasses.

参数类型默认值描述
trackerstr'botsort.yaml'指定要使用的跟踪算法,例如: bytetrack.yamlbotsort.yaml.
conffloat0.3设置检测的置信度阈值;较低的值允许跟踪更多对象,但可能包含误报。
ioufloat0.5设置交叉重叠IoU) 阈值,用于过滤重叠检测。
classeslistNone按类别索引过滤结果。例如, classes=[0, 2, 3] 仅跟踪指定的类别。
verboseboolTrue控制跟踪结果的显示,提供被跟踪对象的可视化输出。
devicestrNone指定用于推理的设备(例如, cpu, cuda:00)。允许用户在 CPU、特定 GPU 或其他计算设备之间进行选择,以执行模型。

可视化参数

您可以使用 show_conf, show_labels,以及其他提到的参数来自定义可视化。

参数类型默认值描述
showboolFalse可视化参数: True,则在窗口中显示带注释的图像或视频。这对于开发或测试期间的即时视觉反馈非常有用。
line_widthNone or intNone指定边界框的线条宽度。 如果 None,则线条宽度会根据图像大小自动调整。 提供视觉自定义以提高清晰度。
show_confboolTrue在标签旁边显示每个检测的置信度分数。 可以深入了解模型对每次检测的确定性。
show_labelsboolTrue在可视化输出中显示每个检测的标签。 能够立即理解检测到的对象。

SolutionAnnotator 的用法

所有 Ultralytics Solutions 都使用单独的类 SolutionAnnotator,它扩展了主要的 Annotator 类,并具有以下方法:

方法返回类型描述
draw_region()None使用指定的点、颜色和粗细绘制区域。
queue_counts_display()None显示指定区域中的队列计数。
display_analytics()None显示停车场管理的总体统计信息。
estimate_pose_angle()float计算对象姿势中三个点之间的角度。
draw_specific_points()None在图像上绘制特定的关键点。
plot_workout_information()None在图像上绘制带标签的文本框。
plot_angle_and_count_and_stage()None可视化角度、步数和锻炼监控阶段。
plot_distance_and_line()None显示质心之间的距离,并用一条线连接它们。
display_objects_labels()None使用对象类别标签标注边界框。
sweep_annotator()None可视化垂直扫描线和可选标签。
visioneye()None将对象质心映射并连接到视觉“眼睛”点。
adaptive_label()None在边界框的中心绘制圆形或矩形背景形状标签。

使用 SolutionResults

除了 Similarity Search,每个 Solution 调用都会返回一个列表,其中包含 SolutionResults 对象。

  • 对于物体计数,结果包括 in_count, out_countclasswise_count.

SolutionResults

import cv2

from ultralytics import solutions

im0 = cv2.imread("path/to/img")

region_points = [(20, 400), (1080, 400), (1080, 360), (20, 360)]

counter = solutions.ObjectCounter(
    show=True,  # display the output
    region=region_points,  # pass region points
    model="yolo11n.pt",  # model="yolo11n-obb.pt" for object counting with OBB model.
    # classes=[0, 2],  # count specific classes i.e. person and car with COCO pretrained model.
    # tracker="botsort.yaml"  # Choose trackers i.e "bytetrack.yaml"
)
results = counter(im0)
print(results.in_count)  # display in_counts
print(results.out_count)  # display out_counts
print(results.classwise_count)  # display classwise_count

SolutionResults 对象具有以下属性:

属性类型描述
plot_imnp.ndarray带有视觉覆盖的图像,例如计数、模糊效果或特定于解决方案的增强功能。
in_countint视频流中检测到的进入定义区域的对象总数。
out_countint视频流中检测到的离开定义区域的对象总数。
classwise_countDict[str, int]记录用于高级分析的各类别的对象进/出计数的字典。
queue_countint当前在预定义队列或等待区域内的对象数量(适用于队列管理)。
workout_countint运动跟踪期间完成的锻炼重复总次数。
workout_anglefloat在锻炼期间计算关节或姿势角度,用于评估姿势。
workout_stagestr当前的锻炼阶段或运动阶段(例如,“向上”、“向下”)。
pixels_distancefloat两个物体或点(例如,边界框)之间基于像素的距离。(适用于距离计算)。
available_slotsint监控区域中未占用插槽的数量(适用于停车管理)。
filled_slotsint监控区域中已占用插槽的数量。(适用于停车管理)
email_sentbool指示是否已成功发送通知或警报电子邮件(适用于安全警报)。
total_tracksint视频分析期间观察到的唯一对象轨迹总数。
region_countsDict[str, int]用户定义区域或区域内的对象计数。
speed_dictDict[str, float]按轨迹计算的对象速度字典,可用于速度分析。
total_crop_objectsintObjectCropper 解决方案生成的裁剪对象图像总数。
speedDict[str, float]包含用于跟踪和解决方案处理的性能指标的字典。

有关更多详细信息,请参阅 SolutionResults 类文档.

通过 CLI 使用解决方案

命令信息

大多数解决方案都可以通过命令行界面直接使用,包括:

Count, Crop, Blur, Workout, Heatmap, Isegment, Visioneye, Speed, Queue, Analytics, Inference

语法

yolo SOLUTIONS SOLUTION_NAME ARGS
  • SOLUTIONS 是一个必需的关键词。
  • SOLUTION_NAME 是以下之一: ['count', 'crop', 'blur', 'workout', 'heatmap', 'isegment', 'queue', 'speed', 'analytics', 'trackzone', 'inference', 'visioneye'].
  • ARGS (可选)是自定义的 arg=value 键值对,例如 show_in=True,用于覆盖默认设置。
yolo solutions count show=True # for object counting

yolo solutions count source="path/to/video.mp4" # specify video file path

贡献我们的解决方案

我们欢迎社区的贡献!如果您掌握了 Ultralytics YOLO 的某个特定方面,但我们的解决方案尚未涵盖,我们鼓励您分享您的专业知识。编写指南是回馈社区的好方法,并帮助我们使文档更全面、更易于使用。

要开始使用,请阅读我们的贡献指南,了解如何发起 Pull Request (PR) 🛠️。我们期待您的贡献!

让我们携手合作,使 Ultralytics YOLO 生态系统更加强大和通用 🙏!

常见问题

如何使用 Ultralytics YOLO 进行实时对象计数?

Ultralytics YOLO11 可以通过利用其先进的对象检测功能来进行实时对象计数。您可以按照我们关于对象计数的详细指南来设置 YOLO11 以进行实时视频流分析。只需安装 YOLO11,加载您的模型,然后处理视频帧以动态地计算对象。

使用 Ultralytics YOLO 进行安全系统有哪些好处?

Ultralytics YOLO11 通过提供实时对象检测和警报机制来增强安全系统。通过使用 YOLO11,您可以创建一个安全警报系统,该系统在监控区域中检测到新对象时触发警报。了解如何使用 YOLO11 设置安全警报系统以进行强大的安全监控。

Ultralytics YOLO 如何改进排队管理系统?

Ultralytics YOLO11 可以通过准确地计算和跟踪队列中的人数来显着改进队列管理系统,从而有助于减少等待时间并优化服务效率。请按照我们关于排队管理的详细指南,了解如何实施 YOLO11 以进行有效的队列监控和分析。

Ultralytics YOLO 可以用于锻炼监控吗?

是的,Ultralytics YOLO11 可以通过实时跟踪和分析健身项目来有效地用于监控锻炼。这可以对运动形式和表现进行精确评估。请浏览我们关于锻炼监控的指南,了解如何使用 YOLO11 设置 AI 驱动的锻炼监控系统。

Ultralytics YOLO 如何帮助创建热图以进行数据可视化

Ultralytics YOLO11 可以生成热图,以可视化给定区域内的数据强度,突出显示高活动或感兴趣的区域。此功能在理解各种计算机视觉任务中的模式和趋势方面特别有用。了解有关使用 YOLO11 创建和使用热图以进行全面数据分析和可视化的更多信息。



📅 1 年前创建 ✏️ 1 天前更新
RizwanMunawarglenn-jocherLaughing-qUltralyticsAssistant

评论