时间:2025-04-30 22:42:12来源:互联网
上海 2025年4月30日 /美通社/ -- 黑芝麻智能通过本文介绍了黑芝麻智能视觉与4D毫米波雷达前融合算法,通过多模态特征对齐和时序建模,显著提升逆光、遮挡等复杂场景下的目标检测精度,增强辅助驾驶安全性。
随着辅助驾驶技术逐步融入日常生活,其安全性成为社会关注焦点,尤其在复杂交通场景中目标检测的稳定性和准确性成为行业研究核心。如何提升目标检测的准确,稳定性,成为了行业内必须探讨和研究的议题。不同目标识别传感器的选择以及其配套的识别方案,对目标检测精度有着巨大的影响。
目标识别传感器选择
目前主流的传感器感知方案包括纯视觉、激光雷达与相机融合以及新兴的毫米波雷达与相机融合,这三种方案各有优劣。
基于以上特点,毫米波雷达相机融合的方案成为了行业新趋势。基于AI的融合算法,如前融合点云投影、后融合目标级关联等逐步成熟。
行业毫米波雷达相机融合方案
辅助驾驶行业内,4D毫米波雷达相机融合方案正在加速落地,各头部车企都有相应的布局和应用:
黑芝麻智能融合团队,采用了4D毫米波雷达和相机融合的方案,结合深度学习模型,提升了雨雾雪、黑夜、逆光等极端天气和场景下目标检测的准确性和稳定性,改善了异形车、遮挡目标等物体检测的识别率,优化了上下坡、匝道等三维空间存在变化的场景中目标测距测速的精确性,显著提升了辅助驾驶的安全性与可行性。
黑芝麻智能 4D毫米波雷达相机融合方案
黑芝麻智能 4D毫米波雷达相机融合方案,在BEV纯视觉目标检测方案基础上,添加4D毫米波雷达特征提取分支。4D毫米波雷达点云在经过特征提取分支后,与图像分支提取的图像特征对齐并融合,组成时序信息,再经过目标head,输出目标相关的信息,其总体框架如下图所示:
4D毫米波雷达特征提取模块
模块使用稀疏点云作为输入,包含3D位置信息,RCS信息,速度信息等。经过PointPillars骨干网络提取点云的局部特征,再经过基于Transformer的骨干网络捕获全局信息。PointPillars可以压缩冗余信息,提取局部特征;RCS编码增强目标检测的性能;Transformer强化关键特征,显著提升稀疏点云的利用率。
PointPillars提取点云局部特征
采用Pillar编码的方式结构化编码毫米波雷达,将无序的雷达点云划分为规则的"柱状"(Pillar)单元,每个柱体内的点云通过简化特征(坐标、反射强度等)编码为固定维度的特征向量。通过局部特征聚合抑制噪声,保留有效目标信息,有效解决毫米波雷达点云稀疏且包含噪声的问题。针对多目标检测,柱状划分可以有效地捕捉分散的雷达点云(如行人、车辆),提升对小型或远距离目标的检测能力。
RCS编码提升检测性能
采用基于RCS感知的BEV编码器,利用雷达截面(RCS)能够粗略衡量目标尺寸的特性,有效解决因雷达生成的BEV特征是稀疏的而带来的检测性能损失问题,即利用RCS作为目标尺寸,将一个雷达点的特征分散到BEV空间中的多个像素而不是一个像素。
Transformer捕获全局信息
Deformable attention module (图片来源:《Vision Transformer with Deformable Attention》)
Transformer的子注意力机制可以跨柱体建立关联,捕捉场景中目标之间的空间关系(如车辆与行人的相对位置),弥补传统卷积网络局部感受野的局限。并且采用动态权重分配的策略,根据目标重要性动态调整特征权重,例如在拥堵场景中强化相邻车辆的特征,抑制背景干扰。
多模态特征对齐时序模块
多模态特征间的对齐问题,一直是影响目标检测优劣的关键因素。
兼顾算力要求的多模态特征融合对齐
模块通过接收图像特征提取骨干网络的图像特征以及毫米波雷达特征提取骨干网络的雷达特征后,通过多模态特征对齐模块,将二者融合为一体。通过特征拼接,操作计算量极低,能够显著降低硬件的算力要求。并且不对原始特征进行压缩或者变化,保留了特征的原始信息,避免信息丢失,适合需要高保真度的场景。如果需要较强的时序建模能力,且算力资源较为丰富,亦可采用多模态deformable attention的方式来实现对齐。
temporal模块
按照时序添加temporal模块,叠加多帧目标的feature map,能够有效的获取目标的时序信息,大大提升了目标时序特征的准确性和稳定性,如位置、速度等。因采用多帧特征相结合的方式,能够有效提升遮挡目标的检测准确度。
测试指标和结果展示
测试指标说明
模型的测试指标主要通过以下几个方面进行对比:
结果
经过测试,相较于纯视觉模型,4D毫米波雷达相机融合模型,在纵向100米(自车前方),横向+-32米范围内,mAP提升5%,mATE提升2.5%,mAVE提升明显33.85%。
4D毫米波雷达具有全天候,成本适中,产业链较成熟等特点,目前正在成为行业内多模态融合目标检测任务中的重要传感器。实验结果表明,4D毫米波雷达相机融合方案,相较于纯视觉目标检测方案,有效提升了目标检测的精度,改善了纯视觉模型测距测速的性能,特别是极端场景下模型的表现,如光线局限场景、遮挡场景以及非同平面场景等,提升辅助驾驶的驾驶安全性。
CopyRight 2023-2026 | www.gazetech.cn | 瞻望科技 版权所有 | 湘ICP备2023029281号-16
瞻望科技网部分内容来源用户投稿,如内容侵权与违规,请与本站联系(Q:230098551)