Research on GPR diagnostic system for hidden road defects based on YOLO

ShiLi GUO; WenCai CAI; PengFei TIAN; ZhiWei XU; Zheng CAO; HongYan ZHANG; ShiYuan LI

doi:10.6038/pg2025II0151

Progress in Geophysics >

2025 , Vol. 40 >Issue 2: 827 - 837

DOI: https://doi.org/10.6038/pg2025II0151

Research on GPR diagnostic system for hidden road defects based on YOLO

ShiLi GUO ^,¹ ,
WenCai CAI ² ,
PengFei TIAN ² ,
ZhiWei XU ³ ,
Zheng CAO ³ ,
HongYan ZHANG ⁴ ,
ShiYuan LI ¹

Expand

¹ School of Environmental and Biological Engineering, Henan University of Engineering, Zhengzhou 451191, China
² Henan Wanli Transportation Science and Technology Group Non-destructive Testing and Reinforcement Technology Co., Ltd., Xuchang 461000, China
³ School of Geophysics and Geomatics, China University of Geosciences, Wuhan 430074, China
⁴ School of Software, Henan University of Engineering, Zhengzhou 451191, China

Received date: 2024-06-11

Online published: 2025-05-09

Copyright

Fold

Abstract

Currently, the manual method of annotating deep learning samples for Ground Penetrating Radar (GPR) with open-source tools such as LabelImg and Labelme is not only time-consuming and labor-intensive, but it also annotates images rather than radar data. This fails to satisfy the requirements of deep learning for large sample sizes and hinders the sharing and reuse of GPR data. It is essential to design a unified data storage format for the manual interpretation results of GPR data, establish a mapping relationship between hidden road defects and their GPR data, and enable autonomous retrieval, positioning, cropping, and automatic annotation of GPR data samples. Based on the YOLO network model, this study has developed an intelligent diagnostic software system for GPR images pertaining to hidden road defects. This system can automatically annotate GPR sample data pertaining to hidden road defects and implement methods such as adaptive gain adjustment, digital filtering, automatic zero drift removal, and background subtraction to enhance radar sample data, generating deep learning samples with different signal characteristics. Through a comparative analysis of the deep learning training performance of the YOLOv8n and YOLOv8x models on GPR samples pertaining to hidden road defects, a manual verification method for intelligent diagnostic results has been developed. The testing results of the algorithm and software reveal that automatic annotation and data enhancement of GPR data pertaining to hidden road defects can significantly expedite the generation speed of GPR deep learning samples and enrich the diversity of such samples. Compared with YOLOv8n, the YOLOv8x model achieves smaller training losses, higher training accuracy, and is more suited for intelligent diagnosis of GPR images pertaining to hidden road defects.

Key words： Ground Penetrating Radar (GPR); Hidden road defects; Deep learning; Intelligent diagnosis

Cite this article

ShiLi GUO , WenCai CAI , PengFei TIAN , ZhiWei XU , Zheng CAO , HongYan ZHANG , ShiYuan LI . Research on GPR diagnostic system for hidden road defects based on YOLO[J]. Progress in Geophysics, 2025 , 40(2) : 827 -837 . DOI: 10.6038/pg2025II0151

0 引言

改革开放以来，我国公路建设取得了举世瞩目的成就.截止到2022年底，我国公路通车总里程535万km，其中，高速公路17.7万km，稳居世界第一(新华社, 2023).基于“强基薄面”的设计理念，我国已建成的高速公路、国省干道等高等级道路，普遍采用“半刚性基层+沥青路面”体系结构(Li et al., 2021).在温度和湿度反复作用下，半刚性基层会收缩、开裂，并向上发育至沥青面层，形成反射裂缝.反射裂缝一旦贯穿半刚性基层和沥青面层，各种地表水将顺缝浸入道路结构层，继而会引发土体富水、沉陷、脱空、空洞等道路隐性病害.道路隐性病害会加速面层和基层恶化，破坏道路的整体性和承载能力，严重影响道路的使用性能和使用寿命，甚至危及行车安全.道路隐性病害隐伏于道路结构层内部，传统的表观检测方法无法对其进行有效检测.因此，急需探明道路隐性病害的类型、空间位置、几何形态及尺寸等信息，以辨证施治，制定精准的“微创”处治修复措施.

探地雷达方法是一种利用高频电磁波(10⁶~10⁹ Hz)来成像地下介质内部分布规律的一种地球物理勘探方法，具有精度高、效率高、连续无损、实时成像、结果直观等优点(Tong et al., 2020; 刘澜波和钱荣毅, 2015)，是目前长距离、工程化、高效无损探测道路隐性病害的主要技术方法(郭士礼等, 2019)，但其资料解释和道路隐性病害识别仍是以人工经验解释为主，费时费力，主观性强，缺乏统一标准(杨洋等, 2024)，尤其是随着多通道、三维探地雷达系统的广泛应用，其数据量剧增，人工经验解释无法保证解释的及时性和准确率，易导致漏判和误判(Yue et al., 2022).在20世纪90年代，人工神经网络就开始应用于解决各种分类和预测问题，但受限于当时的计算水平，难以构建深层网络，实用效果不理想.2010年以来，以卷积神经网络(Convolutional Neural Network, CNN)为代表的深度神经网络已成为计算机视觉目标检测领域的主要方法.目前，目标检测领域存在着众多的CNN模型，如两阶段目标检测算法：R-CNN、Fast-RCNN、Faster-RCNN等，单阶段目标检测算法：YOLO (You Only Look Once)，SSD(Single Shot Multibox Detector)等.单阶段目标检测算法通过简化检测过程，极大地提升了算法的检测速度.YOLO系列深度学习算法能满足实时检测任务的精度与速率的要求，已成为当前工程界首选的目标检测算法之一，在道路隐性病害的自动识别与定位方面得到了广泛应用(Liu et al., 2024; Zhang et al., 2023; Zhu et al., 2024).

由于探地雷达采用固定偏移距剖面法对道路结构进行扫描成像，无需经过复杂的数据处理，便能得到与地下地质结构分布形态相对应的探地雷达图谱.因此，与其他地球物理方法相比，基于深度学习对探地雷达图谱进行智能诊断具有显著的优势.但道路隐性病害的探地雷达波场响应特征，不仅与病害的类型、形状、尺寸、埋深相关，还受病害周围道路结构层材料非均质性的影响，致使雷达剖面图背景噪声明显、波形杂乱、信噪比低(郭士礼等, 2015; 林皓等, 2023).另外，受物探方法固有多解性的影响，导致同一个的雷达响应特征，不同技术人员的解释结果往往存在差异，因此，与传统的目标识别相比，道路隐性病害探地雷达深度学习训练需要更多的样本量和更大的数据集.探地雷达样本图像数量少、质量差，制约了道路隐性病害探地雷达图谱智能诊断的发展(Liu et al., 2022).目前，在道路隐性病害探地雷达深度学习样本制作中，首先需要人类专家使用探地雷达数据处理与解释软件对雷达数据进行各种信号处理，提高雷达数据的信噪比和分辨率，并将雷达数据保存为固定分辨率或固定尺寸的图像，然后，再将图像导入LabelImg、Labelme、VOTT等通用的开源标注工具中，逐幅进行人工手动标注(Hu et al., 2023; Amaral et al., 2023; Liu et al., 2021)，生成探地雷达深度学习样本.手动标注道路隐性病害探地雷达深度学习样本，不仅费时费力，速度慢，效率低，严重限制了深度学习样本的生成速度，无法短时间内大批量生成探地雷达深度学习样本，难以满足深度学习训练所需的海量样本数据，而且其标注的是图像，而不是雷达数据，无法再对标注后的图像进行各种信号处理.

为此，本文通过将探地雷达数据的人工解释结果保存为统一的数据格式，建立道路隐性病害与其探地雷达数据之间简单且清晰的映射关系，实现对探地雷达数据的自主检索、定位、剪切和自动标注，有效促进道路隐性病害探地雷达数据的共享、共用；其次，基于探地雷达领域知识，对道路隐性病害雷达样本数据进行自适应信号处理和数据增强，在不同数据处理流程、不同处理方法、不同处理参数下，自动生成具有不同信号特征的道路隐性病害探地雷达深度学习样本，这样可以在短时间内生成大量深度学习样本.基于这些样本，用YOLO深度学习算法可对道路隐性病害探地雷达图谱进行深度学习训练和智能诊断；为了进一步确定样本的可靠性，最后，将道路隐性病害智能诊断结果转化为统一的数据格式，连同探地雷达数据一起导入探地雷达数据处理与解释软件，对其进行人工检验.上述工作模式和工作流程能循环提高道路隐性病害智能诊断的准确率.本文的主要技术流程如图 1所示.

显示原图|下载原图ZIP|生成PPT

图1 基于YOLO的道路隐性病害探地雷达图谱智能诊断技术流程图

Fig 1 Flowchart of intelligent diagnosis technology for GPR images of hidden road diseases based on YOLO

1 道路隐性病害探地雷达数据的自动标注

将探地雷达数据的人工解释结果保存为统一的数据格式，是构建大型探地雷达深度学习样本共享库的基础和前提.探地雷达数据的人工解释结果凝聚了技术人员的专业知识和经验智慧，是宝贵的深度学习样本资源宝库.但目前人工解释结果缺乏统一的数据保存格式，阻碍了探地雷达数据及其人工解释结果的共享、共用.因此，急需为人工解释结果设计一个科学合理、简单易行的数据存储格式，将不同雷达系统、不同雷达数据的人工解释结果保存为统一的数据格式.

为了方便检索和自动匹配，人工解释结果应与探地雷达数据具有相同的文件名、不同的扩展名.且每个探地雷达数据对应一个人工解释结果txt文件.道路隐性病害探地雷达图谱人工解释结果的数据格式，txt文件，如表 1所示.txt文件的第1行为探地雷达数据中包含的病害总数M，第2~6行分别为第1个病害对应5个参数，前4个参数分别为病害起点所在道数和采样点数(起点坐标)，病害终点所在的道数和采样点数(终点坐标)，第5个参数为病害类型或病害类型的编号，需与YOLO训练中的配置文件(*.yaml)保持一致，设病害ID从0~5依次代表裂缝(crack)、疏松(loose)、不均匀沉降(sink)、脱空(cavity)、空洞(void)和富水(wet)等常见的6类道路隐性病害.以此类推，第(n-1)×5+2~6行对应的是第n个病害的5个参数.人工解释结果的数据格式结构简单、易于理解，在道路隐性病害与其探地雷达数据之间建立了简单而清晰的映射关系.

表1 探地雷达人工解释结果数据格式

Table 1 Data format for manual interpretation results of GPR

行号	内容	说明
1	M	雷达数据中包含的总病害数
2	病害起始道数	病害1对应的雷达数据起始道
3	病害起始采样点数	病害1对应的雷达数据起始采样点
4	病害结束道数	病害1对应的雷达数据结束道
5	病害结束采样点数	病害1对应的雷达数据结束采样点
6	病害类型或编号	病害1的类型或编号
……	……	……
(n-1)×5+2	病害起始道数	病害n对应的雷达数据起始道
(n-1)×5+3	病害起始采样点数	病害n对应的雷达数据起始采样点
(n-1)×5+4	病害结束道数	病害n对应的雷达数据结束道
(n-1)×5+5	病害结束采样点数	病害n对应的雷达数据结束采样点
(n-1)×5+6	病害类型或编号	病害n的类型或编号

表 1清晰的给出了探地雷达数据中包含的道路隐性病害总数量M，以及每个道路隐性病害的类型及其在雷达数据中的坐标位置.因此，基于表 1所示数据格式的人工解释结果，可以自动定位每个道路隐性病害在探地雷达数据中的精确位置，从而实现对道路隐性病害探地雷达数据进行自动检索、剪切和标注.

2 基于领域知识的探地雷达数据自动数据增强

深度学习需要数以万计的有效样本.目前制约道路隐性病害探地雷达深度学习智能诊断效果的关键是样本不足.数据增强技术是目前弥补训练样本不足的最有效手段之一.但通用的数据增强技术是随机改变图像的方向、对比度、尺寸等，这不符合探地雷达的基本原理.对于探地雷达深度学习样本数据，需要采用一系列数据处理方法，消除背景噪声和杂波干扰，增强有效信号，提高信噪比和分辨率，突出道路隐性病害的有效信号.但是，由于雷达厂商众多、数据格式多样、采集参数(如天线主频、时窗、采样点数、道间距等)各异，因此，在基于领域知识对道路隐性病害探地雷达样本数据进行自动数据增强时，需要根据每个探地雷达数据的振幅、频率等特征，自适应调整指数增益和带通滤波的参数，自动对雷达数据进行去零漂、去背景等优化处理.这样不仅可以提高样本的信噪比和质量，而且能同时生成了多个具有不同信号特征的样本，既增加了样本数量，又丰富了样本的多样性.

2.1 探地雷达数据的自适应增益调节

在地下介质中传播的电磁波会受到几何扩散、吸收衰减、散射损失和透射损失等因素的影响，导致探地雷达原始记录中来自近地表的早期雷达信号振幅较强，而来自地下深层的雷达反射信号的振幅较弱.因此，在探地雷达数据采集过程中，为突出显示深层目标体的雷达波响应特征，通常会采用常数增益、自动增益或手动增益等方式，对来自深层的雷达弱反射信号进行振幅补偿.常数增益和自动增益不符合探地雷达振幅衰减的实际物理规律，而手动增益调节可以进行类似于指数增益调节，但又不够精细和准确.另外，部分商用探地雷达系统中的增益调节仅用于现场实时显示，探地雷达原始记录中并不包含任何增益信息，而部分商用探地雷达系统则将增益函数和探地雷达原始记录分开保存，以便在后期的探地雷达数据处理中，使用采集时设置的增益调节函数对雷达记录进行振幅补偿；也有部分商用探地雷达系统是将增益调节后的雷达信号保存为雷达原始记录.

在探地雷达深度学习样本自动生成过程中，需要面对不同厂家、不同数据格式、不同应用场景下数以万计的探地雷达原始数据，无法逐个核对其增益函数设置的是否合理.为此，我们依据探地雷达原始数据中浅层、深层反射波振幅强弱的量化比值，自适应调节指数增益的参数，对深层弱反射信号进行振幅补偿，增强深层反射波的振幅强度，突出道路隐性病害的雷达波响应特征.

2.2 探地雷达数据的自适应滤波方法

探地雷达原始数据不仅包含道路隐性病害的有效反射波，还有背景介质非均质性造成的散射波、环境噪声和系统杂波，导致雷达剖面图背景噪声明显，波形杂乱，反射波模糊、不突出，需要对其进行滤波处理.为此，我们提取探地雷达数据的中心频率f₀，为了保持滤波器的稳定性，适当放宽通带范围，设最高截止频率为2f₀，最低截止频率为0.25f₀，对探地雷达样本数据进行自适应带通数字滤波，利用有效波和干扰波之间在频率方面的差异，来消除系统杂波和背景噪声等干扰波，保留有地质意义的有效波，从而突出有效信号，提高信噪比，增强样本质量.

2.3 探地雷达数据的自动去零漂和去背景

探地雷达数据可以看作是一个典型的二维数组X(m, n)，其中m为行(采样点)，n为列(道数).设总采样点数为M，总道数为N，则某一道(或列)雷达数据被称为A-Scan.探地雷达剖面上的A-Scan有时会出现全是正的或全是负的，或是正负半周不对称的情况，这是由于雷达数据含有直流漂移量，致使A-Scan的振幅均值偏离零值.为此，需要消除或压制直流成分.其方法是：首先对A-Scan数据求和，除以总采样点数M，得到平均值，然后将该A-Scan的数据减去这个平均值，其表达式为：

(1)

$X^{\prime}(m, n)=X(m, n)-\frac{1}{M} \sum\limits_{k=1}^M X(k, n) .$

探地雷达地面耦合屏蔽天线具有抗电磁干扰能力强、环境适应性好、主频分布范围广、穿透深度大、空间分辨率高等优点，对结构体细微的电性差异敏感.因此，在道路隐性病害探测中，通常采用探地雷达地面耦合天线.为使电磁波能量尽可能多的进入地下介质，地面耦合屏蔽天线工作时要尽量贴近地表.此时，对于收发偏移距较小的地面耦合天线，其空气直达波和地面直达波无法分离，而是相互混合、叠加在一起，共同组成探地雷达早期信号.探地雷达早期信号的振幅强、波形稳定、相位清晰，其持续时间约为一个信号周期，且地面耦合天线的中心频率越低，其早期信号延续时间越长，深度影响范围越大.探地雷达早期信号与道路近地表极浅层病害的反射波相互耦合、叠加，严重干扰道路极浅层隐性病害的判别，为此需要消除水平同相轴的干扰，即去背景.其方法是：首先对处于相同采样点的同一行雷达数据求和，除以雷达总道数N，得到平均值，然后将该采样点的数据减去这个平均值，其表达式为：

(2)

$X^{\prime}(m, n)=X(m, n)-\frac{1}{N} \sum\limits_{k=1}^N X(m, k) .$

2.4 探地雷达数据的自动标注和数据增强流程

探地雷达数据自动标注、自适应数据增强及生成深度学习样本的流程如图 2所示，其具体步骤为：

显示原图|下载原图ZIP|生成PPT

图2 道路隐性病害探地雷达数据的自动标注和数据增强流程图

Fig 2 Flowchart of automatic annotation and data enhancement for GPR data of hidden road defects

(1) 批量导入N个探地雷达文件，理论上可以一次性导入同一个文件夹下的所有雷达文件.

(2) 按序查询当前雷达文件n(n=1, 2, 3, …, N)是否存在对应的人工解释结果文件.如果该雷达文件不存在对应的人工解释结果，则按序查询下一个(n=n+1)雷达文件是否存在对应的人工解释结果，以此类推；如果该雷达文件存在对应的人工解释结果，则进入3)；当n>N时，执行1).

(3) 读取与当前雷达文件对应的人工解释结果(*.txt文件)中道路隐性病害的总数量M.

(4) 按先后顺序读取人工解释结果中第m个病害(m=1, 2, 3, …, M)的起点、终点坐标和病害类型(或编号)，并在雷达文件中找到该病害的起点所在的雷达道数和采样点数，终点所在的雷达道数和采样点数.以病害为中心向左、右两侧扩展，将样本数据的总道数扩展为512的整数倍，向上、下扩展至包含所有采样点数，将扩展后的雷达数据作为深度学习的样本数据.即样本数据既包含病害对应的雷达数据也包含病害四周的背景数据.当m>M时，返回步骤(2).

(5) 对样本数据进行归一化处理和自动标注，即对整个雷达样本数据空间归一化到[0, 1]，并计算病害的中心点坐标(x, y)及其横向、纵向尺寸(width, height)等标注信息，生成符合YOLO格式的探地雷达深度学习样本(图像(image)和标签(label)对).即每幅雷达图像(*.jpg)对应一个标签label(*.txt)文件，且雷达图像的文件名与label标签的txt的文件名相同，分别置于/image/*.jpg和/label/*.txt文件路径中.当一个雷达图像中有n个病害目标时，标签文件*.txt就用n行来标识，即1行标识1个病害目标.每行均采用(class, x, y, width, height)格式，其中class代表病害类型的标识，与YOLO训练中的配置文件(*.yaml)保持一致.

(6) 对经过步骤(5)处理后的样本数据进行零漂处理，生成符合YOLO格式的探地雷达深度学习样本(图像(image)和标签(label)对).

(7) 对经过步骤(6)处理后的样本数据进行自适应增益调节，生成符合YOLO格式的探地雷达深度学习样本(图像(image)和标签(label)对).

(8) 对经过步骤(7)处理后的样本数据进行自适应数字滤波，生成符合YOLO格式的探地雷达深度学习样本(图像(image)和标签(label)对).

(9) 对经过步骤(8)处理后的样本数据进行水平同相轴消除处理，生成符合YOLO格式的探地雷达深度学习样本(图像(image)和标签(label)对)，并使m=m+1，执行步骤(4).

基于以上流程编制计算机程序，可以一次性导入数百个雷达文件，自动标注和自动生成数以万计的样本(image和label对)数据，实现在短时间内大批量生成探地雷达深度学习样本，将人工解释结果和专家经验转化为可供YOLO深度学习训练的样本数据.基于增益调节、滤波处理、零漂和水平干扰消除等信号处理方法，可以有效消除雷达数据剖面上的背景“噪声”和各种杂波干扰，突出道路隐性病害的有效反射波，提高信噪比，增强样本质量.依据以上探地雷达数据处理方法，可以依次自动生成原始数据样本→自适应增益调节样本→自适应数字滤波样本→自动去零漂样本→自动去背景样本.每个样本对应不同的数据处理方法和数据处理阶段，具有不同的信号特征，不仅增加了样本数据，而且丰富了样本的多样性，能有效弥补深度学习样本不足.

3 基于YOLOv8的道路隐性病害探地雷达图谱智能诊断

3.1 YOLOv8网络结构

YOLO是一种单阶段的目标实时检测模型，以图像为输入，通过反向传播直接回归对象的类别和坐标.YOLOv8作为YOLO系列中最新的模型之一，进一步提升了各种任务和应用程序的性能和灵活性，可用于图像分类、物体检测和实例分割任务.YOLOv8的网络结构如图 3所示.图中的“Concat”是沿着通道维度连接张量的操作；“SPPF”是YOLOv5中“SPP”的改进版本，不仅具有更高的计算效率，还能够捕获到不同尺度的特征信息；“Conv”表示带有SiLU的卷积层.

显示原图|下载原图ZIP|生成PPT

图3 YOLOv8网络结构

Fig 3 YOLOv8 network structure

YOLOv8由主干(Backbone)、颈部(Neck)和头部(Head)三个主要模块组成.Backbone负责从输入的探地雷达图像中提取有用的特征信息，生成不同尺度的特征图，供后续的网络部分使用.YOLOv8使用C2f模块作为基本单元，代替YOLOv5的C3模块.C2f模块具有更少的参数量和更优秀的特征提取能力，使得YOLOv8在保持轻量化的同时，提高了模型的收敛速度和效果，优化了模型结构，提升了目标检测的准确性和效率；Neck部分位于Backbone和Head之间，主要起到特征融合的作用.它采用多尺度特征融合技术，对来自Backbone不同阶段的特征图进行融合，以获得更丰富和更准确的特征表示，捕捉不同尺度目标的信息，提高目标检测的性能和鲁棒性；Head部分利用增强的特征图预测目标的类别和边界框信息.为了缓解分类和回归之间的冲突，YOLOv8应用解耦头(Decoupled-Head)设计，将目标位置和类别信息分别提取出来，通过不同的网络分支分别学习，最后再进行融合.这种设计使得网络可以更加灵活地处理不同尺度和语义信息，提高了分割的准确性和细节保留能力.

此外，YOLOv8还优化了锚框和损失函数.YOLOv8应用Anchor-free直接预测目标的中心位置，与传统的Anchor-Based方法相比，Anchor-free方法不依赖于特定的锚框设计，具有更好的泛化能力，能够适应不同形状和大小的目标.YOLOv8采用VFL Loss(Variable Focus Loss)作为分类损失，使用DFL Loss(Distribution Focal Loss)和CIoU Loss(Complete Intersection over Union Loss)作为回归损失.VFL Loss作为分类损失，有助于模型更好地处理类别不平衡问题.DFL Loss作为回归损失的一部分，用于优化预测框与真实框之间的位置关系，有助于更准确地定位目标，提高检测精度.CIoU Loss不仅考虑了预测框与真实框之间的重叠面积，还加入了中心点距离和长宽比等因素，使得损失函数更加全面和准确，增强了模型对目标位置和形状的预测能力.

3.2 基于YOLOv8的道路隐性病害探地雷达图谱深度学习训练

作者共收集了1.372万个探地雷达样本，包括裂缝、疏松、不均匀沉降、脱空、空洞和富水等常见的6类道路隐性病害.使用YOLOv8网络模型对这些样本进行了深度学习训练.所有深度学习训练均在Windows 7操作系统(64位)上进行，该系统配备了Intel(R) Core (TM) i7-7700 CPU和Nvidia GeForce RTX-3090 Ti GPU.深度学习框架基于Pytorch 1.12.1开发.YOLOv8源自Ultralytics公司发布的YOLOv8源代码.训练参数如表 2所示.表 2中的“Img-size”表示输入图像的分辨率，它限制了目标的大小和计算成本.“Batch-size”表示在训练过程中每次迭代处理的样本数.“Learning-rate”、“Momentum”和“Weight decay”调节收敛速度和训练稳定性.“Epochs”表示检测器在数据集上训练的迭代次数.适当的Epochs可以使模型获得出色的性能，同时节省计算资源.“Mosaic”是一种数据增强技术，用于在训练过程中增加模型的泛化能力，缓解数据过拟合.

表2 训练参数

Table 2 Training parameters

参数类型	Img-size	Batch-size	Momentum	Weight decay	Learning-rate	Epochs	Mosaic
数值	512×512	32	0.937	0.0005	0.001	300	True

YOLOv8模型的训练损失包括定位损失(box_loss)、分类损失(cls_loss)和分布焦点损失(dfl_loss).其中定位损失主要监督预测框与标定框的误差；分类损失主要监督类别分类是否准确；分布焦点损失是一种用于目标检测任务中边界框回归的损失函数.它能够有效处理标签分配的不确定性及类别不平衡问题，通过优化标签附近的概率分布，显著提升模型的性能.我们采用了目标检测中的常用指标，诸如准确率、召回率、平均准确率(AP)和平均准确率均值(mAP)(杜豫川等, 2023)，来评估YOLOv8的有效性和效率.准确率表示在所有被判定为正样本中真的正样本的比例，而召回率表示被正确识别出来的正样本占总正样本的比例.准确率和召回率是两个广泛使用的评估指标，它们被定义为：

(3)

$P_{\text {recision }}=\frac{N_{\mathrm{TP}}}{N_{\mathrm{TP}}+N_{\mathrm{FN}}}, $

(4)

$R_{\text {ecall }}=\frac{N_{\mathrm{TP}}}{N_{\mathrm{TP}}+N_{\mathrm{FP}}}, $

式中，N_TP、N_FP、N_FN分别表示识别结果的真阳性、假阳性和假阴性.准确率越高，说明模型预测为正样本的实例中真实正样本的比例越高，即误检率越低；召回率越高，说明模型能够找到更多的实际正样本，即漏检率越低.平均准确率(Average Precision，AP)是针对单个类别的检测性能度量，AP值越高，说明模型在该类别上的性能越好.每个类别的AP值是通过计算准确率-召回率曲线下的面积获得的，而平均准确率均值(mean Average Precision，mAP)表示所有类别的AP值的平均值，用于衡量模型在所有类别上的整体性能.AP和mAP可以表示为：

(5)

$\mathrm{AP}=\int\limits_0^1 P(R) \mathrm{d} R, $

(6)

$\mathrm{mAP}=\frac{1}{n c} \sum_1^{n c} A P_i, $

其中‘P(R)’表示准确率-召回率曲线，‘nc’代表类别数量.为了更全面、准确地评估检测器的性能，通常利用不同的交并比(Intersection over Union，IoU)阈值来获得相应的mAP值.更高的阈值意味着对边界框与真实框之间的重叠有更为严格的标准.具体来说，mAP50表示IoU阈值大于0.5的平均精度.mAP50-95是IoU阈值在0.5到0.95之间(步长为0.05)的mAP值的平均值.

YOLOv8提供了5个预训练模型，分别为8n、8s、8m、8l、8x.其中YOLOv8n的模型最小，速度最快，但精度最差；YOLOv8x的模型最大，速度最慢，计算资源要求最高，但精度最高.为了对比，我们基于YOLOv8n和YOLOv8x预训练模型，同时使用道路隐性病害探地雷达图谱样本集进行深度学习训练和验证.两个网络模型训练结果的7个性能评价指标，box_loss、cls_loss、dfl_loss、precision、recall、mAP50和Map50-95分别展示在图 4和图 5中.

显示原图|下载原图ZIP|生成PPT

图4 基于YOLOv8n模型的道路隐性病害探地雷达图谱训练结果

Fig 4 Training results of GPR for hidden road defects based on YOLOv8n model

显示原图|下载原图ZIP|生成PPT

图5 基于YOLOv8x模型的道路隐性病害探地雷达图谱训练结果

Fig 5 Training results of GPR for hidden road defects based on YOLOv8x model

对比图 4和图 5可以看出，与YOLOv8n模型相比，采用YOLOv8x模型进行训练及验证的box_loss、cls_loss、dfl_loss等训练损失更小、效果更好，且precision、recall、mAP50、mAP 50-95等性能指标更高、收敛更稳定，分别为97.30%、96.57%、96.80%、95.20%, 比YOLOv8n模型分别提升了8.04%、3.38%、5.20%和16.42%.

3.3 基于YOLOv8的道路隐性病害探地雷达图谱智能诊断

雷达数据的预处理.探地雷达数据中不但包含来自道路隐性病害的有效反射波，还有一系列背景噪声和杂波干扰，因此，在将雷达数据进行智能诊断之前，需要对雷达数据进行预处理.待诊断雷达数据可能来自不同的雷达厂商，其数据格式多样、采集参数(如天线主频、时窗、采样点数、道间距等)各异，因此，需要在无人工干预的情况下完成探地雷达数据的自动预处理.自动预处理方法借鉴上述数据增强方法，自适应调整指数增益和带通滤波的参数，自动对雷达数据进行去零漂、去背景等优化处理.自动消除雷达数据中的背景噪声和杂波干扰，增强有效信号，提高信噪比和分辨率，突出道路隐性病害的有效信号.然后，将雷达数据分割为固定分辨率的灰度图，并按照道数从前到后的顺序，对图像文件依次命名为“radarfilename_001、……、radarfilename_n”，“radarfilename”是待诊断雷达数据的文件名，方便后期生成与雷达文件名相同、后缀不同的数据解释结果文件.

雷达数据的病害诊断.使用深度学习训练过程中生成的best.pt权重文件，基于YOLOv8x对雷达数据生成的图谱文件进行自动诊断.将诊断结果保存为“.txt”标签文件.“.txt”标签文件中的每1行代表诊断到1个道路隐性病害，每行均采用(class, x_center, y_center, width, height)格式，其中class代表道路隐性病害的类型，x_center和y_center分别代表病害目标中心点在归一化图像中的横向和纵向坐标，width和height分别代表病害目标在归一化图像中横向和纵向的占比.

人工校验及样本的循环利用.将同一个雷达数据文件诊断结果中的所有“.txt”标签文件汇总，转化为表 1数据格式的诊断结果.诊断结果文件与待诊断雷达数据文件的文件名相同，而扩展名不同.将探地雷达数据及其智能诊断结果，同时导入探地雷达处理与解释软件，进行人工校验.此外，还可以将人工校验后的雷达数据生成为新的深度学习样本，再次用于深度学习训练，以循环提高深度学习的训练效果和诊断的准确性.

4 结论

(1) 既有的雷达数据及其人工解释结果是宝贵的深度学习资源.但目前雷达厂商众多、文件格式多样，不同的探地雷达处理与解释软件保存的人工解释结果格式不统一，阻碍了探地雷达深度学习样本的共享、共用.通过设计一个统一的人工解释结果数据存储格式，建立道路隐性病害与其探地雷达数据之间简单且清晰的映射关系，从而实现对探地雷达数据的自主检索、定位、剪切和自动标注，有利于建立共享、共用的探地雷达深度学习样本库.

(2) 基于探地雷达领域知识，无需人工干预，自动完成雷达样本数据的自适应信号处理(增益调节、数字滤波、去零漂和去背景等)和数据增强，在不同数据处理流程、不同处理方法、不同处理参数下，自动批量生成具有不同信号特征的道路隐性病害探地雷达深度学习样本，不仅可以提高样本质量，还可以丰富样本的多样性.

(3) 通过YOLO深度学习训练将人类专家智慧转化为智能目标检测算法，对道路隐性病害探地雷达图谱进行智能自动诊断，可以显著加快探地雷达数据的解释速度，大幅降低人工成本.另外，将智能诊断结果转化为统一的数据解释格式，使用探地雷达处理与解释软件同时打开雷达数据和智能诊断结果，能够更加方便、高效地人工校验智能诊断的正确性.

感谢审稿专家提出的修改意见和编辑部的大力支持！

References

Publishing order | Descend order by publishing year | Descend order by cited within

Amaral

L C M

, Roshan

, Bayat

. Automatic detection and classification of underground objects in ground penetrating radar images using machine learning. J. Pipel. Syst. Eng. Pract., 2023, 14 (4):

模态框（Modal）标题

Abstract

Cite this article

0 引言

图1 基于YOLO的道路隐性病害探地雷达图谱智能诊断技术流程图

1 道路隐性病害探地雷达数据的自动标注

表1 探地雷达人工解释结果数据格式

2 基于领域知识的探地雷达数据自动数据增强

2.1 探地雷达数据的自适应增益调节

2.2 探地雷达数据的自适应滤波方法

2.3 探地雷达数据的自动去零漂和去背景

2.4 探地雷达数据的自动标注和数据增强流程

图2 道路隐性病害探地雷达数据的自动标注和数据增强流程图

3 基于YOLOv8的道路隐性病害探地雷达图谱智能诊断

3.1 YOLOv8网络结构

图3 YOLOv8网络结构

3.2 基于YOLOv8的道路隐性病害探地雷达图谱深度学习训练

表2 训练参数

图4 基于YOLOv8n模型的道路隐性病害探地雷达图谱训练结果

图5 基于YOLOv8x模型的道路隐性病害探地雷达图谱训练结果

3.3 基于YOLOv8的道路隐性病害探地雷达图谱智能诊断

4 结论

References