实时交通流条件下船舶航道航行风险预警模型
评价标准来检验BN模型的有效性,其中:事故数据分类正确率等于分类正确的事故数据与总事故数据的比值;非事故数据分类正确率等于分类正确的非事故数据与总的非事故数据的比值.由于事故发生的危害性较大,评价标准优先考虑事故数据分类正确率.
为得到较优的分类模型,对每组数据均测试12次,并求出每组数据分类结果的平均值,根据平均值判断模型的优劣.
3.3 模型结果
3.3.1 RF模型计算
通过计算机编程,运用MATLAB实现RF模型的计算步骤.将30个变量输入到已经编好的RF计算程序中,各变量的重要度计算结果见图3.图3中,纵坐标表示某变量改变后分类正确率的下降值,此值表示该变量的重要度.
前期研究结果表明,采用船舶交通事故发生前20-40min内距离事故发生地最近的2个船舶检测器测得的数据所构建的BN模型预警效果最优.该模型共选取6个变量.因此,本文选取的变量应少于6个,以证明重要参数识别的作用,经过对比分析,并综合考虑模型预警正确率的要求,最终选取V(34),0(12),V(2)和0(2)等4个重要度最高的变量作为输入变量.这4个变量分别表示交通故事故发生前20-40min内下游的船舶平均速度、上游的航道平均占有率、船舶检测器N2所测船舶速度和航道占有率.
3.3.2 BN模型结果
基于草鞋峡水道内发生的58起交通事故和600起非交通事故的相关数据,对事故发生前20-40min内的航道内船舶交通流状态数据经过重要变量筛选后采用BN模型进行分类,并将分类结果与前期研究结果比较,具体见表3.
由表3可知,虽然前期研究中采用事故发生地前后2个船舶检测器在事故发生前20-40min内的检测数据所建的BN模型在非事故数据分类正确率和总体数据分类正确率两方面预警值较高,同时在事故数据分类正确率方面也较好,但是运用经过RF筛选后所选取的4个重要变量构建的BN模型在同样条件下预警效果更好,表现在不仅非事故数据分类正确率和总体数据分类正确率有小幅度提高,而且事故数据分类正确率更是高达81.29%.通过比较,说明经过RF筛选重要变量后所建立的BN模型不仅复杂度降低,而且其预警效果更优,
3.3.3 BN模型的可转移性测试
为比较筛选重要变量后建立的模型与前期研究中只利用初始数据建立的模型的通用性,对两种模型进行可转移性测试,利用基于草鞋峡水道内的交通数据建立的BN模型测试丹徒水道内的交通数据,基于丹徒水道内的14起事故数据和150起非事故数据,得到两种模型的可转移性测试结果,见表4.
从表4可以看出,基于筛选重要变量后构建的BN模型的测试结果整体好于直接利用初始数据构建的BN模型的测试结果.基于筛选重要变量后建立的模型的事故数据分类正确率有所降低,为68.41%,但是非事故数据分类正确率却高达94.63%,而且总体数据分类正确率也达到91.86%;而基于直接利用初始数据构建的模型的测试结果却不太理想.
4 结论
运用随机森林(RF)模型从在事故发生前20-40min内事故发生地附近的4个船舶检测器测得的初始数据和计算数据中筛选出4个最重要的变量,结合基于GMM的EM算法构建新的BN预警模型,通过与前期的研究结果比较表明,新的BN模型不仅复杂度降低,而且可提高事故预警正确率,其值高达81.29%.
可转移性测试结果表明:基于筛选重要变量后建立的BN模型事故预警正确率虽有所下降,但整体预警正确率和事故预警正确率仍高于直接利用初始数据构建的模型,说明利用一个航道内的数据所建立的新的BN预警模型能够用于其他航道内的交通事故预警.
由于所选的两处水道具有航道形态和环境参数相近的特点,为验证在不同条件下模型的稳定性和预警精度,对具有不同航道形态和环境参数的水道内的事故特征和不同事故类型的预警需要进一步研究.