Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SMART ROAD TRAFFIC ANOMALY DETECTION METHOD
Document Type and Number:
WIPO Patent Application WO/2018/122803
Kind Code:
A1
Abstract:
A smart road traffic anomaly detection method, comprising the following steps: establishing time/space sub-segments; preprocessing past tracking data; analyzing past tracking data analysis and training an RNN model; detecting anomalies; indicating the degree of severity of the anomalies; and evaluating system performance. In the method, vehicle tracking information is recorded by means of on-board GNSS positioning devices in floating vehicles driving on roads, and said tracking information is analyzed and mined in order to achieve smart detection of traffic anomalies and incidents on city roads.

Inventors:
DU YUCHUAN (CN)
DENG FUWEN (CN)
CHANG GUANGZHAO (CN)
Application Number:
PCT/IB2017/058533
Publication Date:
July 05, 2018
Filing Date:
December 30, 2017
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
UNIV TONGJI (CN)
SHANGHAI INTELLIGENT TRANSP CO LTD (CN)
XU MICHAEL JUN (FR)
International Classes:
G06F17/30; G08G1/01
Foreign References:
CN104408924A2015-03-11
CN201927174U2011-08-10
CN201946111U2011-08-24
CN104504901A2015-04-08
JP2003228788A2003-08-15
Attorney, Agent or Firm:
XU, Michael Jun (CN)
Download PDF:
Claims:
权利要求书

1. 一种智能化道路交通异常检测方法, 包括如下步骤:

1) 建立时空子区: 将一天划分为若干时间片段, 每个时间片段称为一个时间子区; 将城市道路 交通异常检测的实施区域划分为若干空间片段, 每个空间片段称为一个空间子区; 任意一个 时间子区和任意一个空间子区的交集称为时空子区; 实施方法是:确定时间维度的片段尺度, 时间片段跨度为固定值, 取 30mm作为一个时间片段; 确定空间维度的片段尺度, 空间片段 跨度为固定值, 取 200m X 200m的空间网格作为一个空间片段;

2) 历史轨迹数据的预处理: 将浮动车 GNSS定位历史数据处理为历史轨迹的抽样车速数据; 实时轨迹数据的预处理: 将浮动车 GNSS定位实时数据处理为实时轨迹的抽样车速数据;

3) 历史轨迹数据分析和 RNN 模型训练: 将所述历史轨迹的抽样车速数据进行组织规整, 训练 RNN模型, 得到历史车速特征模型 MRNN

实时轨迹数据分析和特征提取: 利用所述实时轨迹的抽样车速数据, 计算能够反映实时交通 特征的参数;

4) 异常检测: 通过差异性指标衡量所述历史车速特征模型与所述实时交通特征的差异, 得到历 史与实时交通特征差异值;

5) 异常严重性量化表征: 利用所述历史与实时交通特征差异值计算交通状况异常指数;

6) 系统性能评价: 评价交通异常状态检测的准确性, 衡量系统运行的稳定程度。

2. 如权利要求 1所述的智能化道路交通异常检测方法, 其特征在于, 步骤 2)所述的历史轨迹数据的预 处理包括:

2a) 数据结构化: 将浮动车 GNSS定位历史数据进行数据清洗、 数据集成、 数据转换、 数据归约, 得到结构化 GNSS定位历史数据;

2b) 快速地图匹配: 结合城市路网数据, 通过地图匹配算法, 将结构化 GNSS定位历史数据投影到 城市路网, 建立所述结构化 GNSS 定位历史数据中的定位点与路段的匹配关系, 得到所述结 构化 GNSS定位历史数据中的定位点与所述路段的匹配关系表,并修正定位漂移带来的误差; 2c) 交通运行特征参数计算和抽样: 根据所述结构化 GNSS定位历史数据计算交通运行特征参数, 得到历史轨迹的交通特征数据, 并对所述历史轨迹的交通特征数据进行数据抽样, 得到抽样 历史轨迹的抽样交通特征数据。

3. 如权利要求 2所述的智能化道路交通异常检测方法, 其特征在于, 步骤 2b)所述的快速地图匹配包 括:

2b 1) 将所需处理的空间区域划分为一定大小的格网, 每个格网区域的范围可表示为

A = {(^ys) \ xs e [„ ,+1),^ e[u+1)}, 每个格网区域包含若干个路段, 把这些路段的集合表 示为 Rs, 所述路段的集合 Rs中的每条路段表示为 并为每个路段赋予编号;

2b2) 判定定位点所在的格网区域, 并利用距离和方位角, 在路段的集合 Rs中搜索某定位点 A所在 的路段

2b3) 利用 GNSS定位点直线投影法, 计算 GNSS定位点在路段上的投影坐标。

4. 如权利要求 3所述的智能化道路交通异常检测方法, 其特征在于, 步骤 2b2)采用下述方法之一: 2b21) 单点匹配方法: 搜索距离某定位点 A最近的路段, 实施方法是: 对于路段的集合 中的某 一路段 ij 当满足点 A的行驶方向角 与路段 ij的方向角 的差值小于阈值 时, 即满足

| - |< 时, 完成匹配; 若不满足 | - |< , 继续搜索路段集合 R 中的其他路段, 直至 满足 | - |< ;

2b22) 点序列匹配方法:本方案适用于高频浮动车数据;将每两条相邻时间的浮动车 GNSS数据时 间间隔表示为 ί。, 将浮动车 GNSS数据采集频率表示为 /Q=l/iQ, 将某定位点 A的时间记录表 示为 将时间上与所述定位点 A相邻的点 P(tA-t0), Pfc+if 定义为 A的 1-邻近点, P(tA-2h), P04+2iQ;)定义为某定位点 A的 2-邻近点, 以此类推, 则 Pi -kt^h 定义为某定位点 A 的 ^邻近点; 在/ Q<lHz时, 取^ =1或 2; 取距离某定位点 A及该定位点的 ^邻近点距离最小 的一个路段 ij' 并计算该定位点及其 ^邻近点行驶方向角的均值 ^41, 若满足 |^一 |< , 完成匹配; 否则, 搜索其他路段, 直至满足| .- „|<4。

5. 如权利要求 4所述的智能化道路交通异常检测方法, 其特征在于, 步骤 2c)所述的历史轨迹数据的预 处理采用下述方法之一:

2cl) 全样本方法: 由一个时空子区内 各辆次浮动车的全部行程车速数据, 构成总体, 实施方法 是计算时空子区 内每辆车的行程车速: = W .+ + -''", 其中 2... 为时空子区

~

内的第 1个和第 2个 GNSS定位点间的距离, ......, 第《-1个与第 n个 GNSS定位点间的距 离, iL.A为时空子区 内第 1个, ......, 第《个 GNSS定位点的时间戳; 将每个时空子区内 的行程车速数据不做筛选, 构成一个集合 ^, 用于后续处理;

2c2) 时间平滑的抽样方法: 指定时间片段长度, 设置同一时间片段数据条数上限; 搜索一个时空 子区各时间片段内的速度数据, 若时间片段内速度数据条数超过上限, 随机取上限条数的数 据用于后续处理,实施方法是计算时空子区 ξ内每辆车的行程车速: Vf = 2 + '3 ''", 其中 2... 为时空子区 内的第 1个和第 2个 GNSS定位点间的距离, ......, 第《-1个与 第《个 GNSS定位点间的距离, ^… 为时空子区^内第丄个, ......, 第《个GNSS定位点的 时间戳; 指定时间片段长度 设置同一时间片段数据条数上限^„∞; 搜索一个时空子区内时 间第 i各时间片段内的速度数据, 若时间片段内速度数据条数超过上限 ρ∞αχ, 随机取 ρ Μ 据加入 ^并用于后续处理。

6. 如权利要求 1至 5之一所述的智能化道路交通异常检测方法, 其特征在于, 步骤 3)所述的历史轨迹 数据分析和 R N模型训练采取以下步骤:

3a) 建立 Elman-RNN神经网络的基本结构, 包括设置输入层的神经元个数, 设置隐含层的神经元 个数, 设置输出层的神经元个数, 设置上下文层的神经元个数, 设置输入层和输出层的偏置 节点并赋初始值;

3b) 设置 Elman-R N神经网络模型的基本参数,包括反向传播算法进行模型训练时的参数学习率, 模拟退火的初始温度和终止温度及每个温度的迭代次数;

3c) 利用所述历史轨迹的抽样车速数据, 进行 RNN模型的训练;

3d) 单次训练后对模型进行处理, 包括更新神经网络的权重, 模型的错误率评估, 及错误率未下降 时的更新策略;

3e) 进行模型训练的停止条件判断, 如果对模型的改善程度小于最小值的次数大于设定的阈值, 则 算法终止, 得到 RNN模型 MRNN

步骤 3)所述的实时轨迹数据分析和特征提取采用下述方法之一:

3f) 时间窗口均值法: 利用所述实时轨迹的抽样车速数据, 计算当前空间子区行程车速在当前时间 子区的均值/ ^(vi rt) = "^£v,, 作为实时交通特征的表示参数;

3g) 滚动时域均值法: 利用所述实时轨迹的抽样车速数据, 计算当前空间子区行程车速在最近 M 个时间子区的均值/ ^ (vf rt) = ~^ $ w, 其中 取3~5, 作为实时交通特征的表示参数。

7. 如权利要求 6所述的智能化道路交通异常检测方法, 其特征在于, 步骤 3a)包含以下步骤:

3al) 将输入层的神经元个数设置为 1 ;

3a2) 将隐含层的神经元个数设置为 5~8;

3a3) 将输出层的神经元个数设置为 1 ;

3a4) 将上下文层的神经元个数设置为与隐含层神经元个数相同;

3a5) 为输入层与输出层各设置一个偏置节点, 初始值均设置为 0;

步骤 3b)包含以下步骤:

3bl) 将反向传播算法进行模型训练时的参数学习率设置为 0.01~0.8;

3b2) 将模拟退火的初始温度设置为 105, 模拟退火的终止温度设置为 10— 2

3b3) 将每个温度的迭代次数设置为 100。

8. 如权利要求 6所述的智能化道路交通异常检测方法, 其特征在于, 步骤 3c)包含以下步骤:

3d) 将每个空间子区的历史轨迹的抽样车速数据按时间排序, 并将排序后的历史轨迹的抽样车速 数据两两组合成 (输入, 输出) 对, 即 ( ),^,^),... ,^^,^)的形式;

3c2) 创建 Elman-RNN神经网络, 其中, 输入层神经元个数为 1个, 隐藏层神经元个数为 5、 6、 7 或 8个, 输出层神经元个数为 1个, 上下文层保存上一个时刻隐藏层的输出, 神经元个数与 隐藏层相同; 使用 Sigmoid激活函数;

3c3) 设置输入层到隐藏层、 隐藏层到输出层神经元之间连接的权重为 0~1之间的随机值; 分别设 置输入层和隐藏层的偏置单元并初始化为 0;

3c4) 采用反向传播算法和模拟退火两种算法, 组成混合策略来训练模型。

9. 如权利要求 6所述的智能化道路交通异常检测方法, 其特征在于, 步骤 3d)采用以下方法之一:

3dl) 贪心策略: 如果某一次训练后模型的错误率没有下降, 恢复权重和错误率为训练前的值; 3d2) 混合策略: 如果某一次训练后模型的错误率没有下降, 或者下降的幅度小于设定的最小值, 则使用模拟退火算法训练; 模拟退火算法的一次训练步骤如下: 首先计算当前模型的误差得 分, 之后对当前模型的所有神经元之间连接的权重和偏置单元的值, 添加一个随机数《ί«, 得 到新的权重和偏置单元的值, Ά中 add = - Random) I startTemp * temp ' 式中, Random为随 机数, 范围为大于 0小于 1, startTemp为初始温度, 取 105, temp为当前温度; 计算更新后的 模型误差得分, 如果新的误差得分小于当前误差得分, 说明新的权重对模型的性能有改进, 则保存新的权重, 否则丢弃; 将当前温度乘以一个固定的比率 ratio 以降低温度: ratio = ex (log (stopTemp I startTemp) /{cycles - 1)) , 式中, stopTemp为终止温度, 取 10— 2, cycles 为一次训练的迭代次数, 取 100; 重复以上过程 cycles次。

10. 如权利要求 1至 5之一所述的智能化道路交通异常检测方法, 其特征在于, 步骤 4)异常检测包括 以下步骤:

4a) 将异常检测所要处理的历史轨迹的抽样车速数据的下标按升序排序的点的序列 v v2,... ,vn; 将数据以二维点的形式在平面坐标表示为 (1 ;),. .

4b) 计算 RNN 模型的预测值 i>=MRNN( ), 并计算模型预测值与真实值的差异 diff [vrnvpr ] = \vpr - rt \ .

步骤 5)异常严重性量化表征包括:

5a) 将各个时空子区的

5b) 计算各个时空子区的交通异常指数 10。

Description:
一种智能化道路交通异常检测方法

技术领域

本发明属于交通检测技术领域。 特别地, 本发明涉及一种城市道路交通异常实时检测方 法。 通过 浮动车的车载 GNSS定位装置, 可获取其不同时刻的空间位置信息, 经过数据预处理、 地图匹配和数 据融合, 基于特定时空范围的行程车速历史数据训练 R N模型; 根据 RNN模型预测值与实时行程车 速真实值间的差异, 可有效识别城市道路交通异常事件。 背景技术

交通异常事件检测是城市交通管理的重要组成 部分, 也是智能交通系统的核心功能之一。 交通异 常事件主要包括交通事故、 车辆抛铺、 货车落物、 道路交通设施损坏或故障以及其他造成交通流 紊乱 的特殊事件。 该类事件容易造成交通拥堵、 路段通行能力降低, 严重时影响整个道路交通系统的正常 运行。 通过交通异常事件检测, 可使交通管理者及时了解交通异常信息, 并采取适当的诱导和控制措 施, 降低交通异常事件的不良影响。

交通异常事件检测可分为人工方式和自动方式 。 人工方式包括巡逻车、 紧急电话上报和视频监控 等, 由于消耗人力物力且实时性差, 无法满足交通管理的需要。 自动方式依靠自动事件检测 (AID, Automated Incidence Detection)算法实现, 基本原理是通过检测不同位置道路交通流的变 化来识别交通 异常事件。 目前常用的 AID算法包括模式识别类算法 (如 Califorma算法、 莫妮卡算法)、 统计预测类 算法(如指数平滑法、 卡尔曼滤波算法)、 交通流模型算法(如 McMaster算法) 以及智能识别算法(如 人工神经网络、 模糊逻辑算法)。

但是目前的检测方法存在对设施的要求高、 计算复杂度高、 无法对异常状况的态势做进一步判断 等缺点。 本发明利用出租车、 公交车车载 GNSS定位装置回传的轨迹数据, 建立历史交通状态数据库 和实时交通状态数据库, 通过分析两者反映的交通流特征差异, 识别交通异常事件。 该方法具有实时 性好、 可并行处理、 识别率高以及对检测设施要求低等特点, 适用于有实时浮动车定位数据的数据环 境下城市道路交通异常事件的检测。

目前, 针对交通异常事件监测, 有以下代表性技术:

一件美国专利申请, US 20160148512, 披露了一种交通异常事件检测和上报系统的组 成原理和实 施方法。 该系统由传感器、 通信模块、 移动处理模块和用户交互模块组成。 传感器用于采集车辆周边 的相关数据; 通信模块用于发送本车辆数据和接收周边车辆 的数据; 移动处理模块用于处理和分析相 关车辆在某一区域内的数据并生成交通事件报 告; 用户交互模块能够像用户提供交通事件报告。 该方 案是一种基于车车和车路通讯网络的交通异常 事件检测技术, 能够利用传感器采集的各类信息, 判别 异常事件。 然而, 由于传感器、 通信单元需要单独安装调试, 实施难度较大; 移动处理单元处理能力 受限; 同时需要移动和固定的讯息接收端, 系统本身存在故障概率, 可靠性不佳。

一件中国专利申请, CN 104809878 A, 披露了一种利用公交车 GPS数据检测城市道路交通异常状 态的方法。 该方案根据 GPS历史数据获得路段延误时间指数, 根据 GPS当前数据获得瞬时速度、 周期 平均速度、 加权滑动平均速度和多车平均速度, 利用规范变量分析算法检测异常。 这一方案不需要新 增检测设施, 实施便利。 但是对于交通态势的表征过于简化, 无法分析交通异常状况的特点和成因; 对交通场景的划分缺乏依据, 未能考虑天气等因素对交通态势变化的影响。 发明内容

为了更清晰地阐述本发明的内容, 首先将涉及到的专业术语解释如下:

浮动车: 也称探测车。 指安装了车载定位装置并行驶在城市道路上的 公交汽车和出租车。

GNSS: 全球导航卫星系统(Global Navigation Satellite System )。包括 GPS、 GLONASS、 GALILEO 以及北斗卫星导航系统等。

时空子区:按照时间和空间两个维度划分的片 区,反映在一段时间内, 一定的空间范围内的情况。 将一天划分为若干时间片段, 例如 0:00-0: 10, 0: 10-0:20……, 称之为时间子区; 将城市道路交通异常 检测的实施区域划分为若干空间片段, 例如经度 121.58° E-121.59 0 E, 纬度 31.16° N-31.17° N之间 的区域, 即空间子区;任意一个时间子区和任意一个空 间子区的交集形成的时空片段,称为时空子区 , 例如经度 121.58° E-121.59 0 E, 纬度 31.16° N-31.17 0 N之间的区域在 0:00-0: 10的时空片段。

历史轨迹数据: 历史轨迹数据是长时间积累并存储在数据库中 的轨迹数据。 历史轨迹数据是动态 变化的数据, 需要及时进行更新, 并定期做重新处理和分析, 以保证历史交通特征提取的准确性。 每 个时空子区的数据可以并行处理以提高效率。 本发明中可简称为历史数据。

实时轨迹数据: 实时轨迹数据是距离当前时刻最近的一个时间 区段内的轨迹数据集合。 本发明中 可简称为实时数据。

交通态势: 一定时间、 一定空间内交通运行的综合情况的总称。

交通异常: 交通事故、 车辆抛铺、 货车落物、 道路交通设施损坏或故障等事件引发的交通流 紊乱 的情况。

交通异常严重性: 即交通流紊乱的严重性, 是正常状态下交通流与交通异常发生后交通流 特征的 差异。

交通异常指数: 交通异常严重性的量度。 范围为 0~10, 数值越大, 交通异常越严重。

交通环境: 作用于道路交通参与者的所有外界影响与力量 的总和。 包括道路状况、 交通设施、 地 物地貌、 气象条件, 以及其他交通参与者的交通活动。

地图匹配: 将地理坐标与城市路网关联的过程。

髙峰小时流量: 某城市道路断面一日内小时交通流量的最大值 。

响应变量: 根据自变量发生改变的变量, 也称因变量。

RNN: 即循环神经网络 (Recurrent Neural Network) , 是一种节点定向连接成环的人工神经网络, 这种网络的内部状态可以展示动态时序行为, 可以利用它内部的记忆来处理任意时序的输入 序列。

Elman-RNN: 一种 RNN网络结构, 参见 《A RNN that learns to count))□

训练过程: 通过迭代计算来优化神经网络参数, 使神经网络在训练数据集上的模型误差降低的 过 程。 本发明的目的是建立一套基于浮动车轨迹记录 系统, 利用历史 GNSS定位数据和实时 GNSS定位 数据, 结合交通环境信息识别道路交通异常事件的方 案。 为了达到上述目的, 本发明提供了如下技术 方案:

本发明的实施前提是: 搭载 GNSS轨迹记录仪的浮动车 (出租车、 公交车等); 具有大规模存储、 计算、 实时任务处理能力的数据中心。

本发明的适用范围是: 有上述浮动车经过的城市道路 (包括地面道路和高架道路)。

本发明的实施步骤包括:

1) 确定检测的时空范围和建立时空子区。

基于实际的应用需求, 确定需要进行交通异常事件检测的时间范围和 空间范围。 时间范围可以设 定为全天, 即 0:00-24:00; 也可以设定为某一特定的时段, 例如要检测 17:00-20:00这个时段的交通异 常时间, 则将检测时间范围设定为 17:00-20:00, 这里只是列举一个特殊实例, 还有很多其他情况, 此 处不再一一说明。 空间范围可以按照行政区划设置为某个市域, 例如北京市、 上海市、 黄浦区等; 也 可以按照城市空间结构设置为某个城市功能区 , 例如某市中央商务区、 工业区等。

时空子区的建立是指, 将检测的时间范围划分为若干个更小的时间片 段, 将检测的空间范围, 即 城市道路交通异常检测的实施区域, 划分为若干个更小的空间片段。 时空子区的建立, 可以采用多种 经验划分方法, 包括等距时空划分法和非等距时空划分法。

2) 数据预处理。

将 GNSS定位数据进行数据清洗、数据集成、数据 换、数据归约,提高数据的结构化程度。 GNSS , 即全球导航卫星系统定位系统, 是能在地球表面或近地空间的任何地点为提供 全天候三维坐标和速度 以及时间信息的空基无线电导航定位系统。 它主要包括美国的 GPS ( Global Positioning System) , 俄罗 斯的 GLONASS ( Global Navigation Satellite System)、 欧盟的 GALILEO和中国的北斗卫星导航系统四 大全球性导航定位系统, 同时还包括日本的 QZSS、 印度的 IRNSS 等区域导航定位系统以及美国的 WASS、 日本的 MSAS 等卫星定位增强系统。 为了在不同的导航定位系统设备中建立统一的 数据分发 标准,美国国家海洋电子协会制定了统一的 NEMA (National Marine Electronics Association)通讯协议, 以规范 GNSS的数据广播。 因此, GNSS中的各个成员系统, 例如 GPS、 GLONASS等, 虽然分别由 不同国家和机构建立和维护, 但是拥有一致的数据分发格式, 因此不需要对数据格式进行变换。

选定的空间范围内, 有许多安装 GNSS 定位设备的车辆, 常见的有出租车、 公交车、 货运汽车、 私家车等。 基于当前城市交通数据应用现状, 在实际应用当中, 通常选用城市出租车为浮动车作为交 通异常检测系统的数据来源。

采集的 GNSS定位信息中包含一些不合理的信息,为了 证交通异常状态检测判别结果的准确性, 首先需要进行甄别以提出异常的数据, 保证数据的可靠性。 这些异常数据包括: 落在检测时空范围之 外的数据、 明显超出合理范围的空间位置跳跃。 所谓 "明显超出合理范围的空间位置跳跃", 下面举例 说明之。 若某日 10:30:00时刻某辆浮动车定位设备上传的定位点 为 A, 当日 10:30:30时刻该浮动车 定位设备上传的定位点记为 B, 位置 A与位置 B的距离为 1500米, 那么据此计算得到该浮动车的行 驶速度至少为 180km/h, 超出了一般常识, 因此是一种异常的空间位置跳跃, 数据处理中应当予以剔 除。

3) 快速地图匹配。

经过预处理后的 GNSS定位数据, 需要结合城市路网数据, 通过地图匹配算法, 将 GNSS定位点 投影到城市地图, 建立定位点与路段的匹配关系, 并修正定位漂移带来的误差。

目前各个地理区域的电子地图都已较为详实, 这种电子地图可以来源于城市的地理信息系统 , 当 然也可以来源自其他方式和途经。 这些电子地图对城市道路信息进行了详细刻画 , 通过划分可以得到 若干路段。 通过借助距离、 角度等信息, 将定位点匹配到路段上, 这样就实现了将定位信息匹配到实 际的地理环境中。 4) 浮动车路径的表示和不同车辆路径的匹配。

在给定一组起终点的前提下,车辆的路径可能 不是唯一的。复杂的城市交通路网包含了若干 路段, 将这些不同的路段进行编号, 例如, 将路段表示为 Ll, L2等。 道路可能有两个不同的行驶方向, 在这 种情况下, 应该将两个不同的行驶方向表示为两个不同的 路段, 给予不同的路段编号。

给定的起点和终点, 通常可采用城市路网中路段的交点。 已知某浮动车行驶的路径, 现需要从其 他浮动车已经发送的路径信息中, 选择与该浮动车路径相同的路径, 从而获得起点和终点间的同路径 组。

5) 数据抽样。

浮动车的定位数据中, 包含位置坐标、 瞬时车速、 记录时间等信息。 在本专利提出的基于浮动车 数据的城市道路交通异常检测方法中, 数据抽样是指从全部的浮动车数据中筛选出部 分数据进行后续 的分析处理, 这种筛选是基于数据中心的计算能力以及预先 提出的精度要求而进行的。 基于不同的计 算能力和精度要求, 可采用不同的数据抽样方法。 例如, 当数据中心的计算能力较强, 且对检测的精 度要求较高时, 可以将全部的浮动车定位数据作为处理对象, 进行全面的处理分析; 而当数据中心的 计算能力有限时, 假定当前的数据中心能够在 1分钟内, 对每个空间子区处理 500条数据, 而实际情 况是在 1分钟每个空间子区能产生了 2000条浮动车定位数据,那么可以从 2000条数据中随机抽取 500 条数据进行分析, 从而在数据中心的计算能力范围内, 获得精度受限的处理结果。

根据对浮动车数据利用方式的不同, 可以针对浮动车数据的不同属性进行采样, 例如行程车速和 行程时间等。 本专利中提出的基于浮动车数据的城市道路交 通异常检测方法, 采用行程车速作为基础 进行城市道路交通异常检测。 因此, 数据抽样是指对行程车速进行抽样。

6) 历史轨迹数据分析和 R N模型训练。

所谓历史轨迹数据, 是指在长期的城市道路交通运行中积累下来的 浮动车轨迹数据。 利用历史浮 动车轨迹数据, 可以建立城市道路交通特征模型, 用来反映城市交通运行的一般特性。 这里所说的城 市道路交通特征模型, 可以指某些特定的指标, 例如平均速度、 加权平均速度等; 也可以指各种某种 统计模型, 例如行程速度的概率分布。 以往的很多模型, 采用单一的指标来表示某个路段或区域的交 通特征 (如历史平均车速), 这种方式虽然应用简便, 但是精度不高, 敏感性差, 往往不能在交通异常 状态检测中发挥良好的效果。 因此, 本专利提出对于每个时空子区, 用交通特征变量的变化情况进行 RNN模型的训练。 该 R N模型可在给出前若干时段交通特征变量真实 时, 给出下一时刻交通特征 变量的预测值。

可采集的交通特征变量, 包括行程车速和行程时间等, 本专利采用行程车速反映交通运行特征, 故交通特征变量指行程车速。

7) 实时轨迹数据分析和特征提取。

所谓实时轨迹数据, 是指距离当前时刻不远的一段时间内的交通运 行中浮动车的轨迹数据。 利用 实时浮动车轨迹数据, 可以掌握交通特征的变化动态, 用来反映当前交通运行的即时特性。 本专利采 用当前时空子区的行程速度描述当前交通特征 。

8) 异常检测。

系统状态异常检测的思想最早由 Dennrng提出,即通过监视系统审计记录上系统 用的异常情况, 可以检测出违反安全、 可能引发系统异常的事件。 Dennrng建立的这种模型独立于任何特定的系统 应 用环境、 系统弱点、 故障类型, 因而是一种普遍意义上的异常检测模型。 该模型包括主体、 客体、 审 计记录、 轮廓、 异常记录和活动规则 5个部分。 轮廓是用度量和统计模型来表示的主体相对于 客体的 正常行为。 Dennrng 的模型定义了 3 种度量, 即事件计数器、 间隔定时器、 资源测量器, 并提出了 5 种统计模型, 即可操作模型、 均值和标准差模型、 多变量模型、 马尔可夫过程模型和时间序列模型。 Denning提出的模型通过对系统审计数据的分析 建立起系统主体的基于统计的正常行为特征轮 廓, 检 测时, 系统中的审计数据与已建立的主体的正常行为 特征轮廓相比较, 若相异部分超过某个阈值, 就 认为是一个异常事件。 该模型奠定了异常检测的基础, 以后发展的许多异常检测方法和系统都是以它 为基础而发展起来的。

近几年在异常检测技术的发展过程中, 引入了更多人工智能的方法, 以提高异常检测的性能。 这 些人工智能的方法主要包括数据挖掘、 人工神经网络、 模糊证据理论等。 数据挖掘的方法用来确定在 大量的数据集合中什么特征是最重要的。 该技术用于异常检测中主要是寻求一种正常模 式更简洁的定 义, 而不是像传统的异常检测方法那样简单列举出 所有的正常模式。 数据挖掘方法的引入使得检测系 统能仅通过识别正常模式中的主要特征, 就能够概括性地包括训练数据中所未包括的正 常模式。 人工 神经网络异常检测问题可被看作是一个一般的 数据分类问题.在前面谈到的统计异常检测中 用户行为 数据按照某种统计准则被分为两类: 即异常行为和正常行为。 由于基于统计的方法在提取、 抽象审计 实例时存在一定困难, 可能造成较大误差, 必须依赖于一些概率分布假设, 一般需要凭经验和感觉来 刻画用户行为的度量, 所以引入了人工神经网络的聚类方法。 人工神经网络具有自学习自适应能力, 用代表正常用户行为的样本点来训练神经网络 , 通过反复多次学习, 神经网络能从数据中提取正常的 用户或系统活动的模式, 并编码到网络结构中, 检测时, 将审计数据通过学习好的神经网络, 即可判 定系统是否正常。 由于异常的评判标准具有一定的模糊性, 所以模糊证据理论被引入到异常中, 如建 立一种基于模糊专家系统的入侵检测框架模型 , 能较好地降低漏警率和虚警率。

本专利提出一种基于循环神经网络的异常检测 方案, 特别地, 是一种采用 RNN (循环神经网络) 的异常检测方案, 对实时轨迹数据输入基于历史数据的 R N模型, 得到预测值, 再比较预测值与真实 值之间的差距。 该方案采用了深度学习方法, 能够随着时间的推移自动更新模型, 具有较强的自适应 能力。

9) 异常严重性量化表征及异常信息发布。

交通异常状况的严重性应该通过简洁明了的方 式向公众发布, 以避开可能的拥堵区域, 提高城市 交通的运行效率。 异常状况的严重程度用交通异常指数表征, 范围为 0-10, 其中 0表示无异常, 10表 示高度异常。

异常的发生位置投影到电子地图上, 并通过智能移动设备 APP等形式公开发布。

10) 系统性能评价。

系统性能的评价是指评价交通异常状态检测的 准确性, 其评价指标包括误报率和漏报率。 误报率 和漏报率越低表明系统的性能越好。 所述步骤 1)中, 时空子区的划分具体可以采用以下方法:

11) 等距时空划分法。确定时间维度的片段尺度, 时间片段跨度为固定值, 通常取 30mm作为一个 时间片段; 确定空间维度的片段尺度, 空间片段跨度为固定值, 通常取 200mX 200m的空间网格作为 一个空间片段。

12) 非等距时空划分法。对于路网密度大于 2km/km 2 或高峰小时流量大于 1000辆 /小时的城市中心 区, 取 30min的时间片段和 200m X 200m的空间片段, 对于路网密度小于 2km/km 2 或高峰小时流量小 于 1000辆 /小时的城市郊区, 取 30min的时间片段和 400mX 400m的空间片段。 所述步骤 3)具体包含以下步骤:

31) 将所需处理的空间区域划分为一定大小的格网 , 每个格网区域的范围可表示为 ={(x s ,y s )\x s ^[x r ,x r+1 ),y s ,^, +1 )}' 每个格网区域包含若干个路段, 把这些路段的集合表示为 R S , 所述路段的集合 中的每条路段表示为 ij, 并为每个路段赋予编号;

32) 判定定位点所在的格网区域, 并利用距离和方位角, 在路段的集合 中搜索某定位点 A所在 的路段^ 匹配方案包括:

321) 单点匹配方案:

搜索距离点 A最近的路段, 当满足点 A的行驶方向角与路段 ij的方向角的差值小于阈值时, 即满 足 | - |< , 完成匹配, 所述的阈值 可取 2.5° , 5° , 10° 等; 若不满足 | < , 在搜索空 间中删除路段 并继续搜索其他路段, 直至满足 t条件。 匹配方法如图 3所示。

322) 点序列匹配方案: X

本方案适用于高频浮动车数据。 将浮动车 GNSS数据采集频率表示为 f 0 =\l , 将时间上与 A相邻 的点 POHO), Pfc+i。;)定义为 Α的 1-邻近点, P04-2i Q ;), P 4+2i Q )定义为 A的 2-邻近点, 以此类推, 则 P(t A -kk), Pfc+ 定义为 A的 /t-邻近点。 在/ Q <lHz时, 取 /t=l或 2。 取距离 A及 A的 /t-邻近点距离最 小的路段^并计算 A及 A的 邻近点行驶方向角的均值^^若满足 | .- |< ,完成匹配;否则, 搜索其他路段, 直至满足|^.- |< 。

33) 利用路段的直线方程 (若为曲线路段则近似拆分为直线), 计算 GNSS定位点在路段上的投影 坐标, 减小因 GNSS定位漂移带来的误差。 具体方法采用 GNSS定位点直线投影法为:

确定路段 ^的直线方程 (若路段为曲线, 则划分为若干直线路段): y-y, =k(x-x,) 其中斜率为: 投影直线方程为: y-y A 解出投影坐标 P为

k 2 +\

k 2 y A +y i +kx A -kc i

k 2 +\

在地图匹配过程后 , 结合定位点坐标的时间戳数据, 将定位点匹配到时空子区 所述步骤 5)具体可以采用以下方法之一:

51) 速度信息的全样本方案。 由一个时空子区内各辆次浮动车的全部行程车 速数据, 构成总体。 实 施方法是计算时空子区 ξ内每辆车的行程车速: = + -''", 其中 4, 2 ...4— 为时空子区 ξ 内的第 1个和第 2个 GNSS定位点间的距离, ... ..., 第《- 1个与第《个 GNSS定位点间的距离, ... t n 为时空子区 内第 1个, ... ..., 第《个GNSS定位点的时间戳; 将每个时空子区内的数据不做筛选, 构成一个集合 ^, 用于后续处理。

52) 速度信息的时间平滑抽样方案。指定时间片段 长度, 同一时间片段数据条数上限; 搜索一个时 空子区内时间各时间片段内的速度数据, 若时间片段内速度数据条数超过上限, 随机取上限条数的数 据加入待处理数据样本。 实施方法是计算时空子区 内每辆车的行程车速: v f = 2 " 2 ' 3 + ... + - ''", 其中 2 ... 为时空子区 内的第 1个和第 2个 GNSS定位点间的距离, ... ..., 第《- 1个与第 n个

GNSS定位点间的距离, 为时空子区 内第 1个, ... ..., 第《个 GNSS定位点的时间戳; 指定时 间片段长度 t p , 同一时间片段数据条数上限;^ αχ; 搜索一个时空子区内时间第 各时间片段内的速度数 据, 若时间片段内速度数据条数超过上限; ^«, 随机取;^ 条数据加入 ^并用于后续处理。 所述步骤 6)具体包含以下步骤:

61) 确定 R N的网络结构, 这里使用 Elman-RNN神经网络的基本结构, 网络结构如图 4、 图 5所 示。 网络具体包含以下组成部分:

611) 输入层: 根据神经网络的特征, 输入层为待训练的历史数据的各个实例, 由于这里的输入数 据是一维的数据流, 即空间子区内的行程车速数据在时间维度上构 成的时间序列数据, 因此, 输入层 神经元个数和输出层神经元个数都设置为 1。

612) 隐含层: 在神经网络的设计中, 隐含层的个数设置尚未有定论, 一般都需要通过大量实验来 最终确定网络模型的隐含神经元的个数, 建议取值为 5~8。

613) 输出层:建立神经网络的目的是输出预测值, 即通过前两个时刻的值来预测下一个时刻的值 。 输出层输出值为预测值, 因此输出层个数设置为 1。

614) 上下文层(Context层):在 Elman-Network中,上下文层用于保存前一个时刻 含层的输出, 因此上下文层神经元个数与隐含层个数取相同 值。

615) 偏置节点: 输入层和输出层各含有一个偏置节点, 初始值均设置为 0。

62) 设置 Elman-RNN神经网络模型的基本参数:

Elman网络结构中包含两个参数,分别为隐含层 经元个数和上下文层的层数。隐含层神经元 数 通过多次试验选择较好的结果,建议的设置为 5~8;由于一个上下文层保存前一个时刻的隐含 层输出值, 建议设置为 1。

使用反向传播算法进行模型的训练时需要设置 参数学习率。 学习率的大小决定了神经网络迭代过 程中权值的变化程度, 大的学习率能使算法迅速收敛, 但是可能会陷入局部解, 小的学习率使得算法 的收敛速度较慢, 但是能保证收敛到全局最小, 因此, 通常情况下, 学习率的取值应该选取较小值, 以确保模型的性能和稳定性, 建议设置为 0.01到 0.8。

在算法的模拟退火模块中, 需要设置初始温度、 终止温度和每个温度值的迭代次数。 初始温度的 取值对算法性能有着重要影响,初始温度越大 , 算法的迭代次数越多, 收敛到最小值的可能性也越大, 但是时间花销也越大。 同样地, 初始温度较低时, 算法的性能将受到影响, 但是时间花销也较少。 在 实际应用中, 初始温度的设置需要通过多次反复试验进行选 择。 终止温度是指在温度下降过程中, 终 止算法所设置的下限温度。 每个温度值的迭代次数越多, 产生可能解的个数越多, 收敛到全局最小值 得可能性也就越大。 建议将初始温度设置为 10 5 , 将终止温度设置为 10— 2 , 将每个温度的迭代次数设置 为 100。

63) 进行 R N模型的训练。 R N模型的输入为行程车速构成的时间序列数据 ={ ν 2 , ... , v n } , 输出为具有最优参数的 Elman-R N神经网络模型。 模型训练的步骤如下:

631) 从数据文件或数据库中读取数据,并将数据组 合成(输入,输出)对,即 ^ O^H^ ) 的形式, 以便进行模型训练。

632) 创建 Elman-RNN神经网络, 其中, 输入层神经元个数为 1个, 隐藏层神经元个数为 5~8个, 输出层神经元个数为 1个, 上下文层保存上一个时刻隐藏层的输出, 神经元个数与隐藏层相同, 由于 训练数据中的输出都是正数, 使用 Sigmoid激活函数。

633) 初始化 R N 模型, 设置输入层到隐藏层, 隐藏层到输出层, 神经元之间连接的权重为随机 值, 分别设置输入层和隐藏层的偏置单元, 并初始化为 0。

634) 设置主要训练算法为反向传播算法, 备用算法为模拟退火算法, 使用这两个算法的混合策略 来训练模型, 在训练过程中, 如果某次训练后模型的错误率没有下降, 或者下降的幅度小于设定的最 小值, 则使用模拟退火算法训练; 使用贪心策略, 如果某次训练后模型的错误率没有改善, 则放弃更 新权重, 将模型的权重重置为上一次的训练结果。

635) 开始训练前, 保存贪心策略需要的当前模型的网络权重和错 误率。 保存混合策略需要的当前 模型的错误率。 开始训练, 对于上下文层和输入层数据, 分别乘以对应的权重, 加上偏置, 通过激活 函数计算出隐藏层的输出。 隐藏层数据乘以对应的权重, 加上偏置, 通过激活函数, 得到模型的输出。 计算实际输出和模型输出的差值, 使用反向传播算法将误差反向传递到隐藏层和 输入层, 计算梯度。 根据算出的梯度计算权重增量, 更新权重, 保存更新后的权重。 复制隐藏层输出到上下文层。

64) 单次训练后, 使用以下策略对模型进行处理:

641) 贪心策略: 如果本次训练错误率没有改善, 恢复权重和错误率为上一次的值。

642) 混合策略: 如果本次训练后模型的错误率没有下降, 或者下降的幅度小于设定的最小值, 则 使用模拟退火算法训练。 模拟退火算法的一次训练, 大致步骤如下: 首先计算当前模型的误差得分, 之后对当前模型的所有权值和偏置值, 添加一个随机数《ί«, 得到新的权重和偏置值, 其中:

, , 0.5— Random .

add = * temp

startTemp

式中, Random为随机数, startTemp为初始温度, temp为当前温度; 计算更新后的模型误差得分, 如 果新的误差得分小于当前误差得分, 说明新的权重对模型的性能有改进, 则保存新的权值, 否则丢弃; 将当前温度乘以一个固定的比率 ratio以降低温度:

\o stopTemp I startTemp)

ratio = exp

cycles - 1

式中, stopTemp为终止温度, cycles为一次训练的迭代次数。 重复以上过程 cycles次。

65) 停止条件判断: 如果对模型的改善程度小于最小值的次数大于 设定的阈值, 则算法终止。 重复 63)、 64) , 65;)步骤直到算法终止, 得到训练好的 R N模型。 训练过程参见图 6。 所述步骤 7)具体可以采用以下方法之一:

71) 时间窗口均值法。使用数据抽样得到的行程车 速数据, 计算当前空间子区行程车速在当前时间 子区的均值/ rt , rt ) = "^ , 作为实时交通态势的表征。

N 7

72) 滚动时域均值法。 使用数据抽样得到的行程车速数据, 计算当前空间子区行程车速在最近 M 个时间子区的均值/ rt ( irt ) = ~^£$^,,, 其中 M—般取 3~5, 作为实时交通态势的表征。

所述步骤 8)具体包含以下步骤:

81) 将异常点检测所要处理的时间序列数据下标按 升序排序的点的序列 Vl ,v 2 ,...,v„。 为了对数据 进行拟合, 将数据以二维点的形式在平面坐标表示为 (1 ),...,(《,1„)。

82) 为了检测异常点数据, 需计算 RNN模型预测的数据与真实数据的差值, 具体实现过程如下:

821) 已知根据历史数据拟合的模型 ^, 计算拟合模型的预测值

822) 计算模型预测值与真实值的差异: [^,^] = |^- ^。 所述步骤 9)具体包含以下步骤:

91) 将各个时空子区的速度分布差异标准化为 0~1的规范化数值《 ί:

diff^ -vam diff)

一 max diff^ - min {diff、

92) 计算各个时空子区的交通异常指数 10;

93) 将异常指数高于 5的区域位置投影到电子地图上, 并智能移动设备 APP等形式向社会公开发 布, 以使司机避开潜在拥堵点, 提高城市道路交通的通行效率。 所述步骤 10)具体包含以下步骤:

101) 计算交通异常状态的漏报率:

A = ><100%

102) 计算交通异常状态的误报率:

=^χ100%

n

以上两式中, 为单位时间内漏报事件总数, 为单位时间内误报事件总数, 《。为单位时间内实际 发生的异常时间总数。 本发明相较于同一领域的相似技术, 具有以下优点:

(1) 充分利用现有的浮动车运营数据 (GNSS 轨迹数据), 通过历史交通特征提取和实时交通态势 分析, 检测交通状态发生的变化, 可以实现城市道路交通异常事件实时性、 低成本、 智能化检测;

(2) 将交通特征的变化情况建立 R N模型, 能够更加细致全面地反映交通运行规律, 避免了利用 单一指数表征交通特征的片面性、 不稳定性, 检测的可靠性更高; (3) 能够自适应地调整模型参数, 反映交通运行规律在大时间尺度下的细微变化 ;

(4) 经实际数据的检验, 本发明提出的基于浮动车数据的城市道路交通 异常检测技术, 能够实现准 确度较高的异常事件检测, 检测率超过 90%, 漏报率低于 15%, 误报率低于 20%, 取得了良好的检测 效果, 可以应用于城市交通智能化管理、 服务。 附图说明

本发明的具体内容及优点结合以下附图将变得 明晰和易于理解, 其中:

图 1示出了本发明的组成要素和基本原理示意图

图 2示出了本发明在实施过程中的总体流程示意 ;

图 3示出了本发明快速地图匹配算法实施方式示 图;

图 4示出了本发明中 RNN的结构简图;

图 5示出了本发明中 RNN的结构详图;

图 6示出了进行 R N训练的流程示意图;

图 7示出了本发明通过 RNN模型与真实数据的对比进行异常检测的流程 示意图。 具体实施方案

为了更加清晰明确地表述本发明的目的、 技术方案和优势, 下面对本发明的具体实施方案进行详 细描述。

如附图 1所示, 本发明的整体系统构架包括: 浮动车搭载的车载 GNSS轨迹记录仪、 数据中心、 GNSS卫星以及通信系统。 此处的 GNSS包括 GPS、 GLONASS、 GALILEO、 北斗、 IRNSS、 QZSS等 任何类似的导航卫星定位系统。 出租车、 公交车等浮动车搭载的 GNSS轨迹记录仪, 以一定的采样频 率/ (一般要求戶 0.1Hz) 记录车辆在行驶中各时点的位置信息, 并通过 GPRS移动通信网络 (亦可采 用 WCDMA、 TD-LTE 等无线网络通信技术, 但成本将相应提高) 将位置信息实时发送至数据中心。 数据中心通过数据预处理、 数据融合, 并通过特定算法建立历史道路交通特征数据库 ; 对于最近接收 的实时数据, 建立实时交通特征数据库; 通过历史数据库和实时数据库的映射关系, 判别当前交通特 征是否异常, 并通过处理终端进行可视化展示并生成交通异 常事件报告。

方案的总体流程参见图 2, 包括采集和存储 GNSS轨迹数据, 建立时空子区, 历史交通特征提取, 实时交通特征提取, 异常识别等步骤。 采集和存储 GNSS轨迹数据, 是整个方案的数据基础, 由于数 据量级巨大, 应采用分布式存储方案, 对于分布式存储目前已有成熟的技术, 不是本发明的内容。 建 立时空子区, 其基本假设是在某一特定区域、 特定时段内, 有着相同的交通特征, 这一假设, 经过长 期观测, 是普遍适用的。 历史交通特征提取, 其原理是利用 GNSS轨迹数据, 计算得到行程车速, 利 用同一时空子区大量的历史行程车速数据, 训练 Elman-RNN模型, 利用该神经网络模型表征交通特征 的变化规律。 实时交通特征提取, 其原理是将当前时间段内的行程车速数据进行 处理分析, 获得实施 交通特征统计量。异常识别是将历史行程车速 训练的 Elman-RNN模型得到的预测值域真实值进行比较, 确定是否出现交通异常事件。

根据发明内容所述实施方法的组合, 给出实施例如下。 实施例一

步骤 11、采用等距时空划分法, 确定时间维度的片段尺度, 时间片段跨度为固定值, 通常取 30mm 作为一个时间片段; 确定空间维度的片段尺度, 空间片段跨度为固定值, 通常取 200mX200m的空间 网格作为一个空间片段。

步骤 12、 进行数据预处理, 将 GNSS定位数据进行数据清洗、 数据集成、 数据转换、 数据归约, 提高数据的结构化程度。

步骤 13、 将所需处理的空间区域划分为一定大小的格网 , 每个格网区域的范围可表示为

A s = {(x s ,y s ) I x s e [x r ,x r+1 ),y s e [y r ,y r+1 )}; 判定定位点所在的格网区域, 并利用距离和方位角, 搜索定 位点所在的路段; 搜索距离点 A最近的路段, 取阈值 ^=2.5° , 当满足点 A的行驶方向角与路段 ^的 方向角的差值小于阈值 时, 即满足 | - |< , 完成匹配; 若不满足 | - |< , 在搜索空间中删 除路段 并继续搜索其他路段, 直至满足条件; 利用路段的直线方程 (若为曲线路段则近似拆分为 直线), 计算 GNSS定位点在路段上的投影坐标, 减小因 GNSS定位漂移带来的误差, 具体方法为: 确定路段 ^的直线方程 (若路段为曲线, 则划分为若干直线路段): y-y, =k(x-x,) 其中斜率为: 投影直线方程为: 解出投影坐标 P为:

k 2 y A +y, +kx A -h,

k 2 +\

在地图匹配过程后, 结合定位点坐标的时间戳数据, 将定位点匹配到时空子区。

步骤 14、 由一个时空子区内各辆次浮动车的全部行车车 速数据, 构成总体。 计算时空子区 内每

I d.

辆车的行程车速: 其中 2 ... 为时空子区 内的第 1个和第 2个 GNSS定 位点间的距离, ......,第《-1个与第 n个 GNSS定位点间的距离, 为时空子区 内第 1个, ......, 第《个 GNSS定位点的时间戳;将每个时空子区内的数 不做筛选,构成一个集合 V { ,用于后续处理。

步骤 15、 建立由输入层、 隐含层、 输出层、 上下文层、 偏置节点组成的 Elman-RNN神经网络, 输 入层神经元个数设置为 1, 隐含层神经元个数设置为 5, 输出层神经元个数设置为 1, 上下文层神经元 个数与隐含层个数取相同值,也设置为 5,偏置节点的初始值设置为 0;设置各个组成部分的初始参数, 其中学习率设置为 0.1, 模拟退火模块中初始温度设置为 10 5 , 终止温度设置为 10— 2 , 每个温度的迭代 次数设置为 100; 将 ^作为输入数据, 进行神经网络的训练, 最终获得训练好的 R N模型。 步骤 16、将实时交通数据在当前时间窗口上取均值 / rt , rt ) = "^ J .,作为实施交通态势的表征。 步骤 17、 将异常点检测所要处理的时间序列数据下标按 升序排序的点的序列 Vl ,v 2 ,...,v„, 已知根 据历史数据拟合的模型 ^, 计算拟合模型的预测值 (V); 计算模型预测值与真实值的差异 步骤 18、 将各个时空子区的速度分布差异标准化为 0~1的规范化数值 α ξι:

diff^ -mm(diff)

max [diff、 - min、diff、

计算各个时空子区的交通异常指数 10。 实施例二

步骤 21、采用等距时空划分法, 确定时间维度的片段尺度, 时间片段跨度为固定值, 通常取 30mm 作为一个时间片段; 确定空间维度的片段尺度, 空间片段跨度为固定值, 通常取 200mX200m的空间 网格作为一个空间片段。

步骤 22、 进行数据预处理, 将 GNSS定位数据进行数据清洗、 数据集成、 数据转换、 数据归约, 提高数据的结构化程度。

步骤 23、 将所需处理的空间区域划分为一定大小的格网 , 每个格网区域的范围可表示为 A s = {(x s ,y s ) I x s e [x r ,x r+1 ),y s e [y r ,y r+1 )}; 判定定位点所在的格网区域, 并利用距离和方位角, 搜索定 位点所在的路段; 搜索距离点 A最近的路段, 取阈值 ^=2.5° , 当满足点 A的行驶方向角与路段 ^的 方向角的差值小于阈值 时, 即满足 | - |< , 完成匹配; 若不满足 | - |< , 在搜索空间中删 除路段 并继续搜索其他路段, 直至满足条件; 利用路段的直线方程 (若为曲线路段则近似拆分为 直线), 计算 GNSS定位点在路段上的投影坐标, 减小因 GNSS定位漂移带来的误差, 具体方法为: 确定路段 ^的直线方程 (若路段为曲线, 则划分为若干直线路段):

y-y, =k(x-x,) 其中斜率为: k: 投影直线方程为: y-

解出投影坐标 P为:

k 2 +l

k 2 y A +y, +kx A -h,

k 2 +\

在地图匹配过程后, 结合定位点坐标的时间戳数据, 将定位点匹配到时空子区。

I d.

步骤 24、计算时空子区 内每辆车的行程车速: 其中 2 ...4-1,«为时空子 区 内的第 1个和第 2个 GNSS定位点间的距离, ......,第《-1个与第 n个 GNSS定位点间的距离, ^... 为时空子区 内第 1个, ......, 第《个 GNSS定位点的时间戳; 指定时间片段长度 同一时间片段 数据条数上限;^ «; 搜索一个时空子区内时间第 各时间片段内的速度数据, 若时间片段内速度数据条 数超过上限 p 随机取 p 条数据加入 ^。。

步骤 25、 建立由输入层、 隐含层、 输出层、 上下文层、 偏置节点组成的 Elman-RNN神经网络, 输 入层神经元个数设置为 1, 隐含层神经元个数设置为 5, 输出层神经元个数设置为 1, 上下文层神经元 个数与隐含层个数取相同值,也设置为 5,偏置节点的初始值设置为 0;设置各个组成部分的初始参数, 其中学习率设置为 0.1, 模拟退火模块中初始温度设置为 10 5 , 终止温度设置为 10— 2 , 每个温度的迭代 次数设置为 100; 将 ^作为输入数据, 进行神经网络的训练, 最终获得训练好的 R N模型。 步骤 26、将实时交通数据在当前时间窗口上取均值 / rt , rt ) = "^ J .,作为实施交通态势的表征。 步骤 27、 将异常点检测所要处理的时间序列数据下标按 升序排序的点的序列 Vl ,v 2 ,...,v„, 已知根 据历史数据拟合的模型 ^, 计算拟合模型的预测值 (V); 计算模型预测值与真实值的差异 」 I

步骤 28、 将各个时空子区的速度分布差异标准化为 0~1的规范化数值 :

diff^ -vam diff)

一 max diff^ - min {diff、

计算各个时空子区的交通异常指数 10。 实施例三

步骤 31、 采用非等距时空划分法, 对于路网密度大于 2km/km 2 或高峰小时流量大于 1000辆 /小时 的城市中心区, 取 30min的时间片段和 200mX200m的空间片段, 对于路网密度小于 2km/km 2 或高峰 小时流量小于 1000辆 /小时的城市郊区, 取 30min的时间片段和 400mX400m的空间片段。

步骤 32、 进行数据预处理, 将 GNSS定位数据进行数据清洗、 数据集成、 数据转换、 数据归约, 提高数据的结构化程度。

步骤 33、 将所需处理的空间区域划分为一定大小的格网 , 每个格网区域的范围可表示为

A ={( ' 1 ^[x r ,x r+1 ),y s

将浮动车 GNSS数据采集频率表示为 f 0 =\l , 将时间上与 A相邻的点 P(t A -t 0 ), Pfc+io)定义为 A的 1-邻近点, P(t A -2t 0 ), ^04+2¾)定义为 A的 2-邻近点, 以此类推, 则 Ρθ4-/¾;), 定义为 Α的 /- 邻近点。 在/ Q <lHz时, 取^ =1或 2。 取距离 A及 A的 邻近点距离最小的路段^ 并计算 A及 A的

^邻近点行驶方向角的均值 取阈值 ^=5° ,若满足 | - |< ,完成匹配;否则,搜索其他路段, 直至满足条件。

利用路段的直线方程 (若为曲线路段则近似拆分为直线),计算 GNSS定位点在路段上的投影坐标, 减小因 GNSS定位漂移带来的误差。 具体方法为:

确定路段 的直线方程 (若路段为曲线, 则划分为若干直线路段): y-y, =k(x-x,) 其中斜率为: 投影直线方程为

解出投影坐标 P为: ky A -k +k 2 x l + x A

P k 2 +\

v _^y A +y,

k 2 +l

在地图匹配过程后, 结合定位点坐标的时间戳数据, 将定位点匹配到时空子区。

步骤 34、计算时空子区 内每辆车的行程车速: = W .+ + -''", 其中 2 ...ί — ^为时空子

~

区 内的第 1个和第 2个 GNSS定位点间的距离, ......,第《-1个与第 n个 GNSS定位点间的距离, ^... 为时空子区 内第 1个, ......, 第《个 GNSS定位点的时间戳; 指定时间片段长度 同一时间片段 数据条数上限;^ «; 搜索一个时空子区内时间第 各时间片段内的速度数据, 若时间片段内速度数据条 数超过上限 p 随机取 p 条数据加入 ^。。

步骤 35、 建立由输入层、 隐含层、 输出层、 上下文层、 偏置节点组成的 Elman-RNN神经网络, 输 入层神经元个数设置为 1, 隐含层神经元个数设置为 5, 输出层神经元个数设置为 1, 上下文层神经元 个数与隐含层个数取相同值,也设置为 5,偏置节点的初始值设置为 0;设置各个组成部分的初始参数, 其中学习率设置为 0.05, 模拟退火模块中初始温度设置为 10 5 , 终止温度设置为 10— 2 , 每个温度的迭代 次数设置为 200; 将 ^作为输入数据, 进行神经网络的训练, 最终获得训练好的 R N模型。

步骤 36、 采用滚动时域均值法, 使用数据抽样得到的行程车速数据, 计算当前空间子区行程车速

1

在最近 M个时间子区的均值 / rt ( irt ) = ~^£$^,,, 其中 M=3, 作为实时交通态势的表征。

M -N rt i i

步骤 37、 将异常点检测所要处理的时间序列数据下标按 升序排序的点的序列 Vl ,v 2 ,...,v„, 已知根 据历史数据拟合的模型 ^, 计算拟合模型的预测值 (V); 计算模型预测值与真实值的差异 」 I

步骤 38、 将各个时空子区的速度分布差异标准化为 0~1的规范化数值 :

diff^ -vam diff)

一 max diff^ - min {diff、

计算各个时空子区的交通异常指数 10。