AAAI 2025 北航团队提出GTG:具备跨城市迁移性的人类移动轨迹生成模型

本篇分享 AAAI 2025 论文 GTG: Generalizable Trajectory Generation Model for Urban Mobility。本文提出了一种具备跨城市迁移性的人类移动轨迹生成方法

论文标题:
GTG: Generalizable Trajectory Generation Model for Urban Mobility.

论文作者:

王静远教授、硕士生林宇菁、硕士生李雨东

作者单位:

北京航空航天大学

课题组:

北航智慧城市课题组 BIGSCity(https://www.bigscity.com/)

研究方向:

时空数据挖掘

论文链接:

https://arxiv.org/abs/2502.01107

代码仓库链接:

https://github.com/lyd1881310/GTG

背景介绍

轨迹数据在城市规划和交通管理等领域具有重要的作用,但是由于数据收集成本和隐私保护条款等因素的限制,大规模轨迹数据集的采集非常困难。轨迹生成技术成为解决轨迹数据不足的关键。


现有的轨迹生成方法大致可以分成知识驱动的方法和数据驱动的方法。知识驱动的方法通常基于经验规则和统计规律来模拟人类的移动并生成轨迹,数据驱动的方法则基于大规模数据训练的神经网络模型来生成轨迹。


知识驱动的方法不依赖大量数据,但是效果往往难以满足需求;数据驱动的方法表现较好,但是过于依赖特定城市的路网结构,难以迁移到其他城市。


本论文作者发现,人类的移动行为具有一定的跨城市不变性,主要体现在两个方面:1)人类总是倾向于选择出行代价最小的路径;2)道路的出行代价可以由路网的拓扑特征做出预测,这种拓扑特征与出行代价之间的映射关系在不同的城市中具有一定的不变性。


对此,本文提出了一种结合跨城市道路出行代价预测和最短路径搜索的轨迹生成方法。

问题定义

路网:城市的路网是一个有向图 ,包括路段集合 和边的集合 ,若两个路段直接相邻,则它们之间存在一条有向边。

轨迹:本论文的轨迹是指由个体经过的路段组成的序列 。多条轨迹组成轨迹数据集

本论文解决的是跨城市轨迹生成问题,使用源城市的轨迹数据集训练深度学习模型,使其能够在目标城市生成轨迹。输入:源城市路网道路网络 和轨迹数据集 ,目标城市路网 。优化目标:优化模型参数 使得在目标城市的道路网络 上,生成的轨迹数据集 与真实数据 相似。用公式表示为
其中 为优化目标,衡量生成轨迹与真实轨迹的差异。最终使用训练好的参数进行目标城市轨迹数据的生成

方法

本文提出了一种具备跨城市迁移性的轨迹生成模型(GTG):首先基于空间句法理论提取路网的拓扑特征;然后设计了解耦对抗训练方法学习城市无关的道路表征,实现跨城市的出行代价预测;最后通过最短路搜索为新城市生成轨迹数据。模型框架如图 1 所示。

▲ 图1 GTG 模型框架

3.1 路网拓扑特征提取

本论文以空间句法(Space Syntax)理论为指导,计算了四类典型的空间特征来刻画路段的性质:总深度(Total Depth)、整合度(Integration)、连通度(Connectivity)和选择度(Choice,又称介数中心性)。


然后,本论文使用归纳式图注意力网络来聚合路网的特征。参考 ClusterGCN 的做法,本论文使用了 METIS 算法分割路网,再随机采样子图构造多样化的训练样本。采样过程如下所示

其中 是整个城市路网的全局图, 是 Metis 分割出的子图, 是随机采样组合出的子图。METIS 算法能够确保各个子图的顶点数量尽量均衡,且子图间的边数最少。这种均衡的划分方法有助于增强模型对不同类型道路网络的适应能力。


然后,本论文设计了空间感知的图注意力网络(SAGAT)来聚合子图的特征,生成带周边拓扑信息的路段表征。SAGAT 的输入为各子图的节点特征,通过一系列注意力层堆叠的方式进行特征聚合,最终获得子图拓扑特征表示

其中 是对应路段 的聚合拓扑表征。具体来说,该过程是通过多层注意力聚合来实现的。初始层输入通过多层感知机(MLP)转换后的表征,计算方式为

对于第 层,SAGAT 网络计算了节点间的注意力权重,并将空间关系嵌入到注意力机制中。


在这种结构中,模型不仅关注邻居节点的特征,还考虑了这些节点之间的空间关系,例如转角、行驶距离以及介数中心性。这些空间关系反映了道路段之间的物理连接和空间相对位置,是理解城市道路网络结构的重要信息。该注意力机制的计算过程为:

其中 是可学习参数, 是路段 的邻居节点集合, 是 LeaklyReLU 激活函数。 表示两节点之间的空间联系,表示如下:

其中 Bet 指的是穿过 的最短路径数与整个网络中最短路径总数的比例。Angle 是路段转角,而 Dist 表示两个路段间的中心点旅行距离。最终空间感知的图注意力网络的输出表示为

3.2 基于解耦表征的出行代价预测

本论文将 GAT 聚合得到的路段表征用于出行代价预测。但是,源城市和目标城市的路网特征分布存在差异,导致模型直接在目标城市应用的效果较差。对此,本论文设计了一种解耦对抗学习方法,来获得城市无关表征,提升跨城市预测效果。


(1)潜在变量解耦

首先,本论文使用语义编码器和域编码器来分离原始表征中的语义信息和城市相关的信息。本论文假设路段信息由两个独立的潜在变量决定:一个语义潜在变量 和一个域潜在变量 。这些变量分别通过两个 MLP 编码器提取。 捕获用于预测轨迹成本的语义信息,而 包含城市特定的域信息,如下

本论文使用对抗域适应技术来训练这些表征,其中包括一个用于出行代价估算的预测器和一个用于城市识别的判别器。这些表征在出行代价预测的优化当中同步更新。


(2)出行代价预测


出行代价由路段在特定时期的平均通行时间和通行速度表示,如下

以潜在变量 作为输入(为简化省略上标),出行代价预测网络可以表示为

用于训练神经网络的预测损失函数包括一个 MSE 损失和一个排名损失。MSE 损失的计算方式为

其中 是源城市数据集的大小, 是路段出行代价的真实值(包括出行时间和速度),使用真实数据集的平均值来表示。在跨城市场景下,不同城市之间的出行代价往往存在整体偏差,导致很难预测出行代价的绝对大小。


对此,本论文引入了排名损失来解决这一问题。具体来说,本论文预测了任意路段 的出行代价高于 的概率为:

实际的排名标签值计算如下:

计算二元交叉熵损失如下:

出行代价预测的总损失为 MSE 损失和排名损失的加权求和,如下:

其中 是两种损失之间的平衡权重。


(3)解耦对抗训练


为了从语义信息中分离出域信息,本研究引入了一个域判别器,用以预测路段的域标签(即该路段属于源城市还是目标城市)。从源城市或目标城市中提取子图样本,并为每个道路段分配域标签,如下所示:

标签为 1 代表该路段来自源城市路网,标签为 0 代表该路段来自目标城市路网。给定潜在变量 作为输入,域判别器对源城市和目标城市进行分类,如下:

对于这个域判别任务,使用二元交叉熵损失计算得:

其中 分别代表源城市和目标城市数据集的路段数量。


解耦对抗训练被用来促进 之间信息的解耦。对于语义潜在变量,其最终目标是在最大化域判别损失的同时,最小化出行代价预测损失;对于域潜在变量,目标则正好相反。通过使用不同的表征作为输入,损失函数计算为

为了进一步减少信息耦合,本研究还引入了正交损失,企图使解耦出来的表征之间的差异尽可能增大,正交损失的计算如下:

表征解耦对抗训练的总损失函数结合了这些损失,最终的损失函数为:

其中 是一个平衡因子。通过该步骤的解耦对抗训练,模型能够将域相关的信息从路段表征中分离出来,从而使得城市无关的语义表征,实现跨城市的出行代价预测。

3.3 结合最短路搜索的出行偏好学习

在完成出行预测之后,可以采用最短路径搜索算法为目标城市生成移动轨迹。大多数现存的最短路径搜索方法依赖于固定的道路成本因素,例如出行时间或出行速度,来规划路线。


然而,仅依赖单一成本因素通常无法全面捕捉用户的实际旅行偏好,这些偏好受到更复杂因素的影响。


为了解决这一问题,本论文提出将旅行偏好建模为可观测代价与隐含代价的组合。隐含代价代表了那些难以解释、影响人类选择的因素,通过使用多层感知器(MLP)预测,如下式所示:

其中 是语义潜变量。然后,模型使用可观测代价和隐含代价的加权组合来估计整体出行偏好,如下:

其中 是可学习的权重。 的值越小,表示对道路段 的偏好越高。本研究假设这种偏好组合方式在不同城市之间保持一致。


出行偏好的更新是通过无监督训练完成的。在训练过程中,本论文首先随机初始化参数隐含代价预测器的参数,并搜索最短路径。从 的最短路径表示为 ,其偏好值总和为:

真实轨迹 的偏好值总和为:

则无监督损失函数定义为真实轨迹的偏好值与生成轨迹的偏好值之差:

通过迭代训练,模型学习出行偏好与可观测代价和隐藏代价之间的不变映射关系。本阶段的训练完成后,模型生成轨迹与真实轨迹的差异将更小,可以应用到目标城市,生成新的轨迹数据。

实验

4.1 实验设置

本论文使用三个城市(北京、西安、成都)的出租车轨迹数据集进行实验。每个城市依次作为源城市和目标城市,总共构成 6 组源城市-目标城市对,使用源城市数据来训练模型,并直接应用到目标城市生成新的轨迹。生成轨迹的质量由真实轨迹数据集和生成轨迹数据集的整体相似性来评价。


评价指标包括:


1. 宏观相似性:计算轨迹出行距离(Distance)、出行半径(Radius)和路段访问频率(LocFreq)的 JS 散度;


2. 微观相似性:逐条计算生成轨迹和真实轨迹的序列距离,包括 DTW、Hausdorff、EDT 和 EDR 距离。


本论文使用现有的常见轨迹生成方法作为基线方法,包括传统的知识驱动方法(随机游走、EPR 模型)和最新数据驱动方法(深度生成模型)。

4.2 实验结果分析

▲ 表1 跨城市轨迹生成实验整体效果

跨城市轨迹生成的效果如表 1 所示,其中 GTG1 对应的源城市和目标城市设置为 XA->BJ、BJ->CD、CD->XA;GTG2 对应的源城市和目标城市设置为 BJ->XA、XA->CD、CD->BJ。


从宏观和微观角度评估,与三个真实世界轨迹数据集上的所有基线模型相比,本论文提出的方法表现出较好的跨城市迁移性。以西安市为例,生成数据与真实数据对路段访问频率的热度图如图 2 所示。GTG 的热度图与真实数据的相似度最高。

▲ 图2 西安市生成数据和真实数据的热度图

为了验证生成轨迹数据的可用性,本论文基于生成的轨迹数据训练下游应用模型,并在真实轨迹数据上进行测试。本论文以这种方式来评估生成的轨迹数据对下游任务的支持能力。具体来说,选择轨迹下一跳位置预测任务作为下游应用任务。轨迹下一跳位置预测任务旨在预测轨迹的位置,广泛应用于地点推荐应用中。


我们选择 DeepMove 和 LSTPM 作为轨迹下一跳位置预测模型,分别用真实数据和生成数据来训练这两个模型。下游任务的评测效果如表 2 所示,真实数据训练的下游任务模型效果最好,在所有的轨迹生成方法中,GTG 生成的轨迹训练效果与真实数据差距最小。

▲ 表2 下游任务实验结果

如果目标城市存在一定量的真实轨迹数据,那么使用目标城市的数据微调 GTG 可以取得更好的效果。逐步增加目标城市轨迹数量,模型效果变化情况如表 3 所示。

▲ 表3 目标城市微调实验结果

总结

在本研究中,作者提出了一种具备跨城市泛化性的轨迹生成方法,其核心在于学习城市中普遍的人类出行规律。该方法结合了空间句法技术和归纳式图神经网络来提取丰富的城市不变的路网表征,并使用了解耦对抗训练方法来增强跨城市出行代价预测效果,最终结合最短路径搜索生成符合人类偏好的出行轨迹。

引用

如果你觉得本文有用的话,请引用:
@misc{wang2025gtggeneralizabletrajectorygeneration,
      title={GTG: Generalizable Trajectory Generation Model for Urban Mobility}, 
      author={Jingyuan Wang and Yujing Lin and Yudong Li},
      year={2025},
      eprint={2502.01107},
      archivePrefix={arXiv},
      primaryClass={cs.LG},
      url={https://arxiv.org/abs/2502.01107}, 
}

本文实验过程使用到了 LibCity 城市时空预测深度学习算法库。如果你对 LibCity 感兴趣的话,可以访问 Github 主页:

https://github.com/LibCity/Bigscity-LibCity



(文:PaperWeekly)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往