2024年6月6日发(作者:)

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号

CN 111540476 A

(43)申请公布日

2020.08.14

(21)申请号 2.6

(22)申请日 2020.04.20

(71)申请人 中国科学院地理科学与资源研究所

地址 100101 北京市朝阳区大屯路甲11号

(72)发明人 裴韬 刘亚溪 宋辞 王席 陈洁 

舒华 陈晓 黄强 吴明柏 

郭思慧 周成虎 

(74)专利代理机构 北京志霖恒远知识产权代理

事务所(普通合伙) 11435

代理人 刘玉涵

(51).

G16H

50/80

(2018.01)

G06K

9/62

(2006.01)

权利要求书1页 说明书6页 附图2页

(54)发明名称

一种基于手机信令数据的呼吸道传染病传

染树重构方法

(57)摘要

本发明公开了一种基于手机信令数据的呼

吸道传染病传染树重构方法,包括以下步骤:S1:

病例间潜在传染关系判断;S2:病例间时空共现

关系分析;S3:共现网络构建及社区划分;S4:社

区内病例传染关系判断;S5:传染发生地确定及

可视化。本发明能够在呼吸道传染病爆发期间实

现病例传染关系的快速判断以及传染位置的确

定和可视化,突破了传统流行病学调查耗时耗力

且结果不够清晰直观的局限,可以快速重构出病

例间的传染树、确定传染发生的空间位置、并以

可视化的方式在地图上展示,有助于及时掌握疾

病传播过程,提高病毒溯源以及阻断传播的效

率。

C

N

1

1

1

5

4

0

4

7

6

A

CN 111540476 A

权 利 要 求 书

1/1页

1.一种基于手机信令数据的呼吸道传染病传染树重构方法,其特征在于:该方法包括

以下步骤:

S1:病例间潜在传染关系判断;

S2:病例间时空共现关系分析;

S3:共现网络构建及社区划分;

S4:社区内病例传染关系判断;

S5:传染发生地确定及可视化。

2.根据权利要求1所述的基于手机信令数据的呼吸道传染病传染树重构方法,其特征

在于:S1中病例间潜在传染关系判断的具体方法为:

根据发病时间、确诊时间、潜伏期,计算每个病例的被传染期和传染期,然后判断病例

之间的传染期和被传染期是否有重叠,若有重叠,则两病例间可能存在传染关系,若没有重

叠,则不存在传染关系。

3.根据权利要求2所述的基于手机信令数据的呼吸道传染病传染树重构方法,其特征

在于:S2中病例间时空共现关系分析的具体方法为:

对于可能存在传染关系的病例对,分别提取其对应传染期和被传染期内的手机信令数

据,形成移动轨迹,并用时空立方体模型进行表达;然后结合流行病传染机制,以轨迹时空

立方体的拓扑求交计算为核心,分析病例之间的共现关系,具体包括时空共现和空间共现;

若存在共现关系,进一步计算两者轨迹时空立方体交集的体积作为共现强度。

4.根据权利要求3所述的基于手机信令数据的呼吸道传染病传染树重构方法,其特征

在于:S3中共现网络构建及社区划分的具体方法包括:

基于S1中判断的潜在传染关系及S2中计算的病例间共现强度,构建病例共现网络,其

中节点表示每个病例,边表示病例间可能存在传染关系,同时用病例间共现强度作为边的

权重;然后,对该网络进行社区划分,使得同一社区内病例间共现强度较大,发生传染关系

的可能性较大,而不同社区间病例共现强度较弱,发生传染关系的可能性较小。

5.根据权利要求4所述的基于手机信令数据的呼吸道传染病传染树重构方法,其特征

在于:S4中社区内病例传染关系推断的具体方法包括:

对于划分到同一社区内的病例,首先判断其是否来自疫源地或去过疫情聚集性爆发

地;如果是,则标记其为输入性病例,作为传染源,然后对于每个非输入性病例,根据发病时

间进行回溯,直到确定其对应的传染源,并连接形成一条传染分支,最终所有病例连起来形

成一颗完整的传染树。

6.根据权利要求5所述的基于手机信令数据的呼吸道传染病传染树重构方法,其特征

在于:S5中传染发生地确定及可视化的具体方法包括:

基于S4构建的传染树,结合S2中时空共现分析的结果,判断病例间发生传染的空间位

置,并在地图上进行可视化展示。

2

CN 111540476 A

说 明 书

1/6页

一种基于手机信令数据的呼吸道传染病传染树重构方法

技术领域

[0001]

本发明涉及一种传染树重构方法,尤其涉及一种基于手机信令数据的呼吸道传染

病传染树重构方法。

背景技术

[0002]

呼吸道传染病作为一种最常见的流行病,很容易在人与人之间传播,形成大爆发。

而了解呼吸道传染病在病例间的传染关系、确定传染发生的空间位置,对于掌握疫情发展、

阻断病毒传播等具有重要意义。目前,对于病例传染关系及传染发生位置的确定主要依赖

于流行病学调查,即通过对病例进行询问,了解其近期的活动轨迹及密切接触者,进而确定

潜在传染者和被传染者。这种方式耗时耗力,且难以直观展示病例间传染关系及传染发生

位置。同时由于被调查对象的描述可能存在主观判断和记忆遗漏,调查结果通常不够准确

和全面。

[0003]

实际上,基于病例随身携带的手机所产生的信令数据,就可以完整的获取其历史

移动轨迹信息。基于此,现有专利文献CN105740615B提出根据单个感染者的移动轨迹,结合

所经过地区的环境状况,推断其感染时间和地点,然后通过分析不同感染者的轨迹相似点,

追踪传染源;专利文献CN109360660A提出将感染者移动轨迹和疫情风险图进行对比,得出

传染高概率发生点,并通过对不同感染者轨迹进行关联规则或字符串模式挖掘,分析可能

的传播趋势。这些方法虽然将手机信令轨迹应用到了传染病防控,但是在对病例轨迹进行

分析时,一方面只考虑了环境因素可能引发的人群感染,忽略了疾病在人与人之间的传播,

不能反映疾病在病例之间的传染过程;另一方面,对传染源、传染高概率发生点的追踪只基

于感染者轨迹的相似点,没有考虑流行病传染机制,结果可能存在偏差。

[0004]

针对以上问题,亟需提出一种基于手机信令数据的呼吸道传染病传染树重构方

法,能够解决传统流行病学调查耗时耗力、结果不够清晰直观等问题。

发明内容

[0005]

为了解决上述技术所存在的不足之处,本发明提供了一种基于手机信令数据的呼

吸道传染病传染树重构方法。

[0006]

为了解决以上技术问题,本发明采用的技术方案是:一种基于手机信令数据的呼

吸道传染病传染树重构方法,包括以下步骤:

[0007]

S1:病例间潜在传染关系判断;

[0008]

S2:病例间时空共现关系分析;

[0009]

S3:共现网络构建及社区划分;

[0010]

S4:社区内病例传染关系判断;

[0011]

S5:传染发生地确定及可视化。

[0012]

进一步地,S1中病例间潜在传染关系判断的具体方法为:根据发病时间、确诊时

间、潜伏期,计算每个病例的被传染期(可能被其他病例传染的时间段)和传染期(具有传染

3

CN 111540476 A

说 明 书

2/6页

性的时间段),然后判断病例之间的传染期和被传染期是否有重叠,若有重叠,则两病例间

可能存在传染关系,若没有重叠,则不存在传染关系。

[0013]

进一步地,S2中病例间时空共现关系分析的具体方法为:

[0014]

对于可能存在传染关系的病例对,分别提取其对应传染期和被传染期内的手机信

令数据,形成移动轨迹,并用时空立方体模型进行表达;然后结合流行病传染机制,以轨迹

时空立方体的拓扑求交计算为核心,分析病例之间的共现关系,具体包括时空共现(相同时

间在相同地点出现,可能发生直接接触传染)和空间共现(一定时间间隔内在相同地点出

现,可能发生间接接触传染);若存在共现关系,进一步计算两者轨迹时空立方体交集的体

积作为共现强度。

[0015]

进一步地,S3中共现网络构建及社区划分的具体方法包括:

[0016]

基于S1中判断的潜在传染关系及S2中计算的病例间共现强度,构建病例共现网

络,其中节点表示每个病例,边表示病例间可能存在传染关系,同时用病例间共现强度作为

边的权重;然后,对该网络进行社区划分,使得同一社区内病例间共现强度较大,发生传染

关系的可能性较大,而不同社区间病例共现强度较弱,发生传染关系的可能性较小。

[0017]

进一步地,S4中社区内病例传染关系推断的具体方法包括:

[0018]

对于划分到同一社区内的病例,首先判断其是否来自疫源地或去过疫情聚集性爆

发地;如果是,则标记其为输入性病例,作为传染源,然后对于每个非输入性病例,根据发病

时间进行回溯,直到确定其对应的传染源,并连接形成一条传染分支,最终所有病例连起来

进而形成一颗完整的传染树。

[0019]

进一步地,S5中传染发生地确定及可视化的具体方法包括:

[0020]

基于S4构建的传染树,结合S2中时空共现分析的结果,判断病例间发生传染的空

间位置,并在地图上进行可视化展示。

[0021]

本发明公开了一种基于手机信令数据的呼吸道传染病传染树重构方法,其通过分

析病例间的时空共现关系,结合流行病传染机制,判断病例间传染关系,并在此基础上确定

传染发生的空间位置,然后在地图上进行可视化展示;本方法能够在呼吸道传染病爆发期

间实现病例传染关系的快速判断以及传染位置的确定和可视化,突破了传统流行病学调查

耗时耗力且结果不够清晰直观的局限,有助于及时掌握疾病传播过程,提高病毒溯源以及

阻断传播的效率。

附图说明

[0022]

图1为本发明方法的总体流程图。

[0023]

图2为时空共现关系分析示意图。

[0024]

图3为共现网络社区划分及传染关系判断示意图。

具体实施方式

[0025]

下面结合附图和具体实施方式对本发明作进一步详细的说明。

[0026]

本发明所公开的基于手机信令数据的呼吸道传染病传染树重构方法,其总体流程

如图1所示,主要包括以下步骤:

[0027]

S1:病例间潜在传染关系判断;

4

CN 111540476 A

[0028]

说 明 书

3/6页

S2:病例间时空共现关系分析;

[0029]

S3:共现网络构建及社区划分;

[0030]

S4:社区内病例传染关系判断;

[0031]

S5:传染发生地确定及可视化。

[0032]

下面结合具体的实施例对本发明的方法做详细的说明;

[0033]

S1:病例间潜在传染关系判断:

[0034]

该步骤的目的是首先从时间的角度入手,判断两病例之间是否可能存在传染关

系,对于可能存在传染关系的病例对再做进一步分析,从而减少数据分析量;

[0035]

对于每个病例来说,定义两个重要的时间段,一个是被传染期,另一个是传染期;

[0036]

被传染期是指病例可能被其他病例传染的时间段,假如某种呼吸道传染病的最长

潜伏期为T

0

,那么可以推测病例可能在发病时间减去最大潜伏期到发病时间之间的某个时

刻发生了感染,称这个时间段为被传染期,即:

[0037]

T(被传染期)=(发病时间-最大潜伏期,发病时间)

[0038]

传染期是指病例具传染性的时间段,即从病例开始具有传染性,一直到其确诊之

后被隔离之间的时间段,对于在潜伏期不具有传染性的疾病,病例传染期为:

[0039]

T(传染期)=(发病时间,确诊时间)

[0040]

而对于在潜伏期就具有传染性的疾病,病例传染期可以表示为:

[0041]

T(传染期)=(发病时间-最大潜伏期,确诊时间)

[0042]

然后,对于任意两病例之间,判断其传染期和被传染期是否有重叠,若有,则两者

可能存在传染关系,若没有,则两者不存在传染关系。

[0043]

S2:病例间时空共现关系分析:

[0044]

该步骤的目的是对于可能存在传染关系的病例对,基于手机信令数据提取其移动

轨迹,然后结合流行病传染机制,进行时空共现关系分析,从而评估两者发生传染的可能

性;

[0045]

对于可能存在传染关系的病例对(A和B),如果A的传染期和B的被传染期有重叠,

则提取A在传染期内的移动轨迹和B在被传染期内的移动轨迹;如果A的被传染期和B的传染

期有重叠,则提取A在被传染期内的移动轨迹和B在传染期内的移动轨迹;如果两者都有重

叠,则对于发病时间较早的病例,提取其传染期内的移动轨迹,对于另一病例,提取其被传

染期内的移动轨迹。

[0046]

移动轨迹的具体形式可表示为公式①:

[0047]

Tra_move={(x

1

,y

1

,t

1

),(x

2

,y

2

,t

2

),……,(x

i

,y

i

,t

i

)} 公式①

[0048]

其中,x

i

和y

i

表示该病例在t

i

时刻的位置坐标。

[0049]

为了方便进行时空共现分析,构建时空立方体模型来表达移动轨迹。首先,将研究

区划分为500m*500m的网格,然后将轨迹点映射到对应网格中,对于每个轨迹点而言,其对

应的网格作为病例活动的区域,该轨迹点时间戳到下个轨迹点时间戳之间的时间段作为病

例在该区域的活动时间,这样在三维时空立方体中,病例轨迹由一系列小的立方体构成,通

过对两病例的轨迹时空立方体进行求交计算,便可以得到两病例之间的共现关系。

[0050]

根据流行病传染机制,呼吸道传染病在人与人之间主要有两种可能的传播途径,

一种是直接接触传播,即与感染者一起生活、工作、学习、同行等发生近距离接触;另一种是

5

CN 111540476 A

说 明 书

4/6页

间接接触传播,即感染者在某一地点停留之后,病毒悬浮在空气或附着在物体上,被后来的

人吸入或接触。从时空分析的角度来看,直接接触传播对应着两病例相同时间在相同地点

出现,即发生时空共现;间接接触传播对应着两病例不同时间在相同地点出现,即发生空间

共现,并且前者离开和后者到达的时间间隔小于病毒能在体外存活的时间。

[0051]

以图2所示的时空共现关系分析示意图为例,做详细说明,病例1和病例2在t

2

时刻

相遇后分开(偶遇),在t

5

时刻再次相遇并同行至t

6

(同行),而病例1和病例3在t

3

-t

4

时间段

内停留在同一地点(共处)。因此,病例1和病例2、3发生了时空共现,可能发生直接接触传

染;病例2和病例3虽然没有发生直接的接触,但是病例3出现在了病例2曾经停留过的地方,

即发生了空间共现,若病例3的到达时间(t

1

)和病例2的离开时间(t

0

)之间的间隔小于病毒

能在体外存活的时间,且病例2的发病时间早于病例3,则病例2和病例3之间可能发生间接

接触传染。

[0052]

因此,对于时空共现,直接用病例轨迹立方体进行求交,若存在交集,则两病例间

发生了时空共现,相交的体积反映了病例间的时空共现强度I

1

,强度越大,发生传染的可能

性越大;对于空间共现,我们用病毒能在体外存活的时长(t)对病例轨迹立方体在时间方向

做长度为t的缓冲立方体,然后对两病例轨迹的缓冲立方体进行求交,若存在交集,则两病

例在一定时间间隔内发生了空间共现,相交的体积反映了病例间的空间共现强度I

2

,强度

越大,发生传染的可能性越大。

[0053]

为了方便进一步对比,定义病例间总的共现强度I为公式③所示:

[0054]

I=α

·

I

1

·

I

2

公式③

[0055]

其中,α和β分别为时空共现和空间共现的权重,分别反映了直接接触传染和间接

接触传染可能性的大小。根据呼吸道传染病传染机制,间接接触传染通常需要同时满足密

闭空间、较长时间、高浓度病毒三个条件才可能发生,可能性较小,因此其对应的权重也较

低。以SARS病毒和新型冠状病毒COVID-19为例,直接接触传播是其传播的主要方式,间接接

触传播只是存在,但是可能性极低,因此设置α的值远大于β的值,如α=0.99,β=0.01。

[0056]

S3:共现网络构建及社区划分:

[0057]

该步骤的目的是在时空共现分析的基础上,构建病例间共现网络,然后通过网络

分析的方法判断哪些病例之间共现强度相对较大,存在传染关系的可能性较高,哪些病例

之间共现强度相对较弱,存在传染关系的可能性较低;

[0058]

如图3所示,给定一系列可能存在传染关系的病例对、以及两者之间的共现强度I,

构建一个加权的共现网络,其中节点表示每个病例,边表示病例之间可能存在传染关系,并

用两者的共现强度I作为边的权重。通常来说,处于同一颗传染树上的病例(如亲属、同事、

密切接触者等)之间,共现强度较大,而不同传染树上病例之间的共现强度较小,或者不存

在共现。这种特征使得病例间共现网络形成一种社区化的结构,即社区内病例间共现强度

较大,而不同社区病例间共现强度较小。因此,接下来利用网络分析中的社区划分算法,对

病例间共现网络进行划分。

[0059]

社区划分选择基于模块度的算法,对于一个加权网络,模块度Q定义为公式④所

示:

6

CN 111540476 A

说 明 书

5/6页

[0060]

其中,m为网络中边的个数,A

ij

为节点i和节点j之间边的权重,k

i

和k

j

分别为与这

两个节点有连接的边的权重之和,c

i

和c

j

分别表示节点i和j所在的社区,若c

i

=c

j

则Δ(c

i

,

c

j

)=1,否则Δ(c

i

,c

j

)=0;模块度值越大,说明网络社区划分效果越好,因此通过对社区划

分的可能空间进行搜索,可以得到最大化Q值的社区划分。

[0062]

S4:社区内病例传染关系推断:

[0063]

该步骤的目的是对于同一社区内的病例,进一步根据其发病时间、是否来自疫源

地、是否去过疫情聚集性爆发地等信息,判断传染关系,形成一颗完整的传染树。

[0064]

步骤S3中对病例共现网络进行社区划分之后,同一社区内病例间发生传染的可能

性要大于不同社区病例间发生传染的可能性。因此,对于同一社区内的病例,首先根据移动

轨迹,判断其在被传染期内是否去过疫源区,或者有聚集性感染暴发的区域,若有,则其很

有可能是在疫源区或聚集性感染暴发区发生感染,然后携带病毒,之后传染给社区内的其

他病例,我们把这类病例标记为输入性病例(如图3(b)中虚线框病例),作为传染源。

[0065]

接下来,对于每个非输入性病例,根据发病时间进行回溯,直到找到其对应的传染

源。具体来说:如果某个病例只对应一个病例与其在同一社区且存在共现关系,同时发病时

间也更早,那么该病例作为其传染源;如果某个病例对应多个病例与其在同一社区且存在

共现关系,同时发病时间也更早,那么进一步根据共现时间判断这些病例是否在相同时间

段发生了共现,如果是,则这些病例之间可能发生了聚集性传染,如共同生活、聚餐、一起上

班等,对于这种情况,进一步判断这些病例中是否有输入性病例,若有,则该输入性病例为

传染源,若没有,则选择最早发病的那个病例作为传染源;如果不是在相同时间段内发生共

现,则这些病例都有可能是该病例的传染源,对于这种情况,同样判断这些病例中是否有输

入性病例,若有,则该输入性病例为传染源,若没有,则选择共现强度最大的那个病例作为

该病例的传染源。

[0066]

对于社区内的每一个非输入病例,确定其传染源之后,连接形成一个传染分支。若

有病例没去过疫源区和聚集性感染暴发区,并且在社区内无对应的传染源,那么其可能是

和其它社区的病例发生了传染,因此找出和其有共现关系的其它社区的病例,然后用同样

的方法确定其传染源,最终形成一颗完整的传染树。

[0067]

S5:传染发生地确定及可视化:

[0068]

该步骤的目的是基于上一步确定的病例间传染关系,结合步骤S2时空共现分析的

结果,确定传染发生地点,并在地图上进行可视化展示。

[0069]

在确定了传染关系之后,对于存在传染关系的病例对,可以根据两者时空共现的

情况,确定传染发生的地点。若两病例只在一个地点发生过共现,那么该地为传染发生地;

若两病例在两个或两个以上地点发生过共现,那么共现强度最大的地点为传染发生的地

点。然后,在此基础上,利用地图进行可视化展示,具体包括两个方面:

[0070]

一方面,结合传染关系和传染发生位置,以动态化的形式展示各传染树的时空演

化过程,有助于直观了解病毒传播特点和发展态势;

[0071]

另一方面,统计不同位置发生传染的次数,然后在地图上用不同大小的符号进行

[0061]

7

CN 111540476 A

说 明 书

6/6页

显示,有助于发现聚集性感染发生地和疫情风险等级较高的区域。

[0072]

对于本发明所公开的基于手机信令数据的呼吸道传染病传染树重构方法,与现有

方法相比具有以下优势:

[0073]

(1)基于手机信令数据进行病例传染关系的快速重构,相对于传统流行病学调查

方法省时省力,同时获取的信息也更加全面和准确;

[0074]

(2)对病例轨迹进行分析的时候,综合考虑流行病传染机制,用病例间时空关系来

反映其可能的传染关系,对于传染关系的判断更加准确。

[0075]

(3)在构建传染关系的同时,确定传染发生的地点,从而将传染树在地图上可视化

展示,有助于直观了解病毒时空扩散过程、评估不同地点疫情风险。

[0076]

上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领

域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发

明的保护范围。

8

CN 111540476 A

说 明 书 附 图

1/2页

图1

图2

9

CN 111540476 A

说 明 书 附 图

2/2页

图3

10