地理信息系统 Patrick Hostert 和 Oliver Gruebner外文翻译资料

 2022-08-08 15:55:16

英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料


第十章

地理信息系统

Patrick Hostert 和 Oliver Gruebner

10.1 导言

如今有大量的出版物对健康科学中的地理信息分析进行了详细阐述。面对全球化和城市千年,传染病流行病学(IDE)和地理信息分析之间的交叉研究在这种背景下变得越来越重要(Kraas 2007; Martinez et al. 2008; UN-Habitat 2006)。虽然在本章要充分涵盖所有的概念框架和实践方法是不现实的,但我们将着重于最常见的技术,并且举例说明在IDE中地理信息系统(GIS)所具有的潜力。在第三部分中已经对疾病传播作了全面的讨论。因此,我们将重点放在相关的方法问题上,同时充分意识到,要建立有效的空间模型,就必须深入了解疾病传播情况。

我们以一些专有定义作为开始:

bull; 用于IDE的地理信息系统(GIS):一个用于IDE相关研究的GIS,包括一 组兼容的硬件,软件(或算法)和方法,用于分析疾病的空间模式,机制 (风险因素、传播)的以及制作地图,产出有关空间疾病信息的报告的方 法。与使用GIS来执行和应用空间方法有关的科学被称为“地理科学”。

bull; IDE中的地理信息分析是基于GIS技术的空间分析

–来寻找传染病的模式;

–专注在了解大规模(以全球为例)和小规模(以本地为例)的传染病传 播驱动因素;

–允许进行空间上详细的建模来探索有关传染病传播的未来方案。

bull; IDE中的遥感:使用航测影像或卫星图像分析与IDE和传染病传播相关因素 的空间模式。在这种情况下,基于遥感的图像分析可以被视为地理信息分 析的组成部分。

本章分为三个主要部分:

1. 我们解释了在IDE背景中基于地理信息分析的解决方案所构建的概念框架。

2. 我们介绍了用于IDE最重要的地理信息处理原理,涵盖了GIS和遥感数据 分析。

3. 概述了基于地理信息的IDE研究的未来发展。

10.2 在IDE背景下用于地理信息科学的概念框架

传染病的空间模式显然取决于其潜在过程的空间模式。因此,基于空间显式方法的分析必须基于对发病过程和相关生物背景的深入了解。发病机制的研究始终是对传染病潜在途径下个体暴露的研究;与处于危险中的人口相关的过程或因素的空间模式已经被绘制和分析。一个相关的概念框架能够在空间显式背景下通过空间分析、理论证明或否定,或者理论应用支持理论构建,即基于地图的分析。

因此,空间分析的第一步始终是疾病制图,即疾病流行率或发病率的空间显式表示。虽然空间表示通常有助于视觉解释和提高认知,但用聚类分析方法检测疾病聚类是进一步研究的起点。空间自相关理论是分析给定研究区域不同区域之间相互依存关系的背景。Tobler第一定律说:“一切事物都与其他事物相关,但附近的事物彼此更相关”(Tobler 1970)。基于这一假设,研究了局部尺度和全球尺度上的概率分布与理论上预期的概率分布的偏差。

一旦确定集群,重点是估计一个群体在空间和时间内暴露于风险因素的程度。如果发病机制是众所周知的,我们可以直接尝试确定发病率模式和其潜在原因之间的空间联系。在致病背景不明的情况下,在进行深入分析之前,必须在空间范围内对关于传播途径的不同假设进行显著性检验。

在了解病原体和传染病的病因学背景后,我们可以在不同的层面上进行空间模式分析:我们最初可能希望进一步探索传播途径的空间背景。检查传播途径包括不同的重点,如在媒介传播疾病的情况下对媒介或宿主生境的分析,在社会疾病的情况下对与生活或工作条件相关的社会或社会经济指标进行的分析(与第6章相比),或在环境疾病的情况下对潜在环境威胁分布的分析(例如具有高污染水平的水孔)。这些问题可以通过经验(基于地图操作)或建模(基于分析模型)来解决。

传染病空间分析中最先进方法与模拟模型有关。可以通过不同方式实现对疾病未来发展的空间明确预测(预报)或以“假设”关系形式纳入潜在干预措施的设想。全面一体化的方法,即完全在地理信息系统环境中实现的模型,在数据管理方面是一致的,并且不需要在不同的软件包之间建立接口。然而,许多解决方案依赖于耦合模型,因为潜在的流行病学过程通常难以在地理信息系统环境中表示,同时空间模型(例如元胞自动机或基于代理的方法)在地理信息系统中可以得到最好的应用。

10.3 地理信息处理

第10.2节说明了将空间分析与发病机理知识联系起来的重要性。我们现在关注一个更技术性的问题:如何实际执行空间相关分析,并从空间数据中提取相关结果,即如何基于GIS?

根据定义,地理信息系统是一个用于输入、管理、分析和显示空间相关数据的系统。在大多数情况下,它是空间数据库、(地理)可视化和(地理)处理工具的组合。

这里将解释相关的工具,而省略了更多技术层面下的数据输入。

10.3.1 数据和数据库

在IDE中,多种类型的健康相关空间数据集可以支持空间数据分析。首先,需要探索空间流行病学数据:

bull; 死亡率数据

bull; 发病率数据

bull; 疾病流行率、分布等数据。

其次,需要导出或收集潜在解释变量的空间数据集,例如通过全球定位系统测量,如以下相关空间数据:

bull; 卫生基础设施和保健设施;

bull; 社会基础设施(例如教育、医疗保险和社交网络的可得性和可及性);

bull; 技术基础设施(例如水、卫生/污水、(雨水)排水、电力、固体废物管理、 公路和铁路网络以及公共交通);

bull; 人口普查、社会经济和生活方式变量(例如年龄、性别、收入、家庭规模、 人口密度、生计活动和营养);

bull; 房屋(例如租赁、住房质量、住房密度、供水、供电和卫生设施);

bull; 环境(例如地形、地下水信息或气候数据);

bull; 生态(例如关于污染或植被的监测信息);

bull; 土地利用和土地覆盖(例如卫星数据分析,如作为病媒栖息地分析的重要变 量)。

在地理信息系统数据库中,现实世界是抽象的,在地理上由一个通用的地理信息系统数据模型表示。地理信息系统数据模型包括空间要素(基于矢量或栅格的格式)和与这些要素(属性)相关的专题信息。例如,基于矢量的要素是井或采样点、街道的线和住宅地块的区域(多边形)。它还可以包括栅格数据,如卫星图像、栅格图像分析结果或数字高程模型。为了描述地理对象,属性通常被添加并存储为链接到地理对象的表格数据。和在非空间数据库中一样,可以考虑与内容相关的关系。此时,可以针对某些目的来设计数据模型,例如一个考虑了群体及其生活条件的相互依赖性健康数据模型。关于社会基础设施和住房以及社会经济变量的信息可能储存在与直接、间接的健康影响方面。例如,如果人们在工作中、在家里或在前往工作场所等特殊地点的日常旅行中遇到室内或室外污染,这就可能会对人们的健康状况产生直接影响。住房条件差的人(贫民窟或棚户区)与全家人共用一个房间,与其他家庭共用一口管井和一个厕所,这些人容易传染病和其他疾病,这一点必须在健康数据模型中考虑到。健康数据模型可以随之被集成到属性信息与空间信息相关联的地理信息系统数据模型中如在哪里可以找到这些在地理环境(地理坐标)下的观测结果,以及这些观测结果的周围环境(技术基础设施、环境、生态、土地使用和土地覆盖的数据)。回到上面的例子,恶劣的住房条件加上高度密集的建筑区可能构成传染病传播的高风险。

IDE中很多具有相关性的数据集都是作为点数据收集的,不提供连续的信息。例如,点数据与诊所的位置、受威胁者的住房或作为潜在传染源的水坑有关。如今,坐标信息通常是收集来自基于全球定位系统(GPS)测量或从谷歌地球提取的信息。在任何情况下,我们都需要了解哪些位置不确定性与数据收集方法有关,以及这些不确定性如何影响基于各自数据集的分析。从地理角度来看,这些因素与设计数据收集活动时应考虑的目标分析规模(从地方到全球)问题密切相关。此外,当采样设计忽略采样位置之间的某些最小距离时,我们应该意识到空间自相关会抑制空间数据集。

我们应该准备好面对这样一个事实:许多连续数据集,乍一看,覆盖完整的测试区域,并不一定会告诉分析师数据质量和聚合的所有细节。由于分析师通常与数据收集人员不同,因此并不总是说明底层信息如何与各自的区域单元相关联,例如地区或集水区。这种聚合单元不一定是为研究IDE而设计的。地理信息系统提供了强大的工具,可以用所谓的元数据记录数据集,帮助分析人员了解数据是如何收集、汇总或处理的,以及谁处理了数据集。关于空间数据的元数据能够发现、评估数据并与其他人有效共享数据。例如,出于隐私原因,健康调查信息可以在邮政编码级别上汇总,尽管它最初是在家庭级别上采样的。如果有充分的记录,这种数据集可以分类,以便更深入地了解基础空间数据的分布和准确性,同时假定不侵犯隐私权(Matisziw et al. 2008)。更好的解决办法是设计实地调查,使我们能够根据手头的各个问题得出不同的汇总水平。地理信息系统基于特定的数据集来指导这一过程。可以根据调查分布、保健中心和诊所的位置或代表不同聚集水平的嵌套尺度对给定的测试区域进行分层。

10.3.2 数据可视化

地理信息系统也可以被视为一组智能地图,在一个定义的空间坐标系中表示地理信息。地图是大多数地理信息系统应用程序的主要用户界面。在地图上,数据集被可视化为的代表矢量或栅格数据集的图层(图 10.1)。有了图层,数据可以直观地组织起来,同时许多任务,如高级数据编辑、分析和空间数据库查询都可以执行起来(参见第10.3.3节)。地理信息系统也有助于研究的初步结果或最终结果的地图的制图设计。健康或疾病制图通常是IDE中空间分析的第一步。在空间环境中可视化疾病发病率和流行率对于进一步的如聚类测试或空间疾病建模的研究至关重要。例如,在底层区域数据的情况下,底层点数据可以用点或点密度图和等高线图可视化(Rezaeian et al. 2007)。

然而,最终产品通常也是基于地图的可视化以及所提取的空间统计数据。传统的静态地图以及动态地图可以提供交互性,每次提供的信息比可视化表示的更多。感兴趣的读者可以参考Kraak and Brown (2001)中更完整的概述。时间序列要么由同一地理区域在不同时间点的几幅地图表示,要么由动态地图表

图10.1 ArcGIS中的图层左侧内容表显示了通过签名直观表示并覆盖在栅格图层上的图层

示。后者可以显示扩散过程的起点,并指导用户通过交互地选择期望的时间点(扩散状态)来流动时间。扩散过程也可以通过地图动画来显示,即动画地图序列可视化随时间变化的动态过程(Dransch 2000; Kraak 1999)。结果不一定需要印刷或在线发布的地图。它还可以作为其他应用程序的输入变量,如基于网络的传染病监测、预测和预警信息系统或任何其他模型。

10.3.3地理信息系统中的地图操作和分析模型

地理信息系统也可以理解为地理处理的一组数据分析工具,用于通过应用分析操作从现有数据集提取信息。IDE中的重要地理处理工具包括

bull; 插值方法;

bull; 拓扑分析;

bull; 邻近分析;

bull; 叠加分析;

bull; 空间自相关分析;

bull; 分析模型。

为了将疾病的点采样数据与在不同地点采样的解释信息联系起来,需要从空间不连续的点数据中获得空间连续信息的插值方法。这同样适用于将点数据与以连续方式产生的信息联系起来(比较第10.3.4节)。例如,“克里金法”是一种从点数据集中产生这种连续地图表面的既定方法(Cromley and McLafferty 2002)。克里金法考虑了地理参考信息的现有基础空间结构(样本或观测值之间的距离)。对于缺失数据的位置(无样本位置),可以得出统计最佳估计值及其标准误差,将实际和估计数据组合成平滑表面或栅格数据结构(Boulos 2004; Moore and Carpenter 1999)。

拓扑分析使用矢量图层(可视化的矢量数据集),并根据空间数据模型指出每个矢量要素(点、线或多边形)“知道”的其地理坐标和相邻要素(邻接性)。可以通过拓扑跟踪所有连接的要素,如相邻多边形或连接点位置之间的共享边界。例如,当一个点与一条线连接,而这条线与另一个点连接时,拓扑可以推断这两个点也是连接的(连通性)。拓扑也可用于检测多边形中的要素(包含性)。此外,属性表中的属性数据可用于空间数据库查询,如:“哪些住宅与记录有血癌或呼吸系统疾病病例的工业区相邻?“,邻近分析使用围绕点、线或多边形绘制的所谓缓冲区。考虑在研究地点中,关于水井和住房的当地信息被绘制成地图,并在地理信息系统中与调查的健康和人口普查信息相结合。例如,在这种情况下,使用缓冲区的邻近分析有助于分析师回答诸如“有多少居民生活在这口井周围50米半径范围内?“或者“哪些被调查的家庭正落入某口井的集水区?“(图 10.2,图10.3). 在邻近分析中,主题信息可用于对数据进行分层。考虑到前面的例子,居民可能被分成年龄组,或者使用年龄分布的四分位数来推导具有相同比例的某些年龄组的缓冲区。

叠加分析适用于不同的数据类型,包括矢量图层或栅格图层。这些数据集之间的关系可以被发掘,并创建具有更高级别的信息内容的新图层。向量(拓扑)

图10.2 井的矢量图层(三角形)和基于全球定位系统的健康调查位置(点:采访的家庭)覆盖在孟加拉达卡贫民窟的卫星光栅图像上

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[257048],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。