英语原文共 16 页
利用统计分析模型检测空气质量总量控制区大气污染状况的研究
摘要
目前台湾的空气质量是由污染标准指数决定的,PSI适用于空气污染可能严重的区域和空气质量总量控制区。台湾和其他国家的许多研究都有用PSI检验了空气污染的特征和水平。本研究使用从中央AQTQCD的8个自动空气质量监测站收集的空气质量数据并讨论了空气质量变量之间的相关性,试图准确反映每次监测所观察到的站点空气质量差异以及建立适合整个台湾的空气质量分类系统。使用因子分析后,七种空气污染物分为三个因素:有机,光化学和燃料。这三个因素是主要的影响台湾空气质量的因素。聚类分析用于对台湾中部的空气质量进行分类并将其分为五组,呈现出不同的空气质量特征和污染程度。这个结果应作为参与空气质量审查管理有效性或管理控制策略的制定的参考,
关键词:统计分析模型; 因子分析; 空气质量总量控制区;PSI
- 引言
目前,台湾的空气质量状况是通过污染标准指数(PSI)传播给公众的,PSI基于美国环境保护署制定的类似系统机构(EPA)。台湾于1993年首次使用PSI测量中华民国的空气污染水平。PSI基于五种污染物的影响算污染物的子指数,五种污染物分别为:物质的粒径小于10微米的颗粒(PM10),二氧化碳(SO2),二氧化氮(NO2),一氧化碳(CO)和臭氧(O3),所有这些都是每天测量。然后将由监测站测量每日的最大值记作PSI值。主要目的是监测台湾中央的整体空气质量并建议改善,通过对PSI的评估,当地的空气质量状况可以完全了解。五种空气污染物的浓度水平用于确定PSI然后转发为0到500之间的数字,并分为好(0-50),中等(51-100),不健康(101-199),非常不健康(200-299),危险(ge;300)水平。污染物浓度水平以及PSI如表1所示。
表1 污染物浓度与污染分指数对比表
污染物 |
PM10 |
SO2 |
CO |
O3 |
NO2 |
时间统计 |
24小时平均值 |
24小时平均值 |
最多8小时的平均值 |
在24小时内最大值与最小值 |
在24小时内最大值与最小值 |
单位 |
ppb |
ppm |
ppb |
ppb |
|
PSI |
|||||
50 |
50 |
30 |
4.5 |
60 |
|
100 |
150 |
140 |
9 |
120 |
|
200 |
350 |
300 |
15 |
200 |
600 |
300 |
420 |
600 |
30 |
400 |
1200 |
400 |
500 |
800 |
40 |
500 |
1600 |
500 |
600 |
1000 |
50 |
600 |
2000 |
多变量监控方法考虑所有可用数据同时可以提取有关空气污染物的关系和综合影响的关键信息。当质量管理体系在空气中发生故障时,单变量监测方法往往不足以确定原因因为每次空气污染物测量的信噪比都很低。但是,多变量监控可以通过平均提高信噪比,从而产生更加真实的效果。在化学计量学领域,多变量统计学技术已经成为最后建模和分析中最活跃的研究工具之一。但是,据作者所知,到目前为止,只对用于评估和管理空气污染的多变量模型的有效性进行了有限的研究。
空气污染是与世界各地城市地区相关的众所周知的环境问题。各种监测计划已被用于确定空气质量通过产生大量世界不同地区前面提到的每种空气污染物浓度的数据。大型数据集通常不会以简单明了的方式向科学界,政府官员,政策制定者,特别是公众传达空气质量状况。通过确定给定区域的空气质量指数(AQI)来解决该问题。 AQI也被称为空气污染指数(API)[10]或污染物标准指数(PSI)[11],已被美国加拿大,欧洲,澳大利亚,中国,印度尼西亚,台湾的许多机构开发和传播。
虽然台湾已实施更有活力的空气污染排放标准来减少空气污染物的排放,增加制造厂和各种车辆的数量,但空气污染源集中的地区空气质量没有明显改善。因此,有必要推进空气质量总量控制策略来进一步改进空气质量。目前,台湾环保局已建立了72个自动空气质量监测站并将台湾分为七个空气质量总量控制区。在北部,有新竹 - 苗栗及中部由云林 - 嘉义 - 台南,高雄 - 屏东,宜兰和花莲,台东。预计在每个区的空气质量总量控制方案下,严重增加空气质量问题可以解决。在这些地区中,中部包括台中市,彰化县和南投县。
本研究探讨了台湾中部八个现有的空气质量监测站。本研究采用多元统计方法,选取七种重要的空气污染物进行检验污染水平,状况,空气污染特征和相应的PSI以及讨论每次监测污染物与空气污染分布特征之间的相关性,八个现有的空气质量监测站准确反映监测站之间空气质量的差异。预计会作为建立适合污染特征和分类的空气质量监测站评估系统的参考。
根据台湾行政院环境保护署公布的空气质量总量控制区的空气污染特征,本研究选择了七种空气污染物,以符合政府制定排放标准政策的目标。研究结果也使其更合理适用于台湾各种空气质量总量控制区进行空气控制,此外,应用的多变量统计分析可以确定空气的特征和各空气质量总量控制区污染及其分布特征,同时,它还可以证明从原始调查中收集的数据。该统计模型,经过调查和验证,可用于评估是否有效果以及实现空气质量管理实现目标与否。
-
方法论
- 选择空气质素监测站
台湾环保局根据地理位置分配空气质量总量控制区条件,工业类型,天气条件和城市或城市群,作为一个区可能受到相同的空气污染物的影响。本研究选择了8个自动空气质量监测站,中心区的部分如图1所示。图2是台湾在亚洲的地理位置。其行政区域包括台中市(西屯站,丰原站,沙鲁站,大理站),彰化县(彰化站,二林站)和南投县(南投站,竹山站)。空气质量总量控制区的空气质量长期以来一直排名作为第三个空气质量保护类,目前有一个主要的空气污染源-台中火力发电厂,它是世界上最大的燃煤发电厂,此外,彰化沿海工业园区有很多工厂,它严重影响了该地区的空气污染质量。
图1 八个空气质量监测站的地理位置
-
- 统计分析 - 因子分析
为了选择要包含在因子分析中的元素,至少需要70%的样本具有可测量的元素水平。原则上,因子分析实际上将其元素分组并将这些元素分离成因素,因子分析用于环境数据中的源分配认为一起波动的元素具有一些共同特征。理想情况下,每个提取因子代表影响样本的来源。虽然没有明确规定要保留的因素数量,通常要么保留有意义的因素,要么保留特征值大于1的因子。理论上,无关因子具有零特征值,小于1的特征值表示一个因子贡献少于一个变量。必须解释因素的物理意义,通过观察哪些元素或变量在因子内显示高(ge;0.25)的负载。装载量绝对值超过0.25可能由随机误差支配。选择没有设定规则的数量,但在应用中,所选数量的因素必须解释至少70%总方差,然后使用它们的因子分数筛选数据的异常值。
因子对特定样本的影响由该样本的因子得分给出,因子得分是该因子的平均值与所有因子的平均值的标准差的数量样品;换句话说,它是因素的价值。该因子的平均贡献结果在得分为零的情况下,大于平均值的贡献导致正分数和低于平均分数贡献导致负分。因子得分大于1表明其影响很大。
图2.台湾在亚洲的地理位置
2.3聚类分析
聚类分析是一种用于解决分类问题的探索性数据分析工具。它的目标
是将案例分类为组或集群,以便相同的集群成员之间的关联程度很强和不同集群的成员之间很弱。因此,每个集群就此而言描述收集的数据,其成员所属的类别。分层凝聚聚类是运用最多的通用方法,因为它提供任何一个样本和整个样本之间的直观相似性关系数据集。它通常用树状图(树形图)来说明。树形图提供了一个聚类过程的可视化摘要,呈现出的图片及其邻近性,原始数据的维数急剧减少。此外,聚类分析有助于根据类中的相似性将对象(案例)分组为类(集群),阶级特征不是事先知道的,而是可能从分析中确定。CA的结果有助于解释数据并指出其模式。
2.4判别分析
判别分析用于确定区分两个或更多个的变量,它使用原始数据为每个组构建判别函数在等式(1)中:
其中是组的数量(G),是每个组固有的常数,是数量用于将一组数据分类为给定组的参数,是由DA分配的权重系数到给定的选定参数()。在本案例研究中,三组时间(三季)和已选择空间(三个采样区域)评估和分析数量用于将监控站点的度量分配到组(季节或空间)的参数作为n。通过使用标准,逐步地对原始数据应用判别分析,向后逐步构造判别函数以评估空间和时间空气质量的变化。时间(季节)和空间(网站)是分组(依赖)变量,而所有测量参数构成自变量。
3 结果与讨论
3.1 选择监测数据的时间和范围
为了获得完整和多样化的污染物数据,本研究考虑了7种污染物包括SO2,NO2,CO,PM10,O3,总烃化合物(THC)和非甲烷烃化合物(NMHC)用于因子分析,以确定空气中影响空气质量状态的主要因素,所选系列数据主要来自台湾的网站EPA(http://www.epa.gov.tw)为2010年1月1日至2011年9月30日期间。在此期间,由于仪器停机用于维修和保养时间不合预期,一些数据未完全收集,删除所有不完整的数据集,以便每天有610套空气污染样本。 所有统计分析均使用SPSS for Windows 17.0版进行。
3.2因子分析的结果
3.2.1因子分析选择的结果
在本研究中实施的因子分析中,使用最大的varimax旋转来解释正交旋转因素的数量特征。 如分析结果所示,表2中特征值大于1的因子有三个。它们的累计方差解释为66.212%。 三个因子的特征值分别为1.837,1.522和1.013, 选择这三个因素来说明影响空气质量的主要因素。
表2 因子分析和方差结果
成分 |
初始特征值 |
方差贡献率 |
累积方差贡献率 |
1 |
1.837 |
27.931 |
27.931 |
2 |
1.522 |
22.563 |
50.494 |
3 |
1.013 |
15.718 |
66.212 |
4 |
0.945 |
10.750 |
76.962 |
5 |
0.750 |
9.807 |
86.769 |
6 |
0.578 |
7.114 |
93.883 |
7 |
0.287 |
6.117 |
100.000 |
3.2.2 因素的确定
主要因素的数量可以从大于
资料编号:[5894]
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。