英语原文共 14 页
基于CSI的室内定位指纹识别:深度学习方法
徐玉旺,IEEE学生会员,高凌军,IEEE学生会员,史文茂,IEEE高级会员,Santosh Pandey
摘要 :随着基于位置的服务在室内环境中的快速增长需求,基于指纹识别的室内定位由于其高精度而引起了人们的极大兴趣。在本文中,我们提出了一种新的基于深度学习的室内指纹识别系统,该系统使用信道状态信息(CSI),称为DeepFi。基于CSI的三个假设,DeepFi系统架构包括离线培训阶段和在线本地化阶段。在离线训练阶段,深度学习被用于训练深度网络的所有权重作为指纹。此外,贪婪学习算法用于逐层训练权重以降低复杂性。在在线定位阶段,我们使用基于径向基函数的概率方法来获得估计的位置。实验结果表明,与两种代表性室内环境中的三种现有方法相比,DeepFi可以有效地减少定位误差。
关键字:信道状态信息(CSI),深度学习,指纹识别,室内定位,WiFi。
一.介绍
WITH移动设备的泛滥,室内本地化已成为一个日益重要的问题。与户外定位不同,例如具有视距(LOS)传输路径的全球定位系统(GPS),室内定位面临挑战性的无线电传播环境,包括多径效应,阴影,衰落和延迟失真。除了高精度要求外,室内定位系统还应具有移动设备的低复杂性和短的在线处理时间。为此,基于指纹识别的室内定位成为满足这些要求的有效方法,其中大量的测量对于构建用于促进实时位置估计的数据库是必要的。
基于指纹识别的定位通常包括两个基本阶段:1)离线阶段,也称为训练阶段;2)在线阶段,也称为测试阶段]。当收集和预处理与位置标记相关的调查数据时,称为训练阶段,训练阶段用于数据库构建。在离线训练阶段,机器学习方法可用于训练指纹而不是存储所有接收信号强度(RSS)数据。这种机器学习方法不仅降低了计算复杂度,而且获得了RSS中的核心特征,以获得更好的定位性能。K-最近邻(KNN),神经网络和支持向量机,作为流行的机器学习方法,已经应用于基于指纹识别的室内定位。KNN使用K-最近位置的加权平均来确定未知位置,其中观察到的RSS测量与其K-最近训练样本之间的欧几里德距离的倒数为权重。KNN的一个限制是它需要存储所有RSS训练值。神经网络利用反向传播算法来训练权重,但他们考虑一个隐藏层以避免在训练阶段中的错误传播,并且需要标记数据作为监督学习]。支持向量机使用核函数来解决RSS值的随机性和不完整性,但计算复杂度高。在线阶段,移动设备记录实时数据并使用数据库对其进行测试。然后,通过搜索每个训练点以找到最匹配的点作为目标位置,使用测试输出来估计移动设备的位置。除了这种最接近的估计方法之外,替代匹配算法是识别几个接近点,每个接近点具有最大似然(ML)概率,并且将估计位置计算为候选位置的加权平均值。
由于其简单性和低硬件要求,许多现有的室内定位系统使用RSS作为指纹。例如,Horus系统使用概率方法进行RSS数据的位置估计]。这种基于RSS的方法有两个缺点。首先,由于室内环境中的多径效应,RSS值通常在固定位置随时间具有高可变性。即使对于固定设备,这种高可变性也可能引入大的位置误差。其次,RSS值是粗略信息,其不利用正交频分复用(OFDM)系统中的许多子载波来获得更丰富的多径信息。现在可以从一些WiFi网络接口获得信道状态信息卡(NIC),可用作指纹,以提高室内定位的性能 。例如,细粒度室内指纹识别系统(FIFS)方案使用多个天线上的加权平均CSI值]。此外,PinLoc系统还利用CSI信息,同时考虑1 1 m2点用于训练数据[13]。
在本文中,我们提出了一种基于深度学习的指纹识别方案,以减轻现有基于机器学习的方法的一些局限性。基于深度学习的方案可以充分探索无线信道数据的特征,并获得最佳权重作为指纹。它还结合了贪婪的学习算法来降低计算复杂度,已成功应用于图像处理和语音识别[14]。所提出的方案基于CSI以获得比基于RSS的方案更多关于无线信道的细粒度信息,例如来自每个接收分组的每个天线的每个子载波的幅度和相位。所提出的方案也与现有的基于CSI的方案不同,因为它包含从英特尔IWL 5300 NIC的三个天线收集的90个大小的CSI值,以深度学习训练深度网络的权重。
特别是,我们提出了DeepFi,这是一种使用CSI的基于深度学习的室内指纹识别方案。我们首先介绍CSI的背景,并提出关于CSI的三个假设。然后,我们介绍了DeepFi系统架构,其中包括离线培训阶段和在线本地化。在训练阶段,从访问设备驱动程序收集来自三个天线的所有子载波的CSI信息,并使用具有四个隐藏的深度网络进行分析。我们建议使用深度网络中的权重表示指纹并使用一堆受限制的Bolzmann机器(RBM)结合贪婪学习算法,以逐层方式训练深层网络,以降低训练复杂性。贪婪算法首先估计第一层RBM的参数以对输入数据建模。然后,冻结第一层的参数,并且我们从条件概率获得样本以训练第二层RBM,等等。最后,我们可以用给定的贪心学习算法获得第四层RBM的参数。而且,对于RBM模型的每一层,我们都使用一步迭代的方法进行对比分歧更新权重,其时间复杂度低于其他方案,如马尔可夫链蒙特卡罗[15]。在在线定位阶段,基于径向基函数(RBF)的概率数据融合方法被开发用于使用乘法分组的在线位置估计。为了降低在线定位的计算复杂度,将数据包分成几个批次,每个批次包含相同数量的数据包。由于数据包是批量并行处理的,因此我们可以在处理大量数据包时显着缩短处理时间。
所提出的DeepFi方案通过在两个代表性室内环境(即起居室环境和计算机实验室环境)中的大量实验来验证。在两个实验中,DeepFi的表现都优于现有的几个RSS指标(RSSI)和基于CSI的方案。我们还研究了不同DeepFi参数的影响关于定位精度和执行时间,例如使用不同数量的天线,测试分组和每批数据包。最后,我们研究了不同传播环境对DeepFi性能的影响,例如在我们的实验研究中替换障碍物,人体移动性和训练网格大小。我们的实验结果证实,DeepFi在这些情况下表现良好。
本文的其余部分安排如下。背景和假设见第二节。DeepFi系统在第III节中介绍,并在第IV节中进行了评估。我们回顾了第五节中的相关工作,第六节总结了本文。
二.背景和假设
A.CSI
由于NIC(例如Intel的IWL 5300),现在比以往更容易进行信道状态测量,因为必须检测物理层(PHY)信息的硬件记录。现在,可以通过访问设备驱动器从笔记本电脑中检索CSI。CSI记录传播期间经历的信道变化。从源发射,无线信号可能经历由例如多径效应,衰落,阴影和延迟失真引起的丰富损伤。没有CSI,很难仅通过信号功率来揭示信道特性。
设X_和Y_表示发送和接收信号向量我们有
y_ = cs·x_ n_
其中,向量N_是加性高斯白噪声,CSI表示信道的频率响应,可以从X_和Y_估计。
2.4GHz频带的WiFi信道可以被认为是OFDM系统的窄带平坦衰落信道。英特尔WiFi Link 5300 NIC实现了具有56个子载波的OFDM系统,其中30个可通过设备驱动程序读取CSI信息。子载波i的信道频率响应CSIi 是复数值,其由下式定义:
CSI= |CSI | exp{jang;CSI }
其中CSIi 和ang;CSIi 分别是子载波i的幅度响应和相位响应。在本文中,
提出的DeepFi框架基于这30个子载波(或CSI值),可以揭示比RSSI更丰富的信道属性。
B.假设
接下来,我们提出了关于CSI数据的三个假设,这些假设通过我们的测量研究与统计结果进行了验证。
1)假设1:与RSS值相比,CSI幅度值对于在固定位置处连续接收的分组表现出很大的稳定性。
CSI振幅值反映了频域中的信道特性,并且对于给定的信号随时间呈现出很大的稳定性。
图1. 150个采样位置的CSI和RSS振幅的标准偏差的CDF
图2.在50个不同位置的CSI振幅值的簇数的CDF
图3.在50个不同位置处的CSI振幅值的簇的数量的二维轮廓
图4.针对50个接收数据包在Intel WiFi Link 5300 NIC的三个天线(每个以不同颜色绘制)测量的信道频率响应幅度
图1显示了150个采样位置的归一化CSI和RSS振幅的标准偏差的累积分布函数(cdf)。在每个位置,CSI和RSS值是使用Intel WiFi Link 5300 NIC的三个天线从50个接收的数据包中测量的。可以看出,对于CSI振幅值,90%的标准偏差低于平均值的10%。但是,对于RSS值,60%的标准偏差低于平均值的10%。因此,CSI比RSS稳定得多。我们的测量持续很长一段时间,包括办公时间和安静时间。在不同时间观察到相同位置的CSI的稳定性没有明显差异。相反,即使在相同位置,RSS值也表现出很大的变化。因此,CSI网络振幅值被用作DeepFi系统中深度学习的特征。
2)假设2:由于多径效应和信道衰落的室内环境,子载波上的CSI值的簇的数量在不同的位置处变化。
CSI幅度值反映具有丰富的多径分量和信道衰落的信道频率响应。我们对信道频率响应的研究表明,对于CSI幅度值存在几个主要簇,其中每个簇由具有相似CSI幅度值的子载波子集组成。为了找到CSI振幅值的簇的特征,我们绘制了用于图1和图2中的起居室环境中的50个不同位置的CSI振幅值的簇数的cdf和2-D轮廓。分别为2和3。对于每个位置,CSI值是使用Intel WiFi Link 5300 NIC的三个天线从50个接收的数据包中测量的。在图中在图2和3中,示出了CSI幅度值的簇的数量在50个不同的位置处变化。此外,在大多数位置,CSI幅度值形成两个或三个簇。由于较少的反射和扩散,一些位置具有一个簇。具有少量五个或六个簇的一些其他位置可能遭受严重的多径效应。为了检测所有可能数量的集群,我们在每个位置长时间测量接收到的数据包的CSI幅度值,这可用于深度网络中的训练权重。此外,更多的数据包传输将有助于揭示每个位置的综合属性。在我们的实验中,我们考虑500和1000个数据包用于在客厅环境和计算机实验室环境中进行培训,分别超过FIFS中使用的60个包。
3)假设3:英特尔WiFi Link 5300 NIC的三个天线具有不同的CSI功能,可用于改善训练和测试样本的多样性。
Intel WiFi Link 5300配备三个天线。我们发现即使对于相同的分组接收,三个天线的信道频率响应也是高度不同的。在图4中,来自三个天线的信道频率响应的幅度表现出不同的特性。在FIFS中,简单地累积来自三个天线的CSI幅度值以产生平均值。相比之下,DeepFi旨在利用其可变性来加强深度学习中的培训和测试过程。30个子载波可以被视为30个节点,并用作深度学习的可见变化的输入数据。使用三个天线,有90个节点可用作深度学习的输入数据。输入数据的节点数量的大量增加可以改善训练和测试样本的多样性,如果选择合理的参数,则可以获得更好的定位性能。
三.deepfi系统
A.系统架构
图5显示了DeepFi的系统架构,它只需要一个接入点和一个配备的移动设备。
图5. DeepFi架构
图6.深度学习的重量训练
其系统使用的是Intel WiFi link 5300 NIC。在移动设备处,可以从修改的芯片组固件读取原始CSI值以用于接收的分组。英特尔WiFi链路5300 NIC具有三个天线,每个天线可以从30个不同的子载波收集CSI数据。因此,我们可以为每个分组接收获得90个原始CSI测量。与通过多个天线平均以减少接收噪声的FIFS不同,我们的系统使用来自三个天线的所有CSI值用于室内指纹以利用信道的多样性。由于很难将CSI的相位用于定位,因此本文仅考虑指纹识别的幅度响应。另一方面,由于输入值应限制在有效深度学习的范围(0,1)中,因此我们对离线和在线阶段的90个CSI值的幅度进行归一化。
在离线培训阶段,DeepFi会生成基于特征的指纹,这与直接存储CSI值的传统方法有很大不同。基于特征的指纹,利用深度学习获得的大量权重用于不同位置,有效地描述了每个位置的CSI特征并降低了噪声。同时,这些权重可以间接提取隐藏在CSI值中的聚类的特征。基于特征的指纹服务器可以存储不同训练位置的权重。在在线定位阶段,移动设备可以使用数据融合方法估计其位置,这将在第III-C节中描述。
B.深度学习的重量训练
图6显示了如何基于深度学习训练权重。该过程分为三个阶段,包括预训练,展开和微调[16]。采用具有四个隐藏层的深层网络,其中每个隐藏层由不同数量的神经元组成。为了减小CSI数据的维数,我们假设较高隐藏层中的神经元数量多于较低隐藏层中的神经元数量。设K1,K2,K3和K4 表示第一个神经元的数量,
第二,第三和第四隐藏层。它跟随
K1 gt; K2 gt; K3 gt; K4。
此外,我们提出了一种代表手指的新方法:
打印,即使用连接层之间的权重。将W1,W2,W3和W4 定义为CSI值的归一化幅度与第一隐藏层,第一和第二隐藏层,第二和第三隐藏层之间的权重,以及第三和第四隐藏层。关键的想法是在深度网络中训练权重后,我们可以将它们存储为指纹,以便于在线测试中的本地化阶段。此外,我们将hi 定义为层i的隐藏变量,对于i = 1,2,3,4,并且令v表示输入数据,即归一化的CSI量值。
我们用具有概率生成模型的四个隐藏层代表深度网络,可以写成
(3)
由于深层网络中的节点是相互独立的,
Pr(v | h1),Pr(h1| h2)和Pr(h2| h3)可以表示为:
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。