利用小孔成像估测太阳的直径最全word资料.docx
《利用小孔成像估测太阳的直径最全word资料.docx》由会员分享,可在线阅读,更多相关《利用小孔成像估测太阳的直径最全word资料.docx(20页珍藏版)》请在冰豆网上搜索。
利用小孔成像估测太阳的直径最全word资料
利用小孔成像估测太阳的直径
丹阳市后巷中学初三(6)朱晨甜
指导教师:
陈金火
学习了“光的直线传播”后,认识到光在同一均匀介质中是沿直线传播的。
验证光的直线传播的实例很多。
如:
太阳从云层中射出的光线是直线;在有雾的夜晚,用手电筒向天空照射,可看到一束直线光束。
小孔成像的实验也有力地证明了光的直线传播。
利用小孔成像的实验就能估测太阳的直径。
在晴朗的白天,我们在树下会发现地面上有许多小亮斑。
这是由于繁密的树叶相互叠加形成许多小孔,地面上的小亮斑就是太阳光通过小孔形成的太阳的实像,其形状是圆形的。
我们可利用这些小孔和亮斑来估测太阳的直径。
如图所示(已知太阳到地球的距离为1.5亿千米)。
(1)选一个大的光斑,测出其直径d,然后找到光斑的相应的小孔(先判断小孔大致位置,在小孔处挡住光线,光斑消失即是其对应小孔)。
(2)测出小孔到光斑所在地面的距离L。
(3)利用比例性质求出太阳的直径。
已知太阳到地球的距离L=1.5亿千米二1.5X1011米,设太阳的直径为D,由相似三角形的性质得:
注意点:
①由于成像的光斑很小,因此测量时要用精度高的测量工具,否则误差很大;②单位要求统一,否则会出现错误结果。
中图分类号:
TN957 文献标识码:
A 文章编号:
1009-2552(202111-0062-04
利用CUDA实现的基于GPU的SAR成像算法
柳 彬,王开志,刘兴钊,郁文贤
(上海交通大学电子工程系,上海200240
摘 要:
高速发展的图形处理器(GraphicsProcessingUnit,GPU为高效合成孔径雷达(SyntheticApertureRadar,SAR成像算法提供了具有发展前景的新型运算平台。
与CPU相比,利用GPU进行通用计算具有成本低、性能高的特点。
提出利用CUDA实现的基于GPU的SAR成像算法,与传统的基于CPU的成像算法相比,有两位数以上的效率提升,为应对SAR信号处理领域新的挑战提供具有前景的研究方向。
关键词:
合成孔径雷达;成像算法;图形处理器;CUDA
Imagingalgorithmofsyntheticapertureradar
basedonGPUviaCUDA
LIUBin,WANGKai2zhi,LIUXing2zhao,YUWen2xian
(DepartmentofElectronicEngineering,ShanghaiJiaotongUniversity,Shanghai200240,ChinaAbstract:
Recently,graphicsprocessingunit(GPUisdevelopingattopspeed,whichisanovelandpromisingcomputationplatformforhighlyefficientsyntheticapertureradar(SARimagingalgorithms.
ComparedtoCPU,generalpurposecomputationsbasedonGPUshowhigherperformancewithlowercost.A
SARimagingalgorithmbasedonGPUviaCUDAisintroducedinthispaper.ThisimagingalgorithmviaCUDAismorethantentimesasfastastraditionalCPU2basedSARimagingalgorithms.ItprovidesapromisingwaytosolvetheproblemsofSARsignalprocessinginthefuture.
Keywords:
syntheticapertureradar(SAR;imagingalgorithm;graphicsprocessingunit(GPU;CUDA
随着合成孔径雷达(SyntheticApertureRadar,SAR系统应用领域的拓广,要求SAR系统可以在更加灵活多样的模式下工作,具有更高的分辨率,在更为严酷的条件下仍然可以获得较为满意的图像结果等,这些都为SAR信号处理提出了新的挑战[1]。
要应对这些挑战,势必既要增加SAR成像算法的复杂程度,但同时又要降低成像算法的运行时间,保证图像的实时性。
因此,需要探索新的SAR成像算法的运算平台并且研究与之相适应的更为高效高性能的SAR成像算法。
高速发展的图形处理器(GraphicsProcessingUnit,GPU为高效SAR成像算法提供了具有发展前景的新型运算平台。
GPU是为了应对3D时代高复杂的图形图像处理运算而诞生的,与CPU相比,利用GPU进行通用计算具有成本低、性能高的特点。
GPU通用计算性能高的特点主要体现在浮点数的计算速度和内存带宽上。
GPU在浮点数的计算速度和内存带宽上不但已经远远超过了CPU,而且其发展速度也超过了CPU。
以浮点数的计算速度为例,图1比较了两大主流GPU(NVIDIA与ATI与IntelCPU的发展情况[2]。
GPU通用计算还具有成本低廉的特点,在达到相同的浮点数计算能力和内存
收稿日期:
2021-05-19
作者简介:
柳彬(1985-,男,硕士研究生,研究方向为雷达成像算法与GPU通用计算。
带宽的情况下,GPU在价格和耗电量两方面都低于CPU
。
图1 NVIDIA与ATI的GPU和Intel的CPU浮点数计算能力比较
最初,开发人员需要用汇编语言对GPU进行编程,这是非常难于学习和掌握的。
随着GPU的发展,开发人员可以利用以Cg、HLSL和GLSL为代表的着色器语言对GPU进行编程,进行GPU通用计算的开发,不过这需要开发人员非常熟悉GPU硬件架构和应用编程接口(ApplicationProgrammingInterface,API。
CUDA的产生就是为了解决这一问题,CUDA
对图形硬件和API进行封装,让开发人员把GPU看成一个具有超多核超多线程的处理器,并在类似于CPU的编程环境下对GPU进行编程,开发GPU通用
计算系统。
本文的目的在于研究并提出基于GPU的SAR成像算法,该成像算法并非简单地把原有运行在CPU的成像算法移植到GPU上,而是对原有算法进
行改进,让它与GPU的架构和编程模型相适应,充分利用GPU的运算资源,提高计算效率。
本文提出的算法是用CUDA实现的,利用了最新的GPU编程环境,可以提高开发进度,尽可能地发挥出GPU的计算性能。
通过仿真实验表明,本文提出的基于GPU的SAR成像算法的结果与理论值吻合,具有较好的成
像效果。
通过处理真实的SAR数据表明,本文提出的基于GPU的SAR成像算法比传统的基于CPU的成像算法有两位数以上的效率提升。
因此,本文提出的基于GPU的SAR成像算法具有高效高性能的特点,为应对SAR信号处理领域新的挑战提供具有前景的研究方向。
1 编程模型
CUDA的核心概念就是,它是一个超多线程的
编程环境,本文介绍CUDA编程模型中最重要的几个概念
[3]
。
1.1 主机和设备
在CUDA编程环境中,把CPU称为主机,把运行CUDA的GPU称为设备。
由主机调用的,在设备上运行的函数称为内核函数,内核函数一般由超多线程执行。
本文提出的SAR成像算法的实现主要就是依靠内核函数的设计。
1.2 线程层次结构
CUDA可以运行和管理超多线程,是通过三层
层次结构来管理这些线程的。
一定数量的线程组成线程块,而一定数量的线程块又组织为一维或者二
维的线程块网格。
同一个块内的线程可彼此协作,通过共享存储器来共享数据,并同步其执行来协调对存储器的访问。
一个块中的所有线程都必须位于同一个处理器核心中,因而,一个处理器核心的有限存储资源制约了每个块的线程数量。
以本文实验中所使用NVIDIAQuadroFX3700为例,在一个线程块中最多可以包含512个线程。
一个内核函数可能由多个大小相同的线程块执行,因而执行内核函数的线程总数应等于每个块的线程数乘以块的数量,这些块组织为线程块网格。
线程块需要独立执行,必须能够以任意顺序执行、能够并行或顺序执行。
一个网格内的线程块数量通常是由所处理的数据大小限定的,而不是由硬件上处理器数量决定的,前者可能远远超过后者的数量。
以本文实验中所使用NVIDIAQuadroFX3700为例,硬件中流处理器的数目是112个,而在一个线程块网格中最多可以包含65535个线程块。
1.3 存储器层次结构
CUDA线程在执行过程中可以访问多种存储器
空间的数据,开发人员必须根据存储器空间大小、速度以及只读性等各方面因素,选择合适的存储器。
表1概述了CUDA内部所有存储器的基本属性
[4]
。
表1 CUDA编程模型中各种存储器的基本属性
存储器名称层次
空间
速度是否只读寄存器
每个线程单独拥有非常有限
快否本地存储器每个线程单独拥有
有限
慢,不缓冲
否共享存储器每个线程块内共有非常有限快否全局存储器所有线程共有大慢,不缓冲否固定存储器所有线程共有有限慢,缓冲是纹理存储器
所有线程共有
大
慢,缓冲
是
1.4 CUFFT库
CUFFT是一个基于CUDA编程环境的FFT的
库。
CUFFT能够达到很高的运算性能
[5-6]
在本文
中利用CUFFT来实现SAR成像算法中的FFT与IFFT计算。
2 算法实现
图2给出的是利用CUDA实现的,基于GPU的SAR成像算法实现的流程图,SAR的原始数据经过
以下几个步骤的处理:
第一,把原始数据从CPU传输到GPU。
第二,距离向的压缩。
具体描述为:
首先沿距离向做FFT,然后执行距离向匹配滤波的内核函数,再利用距离向IFFT完成距离向压缩。
第三,通过方位向FFT把数据变换到距离2Doppler域,距离徙动校正和方位向匹配滤波都在该
域进行。
第四,在距离2Doppler域进行距离徙动校正,在该域同一距离门的一组目标轨迹相互重合,距离徙动校正将徙动曲线拉直到与方位频率轴相平行。
第五,通过每一距离门上的方位向频率匹配滤波实现方位向压缩。
第六,通过方位向IFFT将数据变回时域,得到压缩后的图像。
第七,
将处理好的图像从GPU传输回CPU。
图2 利用CUDA实现的基于GPU的SAR成像算法实现流程
3 仿真实验与结果
为了测试本文提出的SAR成像算法的成像效果,本部分介绍仿真实验与结果,对三点目标A、B、C进行仿真,其中B点位于场景中心处即斜距为20km处,A点和C点分别位于斜距为15km和25km
处,仿真参数如表2所示。
如图3所示,图3(a,3(b和3(c分别为A,B和C三个点目标的成像结果。
表2 L波段机载SAR仿真参数参数名称值
雷达工作频率1.27GHz
发射脉冲时宽2.5μs距离脉冲调频率8MHzΠμs
信号带宽20MHz距离采样率30.8MHz多普勒带宽250H
z方位采样率
469.5Hz
图3 三个点目标成像结果
三点目标仿真的结果如表3所示,理论上距离向分辨率为1.34个距离采样,而三目标所在位置的方位分辨率不同,在表3中所罗列的方位分辨率定义为:
Raz=RsimΠRth(1其中,Raz为表中所罗列的分辨率,Rsim为仿真所得分辨率,Rth为理论分辨率。
表3 三点目标仿真结果距离分辨率(距离采样方位分辨率(比值距离向
PSLR(dB
方位向
PSLR(dB近端点目标(A1.3931.035-13.98-14.12中心点目标(B1.3901.027-13.89-13.98远端点目标(C
1.392
1.032
-13.92
-14.10
考虑到在成像过程中数值计算不可避免的会产生误差,所以测得的分辨率比理论分辨率略差,是可以理解的,因此认为,本文提出的利用CUDA实现的,基于GPU的SAR成像算法的结果与理论值
吻合。
4 效率测试
在上文提到GPU通用计算具有性能高的优点,在这一部分利用多块真实的SAR数据测试本文提出的基于GPU的SAR成像算法的效率,并与传统的基于CPU的SAR成像算法的效率相对比。
测试结果如表4所示。
测试中使用的CPU是IntelXeonE5140,使用的GPU是NVIDIAQuadroFX3700,分别测试了七块不
同尺寸的数据,由于IntelXeonE5140是四核的CPU,对基于CPU的SAR成像算法,既测试了单线程情况下的运行时间,也测试了利用OpenMP使用四线程下的运行时间,而对于基于GPU的SAR成像算法,分别测试了考虑读写显存和不考虑读写显存的运行时间。
表4 基于GPU的与基于CPU的SAR成像算法的运行时间对比(单位:
秒
数据尺寸4096×81928192×40968192×8192
GPU(考虑读写显存1.2741.2992.556
由测试结果可知,本文提出的利用CUDA实现的,基于GPU的SAR成像算法具有极高的效率,相比传统的基于CPU的SAR成像算法,效率得到了两位数以上的提升。
不过通过观察表4可以发现,在读写显存上花费了许多时间,目前,CPU与GPU之间数据传输带宽有限,GPU显示存储空间有限成为进一步提高GPU通用计算效率的瓶颈。
5 结束语
本文主要研究了基于GPU的SAR成像算法的实现与系统解决方案。
本文提出了利用CUDA实现的,适用于GPU的SAR成像算法。
该成像算法利用了全新的GPU通用计算的开发理念和编程模型,极大地发挥出了GPU通用计算的潜能。
通过仿真实验表明:
本文提出的基于GPU的SAR成像算法的结果与理论值吻合,具有较好的成像效果。
通过处理真实的SAR数据表明:
本文提出的基于GPU的SAR成像算法比传统的基于CPU的成像算法有两位数以上的效率提升。
对基于GPU的SAR成像算法的研究以及本文的意义在于,通过对传统的基于CPU的成像算法进行改进,使其不但能够在GPU上运行,而且能够适合于GPU的框架和编程模型,从而能够充分地利用GPU强大的计算能力和低廉的计算成本,开发出新型的SAR信号处理系统,应对SAR信号处理领域目前面临的新的挑战。
未来的研究将专注于以下几方面,以使目前的研究结果更加完善:
第一,进一步提高计算效率。
可以从以下两个方面考虑提高计算效率:
其一,进一步减少CPU与GPU之间的数据传输。
其二,让CPU与GPU之间实现负载平衡,把原有的基于GPU的SAR成像算法改进为同时利用GPU和CPU计算资源的异质成像算法。
第二,开发高效SAR成像算法的应用。
要解决SAR信号处理领域的新挑战的关键就在于提出更加高效的成像算法,而本文正是基于这个需求而产生的。
本文提出和实现了基于GPU的成像算法,并通过实验证实了该算法的准确性和高效性,为解决SAR信号处理的难题提供了具有前景的解决方案,不过,要进行进一步的研究,才能把该算法系统化、集成化、实用化,开发出高性能的新一代SAR成像系统,用于提供分辨率更高的,范围更大的实时SAR图像。
参考文献:
[1] 王开志.斜视条件下高分辨率合成孔径雷达成像技术[D].上
海:
上海交通大学,2006.
[2] JohnD.Owens,DavidLuebke,NagaGovindaraju,etal.ASurveyof
General2PurposeComputationonGraphicsHardware[J].Computer
GraphicsForum,2007.
[3] Nvidia.NVIDIACUDAProgrammingGuideVersion2.1[Z].2021.
[4] SvetlinA,Manavski,GiorgioValle.CUDAcompatibleGPUcardsasef2
ficienthardwareacceleratorsforSmith2Watermansequencealignment
[J].BMCBioinformatics,2021,9(2:
S10-2021.
[5] VasilyVolkov,BrianKazian.FittingFFTontotheG80Architecture
[M].2021.
[6] NagaK.Govindaraju,BrandonLloyd,YuriDotsenko,etal.Highper2
formancediscreteFouriertransformsongraphicsprocessors[C].Con2
ferenceonHighPerformanceNetworkingandComputing,ArticleNo.
2,2021.
责任编辑:
肖滨
利用信号外推实现磁共振快速成像
摘 要:
本文提出了一种广义的频域紧支集信号外推的新方法,并将之应用于提高核磁共振成像速度。
计算机仿真和实验结果表明了文中的理论和方法是有效的和可应用的。
关键词:
紧支集;信号外推;磁共振成像
分类号:
R445.2;R318.04
IMPLEMENTATIONOFFASTMRIMAGINGUSING
EXTRAPOLATIONOFSIGNALS
WangWeidong
(InstituteofHeavyIonPhysics,PekingUniversity,Beijing100871)
(PLAGeneralHospital,Beijing100853)
BaoShanglian
(InstituteofHeavyIonPhysics,PekingUniversity,Beijing100871)
(ResearchCenterofPhysicalTechnologiesonTumorDiagnosisandTherapy,PekingUniversity,Beijing100871)
ZuDonglin
(InstituteofHeavyIonPhysics,PekingUniversity,Beijing100871)
ABSTRACT:
Wepresenedageneralizedmethodforextrapolatingsignalsofcompactsupportedsetinfrequencydomain,anditsapplicationtoimprovingthespeedofmagneticresonanceimaging.Thecomputersimulationandexperimentalresultsshowedthattheproposedtheoryandmethodwereefficientandapplicable.
Keywords:
Compactsupportedset;Signalextrapolation;Magneticresonanceimaging▲
0 引言
提高脑和神经系统功能成像和脏器动态成像的速度已成为磁共振成像技术的又一个热点问题。
在磁共振成像中影响其成像速度的主要因素有两个方面:
一是受到人体产生核磁共振信号所需时间的限制,二是受到核磁共振信号的采集和测量时间的限制。
当成像的射频序列和开关序列确定时,前者通常是无法改变和控制的因素,而后者是可以改变和控制的。
但是,减少测量时间和采样样本的数量,只能导致k-空间(测量空间)测量信号的不完全,即有限长度,从而影响影像空间(f-空间)重建信号的质量。
我们知道,由于影像空间信号是空间有限长度的,那么k-空间信号的频域是紧支集的。
为了改善影像信号的质量,本文研究和推广了紧支集信号外推的理论和方法,并利用文中的理论和方法将测得的k-空间信号进行外推处理,然后再利用外推的k-空间信号重建f-空间的信号。
这样做有两个优点:
第一,提高了核磁共振成像速度,这是因为减少了磁共振信号的采集和测量时间;第二,降低测量信号的信噪比损失,这是因为采集的k-空间信号k值是低的,而低k-空间信号的信噪比通常要比高k-空间信号信噪比高得多。
本文研究了频域紧支集信号外推的基本定理和及其实现快速磁共振成像的方法。
文中,第二节提出了广义的频域紧支集信号的一步外推的定理及其简捷的证明方法。
第三节给出了利用信号外推方法实现快速磁共振成像的技术。
第四节进行了计算机仿真和实验研究,从而证实了快速成像方法的有效性和正确性。
1 信号外推的理论与方法
频域/时域紧支集信号(带限/时限信号)是实际应用中经常遇到的一类信号,但是,在测量中,人们只能得到它的一段有限长度的采样值,因而从有限长度的信号来外推无限长度的信号,是需要解决的重要问题。
它在信号处理、地球物理、医学影像等领域有广泛的应用价值和重要意义。
利用长球波函数展开理论,Papoulis和Gerchberg解决频域紧支集信号的外推问题,他们独立提出一种有效的迭代外推算法[1,2]。
其后,Cadzow等人提出可一步外推的高效计算方法[3]。
至今,在这方面有不少学者作了重要改进,业已取得一些可资利用的算法[4~7]。
事实上,这些理论和方法的数学生长点无需复杂的长球波函数展开理论,而实质上是一种有限长度信号的采样理论。
本节推广了Cadzow的信号外推的基本结论,提出了一种广义的一步外推的定理及其简捷的证明。
定义1 记为一对Fourier变换,若
(1)
则称f(t1,t2,…,tm)为频域紧支集信号,称VΩ为支撑集。
根据解析函数的理论,频域紧支集信号f(t1,t2,…,tm)在(-∞,+∞)m上有定义,而在实际中只能测量到有限长度f(t1,t2,…,tm),(t1,t2,…,tm)∈‖VT能否用f(t1,t2,…,tm),(t1,t2,…,tm)∈VT0的有限长度测量信号外推f(t1,t2,…tm),(t1,t2,…,tm)∈(-∞,+∞)m无限长度整个信号。
下面定理对此给予了肯定。
定理 设且F(ω1,ω2,…ωm)和若存在一信号z(t1,t2,…,tm)满足积分方程
(2)
其中
(3)
则有
(4)
证明:
设时域矩形窗函数为
(5)
则方程
(2)可写成下面形式
(6)
(6)式两边取Fourier变换,根据频