首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 156 毫秒
1.
空间聚类是空间数据挖掘的重要方法,而K-Medoids是一种常用的空间聚类算法。K-Medoids聚类算法存在初始点选择问题,而且计算复杂。为了提高算法的有效性和时间效率,本文结合模拟退火算法思想,改进了传统的K-Medoids算法PAM,提出一种基于GPU计算的并行模拟退火PAM算法。类比矩阵乘法运算,定义了一种新的矩阵计算方法,可以有效减少数据在GPU全局内存和共享内存之间的传输,提高了算法在GPU中的执行效率。利用模拟退火算法搜索聚类中心点,保证了聚类结果的全局最优性。基于不同的数据集,将串行和并行模拟退火PAM算法以及已有的遗传PAM算法进行比较,结果表明并行模拟退火PAM算法聚类结果正确,且时间效率高。最后,应用本文改进算法对贵州省安监系统的安全监管隐患数据进行聚类分析,发现了隐患聚集中心,相关结果对政府的决策具有一定的实际应用价值。  相似文献   

2.
基于GPU并行加速的叠前逆时偏移方法   总被引:1,自引:1,他引:0  
为了提高复杂地下介质的成像精度和偏移算法的计算效率,提出可高效对地下复杂构造进行准确成像的GPU加速叠前逆时偏移方法.该方法采用双程声波方程进行波场延拓,突破倾角限制,借助于高阶有限差分方法实现叠前逆时偏移成像;利用GPU(Graphic Processing Unit)并行加速技术对波场延拓和成像进行计算,相比于传统算法,其计算效率有较大提高,可以解决叠前逆时偏移算法计算量过大问题;在获取波场信息过程中,也采用随机边界条件,实施以计算换存储策略,解决逆时偏移计算中的海量存储问题.模型测试结果表明,该方法能够高效和高精度地对地下复杂地质体成像.  相似文献   

3.
基于GPU的HASM动态模拟与实时渲染方法   总被引:1,自引:0,他引:1  
 基于微分几何曲面论的高精度曲面模拟(high accuracy surface modeling, HASM)需要大量的复杂密集计算,在CPU上模拟极为耗时,使得在现有的硬件条件下,实时动态模拟曲面并实时可视化极具挑战性。论文提出了GPU加速的HASM方法,充分利用现代显示适配器(graphic processor unit, GPU)技术,运用GPU最新发展起来的并行计算能力,使用并行化的预处理共轭梯度方法解算曲面,完成曲面模拟,并同时利用GPU的高速缓存架构,对渲染操作进行充分优化,以实现高效实时可视化。HASM需要的有限差分离散和高速解算操作,均充分利用现代GPU架构,所具有的多处理器和众多的流处理器所产生的强大并行计算能力,可视化也用GPU高速缓存技术和三角条带方法进行充分优化。数值实验和实际项目区高程模拟实验均表明, 在GPU为NVIDIA quadro 2000和CPU为DualCore Intel Core 2 Duo E8400的硬件配置下,GPU并行化的曲面模拟方法比普通方法速度提高了约10倍,使得动态模拟与可视化算法可以达到交互式的帧速及实时可视化的要求。  相似文献   

4.
针对传统最小二乘法以及总体最小二乘法不完全适合于系数矩阵带有有界误差,及有界不确定性数据平差方法也不能直接用于系数矩阵只是部分带有有界误差的问题,基于有界误差问题的平差方法,给出解决部分有界问题的迭代算法,并验证该方法的有效性。  相似文献   

5.
本文探讨将图的可迁闭包算法,大型稀疏矩阵的优化压缩存储技术应用于布尔矩阵乘。并且根据两相乘布尔矩阵A,B的不同情况,提出不同的处理方法,得出了几个实用的处理布尔矩阵乘的较优算法,  相似文献   

6.
 采用预处理共轭梯度法(PCG)进行求解的高精度曲面建模(HASM)算法的计算过程需要大量矩阵计算,采用稀疏矩阵方式可以压缩存储空间。三元组稀疏矩阵存储是较为传统的稀疏矩阵存储结构,这种存储结构的稀疏矩阵技术已被广泛使用。根据HASM-PCG的特点,本文通过改进三元组稀疏矩阵的部分计算方式,调整HASM-PCG算法中的部分计算顺序,从而舍弃部分不需要存储的非零元素,提高了计算效率。根据全球1998-2008年的近3000个气象观测台站的气温观测数据,以及全球DEM数据,对20世纪末至21世纪初的11年来5、6、7、8月份的全球平均气温进行数字模拟。数值结果表明,采用改进的三元组稀疏矩阵技术有效地提高了HASM方法的模拟效率。  相似文献   

7.
Vatti算法是常用的矢量多边形裁剪算法之一,在其构建扫描束实现交点计算的过程中,二叉树的数据结构和递归计算方法导致其计算效率受矢量多边形边界顶点数量影响显著。本文针对Vatti算法执行过程中较为耗时的扫描束构建环节,提出了一种多边形边界顶点预排序的优化方法——VCS(Vertex Coordinate Pre-Sorting)方法,并基于该方法实现了对Vatti算法的GPU细粒度并行化。VCS方法使用双向链表对Vatti算法原有的二叉树数据结构进行了替换,以较小的额外存储空间取得了多边形边界顶点信息查找效率的明显提升。在GPU环境下采用双调排序算法对多边形边界顶点数组元素进行并行化排序并过滤出有效值,克服了原始算法使用二叉树存储导致效率低下的问题。实验结果表明,改进后的算法与原始算法相比,具有相同的计算精度;当多边形顶点数量为92万,CUDA每个线程块中的线程数量为32时,使用VCS优化方法,与采用CPU计算构建扫描束方法相比,GPU并行化方法获得了39.6倍的相对加速比,矢量多边形叠加分析算法效率总体上提升了4.9倍。  相似文献   

8.
在对基于GPU大规模地形数据快速绘制方法的研究基础上,针对GPU的批量绘制的特点,提出了改进的几何体实例化方法,把它用在全球格网的快速绘制上。把地形数据通过重新编码存储在高度图中,再结合Shader Model 3.0引入的顶点纹理拾取技术,在GPU中进行解码,得到原始的DEM数据,避免了在CPU上执行顶点缓存的更新。实验证明该算法充分利用了新一代GPU的特性,降低了CPU的负担,能达到实时绘制的要求。  相似文献   

9.
针对重力场解算过程中数据量巨大的问题,联合MPI(massage passing interface)与CUDA(compute unified device architecture)提出基于最小二乘法的重力场解算过程的并行加速算法。使用MPI完成复杂过程的任务分配,实现全局层面的并行加速;基于CUDA编写大规模矩阵相乘的并行加速程序,并针对不同类型的矩阵进行适配,同时联合MPI将法矩阵的计算过程进一步细分,实现对分进程内存峰值的压缩。在单机上完成30阶与120阶重力场仿真解算任务,结果表明,反演30阶重力场时加速比可达180;反演120阶重力场时,并行计算单次迭代仅耗时2 h,而串行模式下无法计算。  相似文献   

10.
传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求。特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换。值得欣慰的是新一代嵌入式处理器提供了支持GPGPU技术的GPU,为解决复杂的移动计算问题提供了高效的并行化解决途径。基于最新的ARM Cortex-A15内嵌GPU Mali-T604及Open CL框架设计实现了一种针对二维DCT变换的并行化加速方案并实测了优化效果,实验结果表明文中的并行方案能够提高二维DCT变换的效率,在输入数据量足够大的条件下能够达到近20倍的加速比。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号