cuda报告_cuda课程报告

2020-02-27 其他范文 下载本文

cuda报告由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“cuda课程报告”。

文本压缩并行化报告

综述

文本压缩技术是指,利用较少的位或字节来存储文本,从而大大节省计算机的存储空间,提高存储效率。随着当前信息社会的快速发展,大数据时代已经到来,而我们如何从海量数据中获取信息并将信息转化为有价值的资源成为我们所面临的问题。而各个互联网公司在大数据时代到来之际,首先需要面对的问题便是海量数据的存储,IT公司在实现对用户数据完整性与安全性存储的前提下为了追求利益的最大化必定要进行数据的压缩,从而来节省存储空间,节约成本。

当前在CPU上进行数据的压缩已经比较成熟,而利用并行技术进行文本压缩也已经成为人们探索的一个领域,但是还没有成熟的运用。本文尝试利用CUDA并行算法来对本文文件进行数据的压缩,从而比较看数据压缩与解码的性能是否有一定的提升,同时查找数据压缩并行化的瓶颈,对压缩性能进行进一步的优化。并行化思想:

通过对数据压缩算法的观察以及对相关并行实现的资料查找,我们经过讨论决定对编码过程中的词频统计和编码两个模块进行并行化。在这两个模块中,不同子模块之间相互没有依赖性,结果没有影响,具有并行可行性。同时,编码模块中在对Huffman树的查找过程中也比较耗时,因此决定对这两个模块进行并行化。

并行及串行实现流程与比较:

数据切分

为了实现数据的并行化,我们首先需要对数据进行切分,在切分过程中尽可能使各个子模块的大小均衡,从而使并行过程中的效率最大化。在切分过程我有两种切分方法:按行切分和按字符切分。此处我们使用按字符切分的方法。根据实际情况设置每个块大小为N,然后对整体数据进行切分,将数据存储在一个char*中,当数据量远远大于内存的承受能力时,我们只需进行多次重复操作即可。

在切分完成后我们同时需要将数据拷贝到global memory中,切分过程即完成。

《cuda报告.docx》
将本文的Word文档下载,方便收藏和打印
推荐度:
cuda报告
点击下载文档
相关专题 cuda课程报告 报告 cuda cuda课程报告 报告 cuda
[其他范文]相关推荐
    [其他范文]热门文章
      下载全文