《数据挖掘导论》读书报告_数据挖掘读书报告

2020-02-28 其他范文 下载本文

《数据挖掘导论》读书报告由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“数据挖掘读书报告”。

数据收集和数据存储技术的快速进步使得各组织机构可以积累海量数据。然而,提取有用的信息已经成为巨大的挑战。通常,由于数据量太大,无法使用传统的数据分析丁具和技术处理它们。有时,即使数据集相对较小,但由于数据本身具有一些非传统特点,也不能使用传统的方法处理。在另外一些情况下,面临的问题不能使用已有的数据分析技术来解决。这样,就需要开发新的方法。

数据挖掘是一种技术,它将传统的数据分析方法与处理大量数据的复杂算法相结合。数据挖掘为探査和分析新的数据类型以及用新方法分析旧有数据类型提供了令人振奋的机会。本章,我们概述数据挖掘,并列举本书所涵盖的关键主题。

数据挖掘技术可以用来支持广泛的商务智能应用,如顾客分析、定向营销、工作流管理、商店分布和欺诈检测等。数据挖掘还能帮助零售商回答一些重要的商务问题,如“谁是最有价值的顾客? ”“什么产品可以交叉销售或提升销售? ”“公司明年的收入前景如何? ”这些问题催生了一种新的数据分析技术。

医学、科学与工程医学、科学与工程技术界的研究者正在快速积累大量数据,这些数据对获得有价值的新发现至关重要。例如,为了更深入地理解地球的气候系统,NASA己经部署了一系列的地球轨道卫星,不停地收集地表、海洋和大气的全球观测数据。然而,由于这些数据的规模和时空特性,传统的方法常常不适合分析这些数据集。数据挖掘开发的技术可以帮助地球科学家回答如下问题:“千旱和飓风等生态系统扰动的频度和强度与全球变暖之间有何联系?”“海洋表面温度对地表降水量和温度有何影响?”“如何准确地预测一个地区的生长季节的开始和结束?”

什么是数据挖掘

数据挖掘是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘技术用来探査大型数据库,发现先前未知的有用模式。数据挖掘还可以预测未来观测结果,例如,预测一位新的顾客是否会在一家百货公司消费100美元以上。

并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎査找特定的Web页面,则是信息检索领域的任务。虽然这些任务非常重要,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,人们也在利用数据挖掘技术增强信息检索系统的能力。

数据挖掘与知识发现

数据挖掘是数据库中知识发现(knowledge discovery in database, KDD)不可缺少的一部分,而KDD是将未加工的数据转换为有用信息的整个过程。该过程包括一系列转换步骤,从数据的预处理到数据挖掘结果的后处理。输入数据可以以各种形式存储(平展文件、电子数据表或关系表),并且可以驻留在集中的数据存储库中,或分布在多个站点上。数据预处理(preproceing)的目的是将未加工的输入数据转换成适合分析的形式。数据预处理涉及的步骤包括融合来自多个数据源的数据,清洗数据以消除噪声和重复的观测值,选择与当前数据挖掘任务相关的记录和特征。由于收集和存储数据的 方式多种多样,数据预处理可能是整个知识发现过程中最费力、最耗时的步骤。

“结束循环”(dosing the loop)通常指将数据挖掘结果集成到决策支持系统的过程。

《《数据挖掘导论》读书报告.docx》
将本文的Word文档下载,方便收藏和打印
推荐度:
《数据挖掘导论》读书报告
点击下载文档
相关专题 数据挖掘读书报告 报告 导论 数据挖掘 数据挖掘读书报告 报告 导论 数据挖掘
[其他范文]相关推荐
    [其他范文]热门文章
      下载全文