西安交通大学数据挖掘作业1_西安交通大学作业

2020-02-28 其他范文 下载本文

西安交通大学数据挖掘作业1由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“西安交通大学作业”。

数据挖掘第一周作业

计算机15班

高君宇

2110505112 第一章

1.给出一个例子,其中数据挖掘对于商务的成功是至关重要的。该商务需要什么数据挖掘功能?它们能够由数据查询处理或简单的统计分析来实现吗?

答:案例:DHL获得成功

DHL是国际快递和物流行业的全球市场领先者,它提供快递、水陆空三路运输、合同物流解决方案,以及国际邮件服务。DHL的国际网络将超过220个国家及地区联系起来,员工总数超过28.5万人。在美国 FDA 要求确保运送过程中药品装运的温度达标这一压力之下,DHL的医药客户强烈要求提供更可靠且更实惠的选择。这就要求DHL在递送的各个阶段都要实时跟踪集装箱的温度。

虽然由记录器方法生成的信息准确无误,但是无法实时传递数据,客户和DHL都无法在发生温度偏差时采取任何预防和纠正措施。因此,DHL的母公司德国邮政世界网(DPWN)通过技术与创新管理(TIM)集团明确拟定了一个计划,准备使用RFID技术在不同时间点全程跟踪装运的温度。通过IBM全球企业咨询服务部绘制决定服务的关键功能参数的流程框架。DHL获得了两方面的收益:对于最终客户来说,能够使医药客户对运送过程中出现的装运问题提前做出响应,并以引人注目的低成本全面切实地增强了运送可靠性。对于DHL来说,提高了客户满意度和忠实度;为保持竞争差异奠定坚实的基础;并成为重要的新的收入增长来源。

2)应用了关联规则挖掘和分类挖掘。

3)用于数据或信息检索的数据查询处理不具有发现关联规则能力,也不具有数据分类挖掘的功能。简单的统计分析不能处理大数据,更不能根据对大数据做出科学合理的决策。

2.使用你熟悉的生活中的数据库,给出关联规则挖掘、序列模式分析、分类、聚类、孤立点分析等数据挖掘功能的例子。答:

① 关联规则挖掘:买面包的人有可能会买牛奶,超市近距离放置两种商品。② 序列模式分析:购买汽车的人,有可能近期会购置汽车配件,如座椅垫等。

③ 分类数据挖掘:使用Bayes模型,每次在制定生产计划,确定生产产品所用的配方、机器及工人,预测生产中有多少的一等品、二等品和次品。④ 聚类数据挖掘:对全国31个地区农村居民人均年食品消费量的聚类分析

⑤ 孤立点分析的例子:税务稽查机关在选案的过程中,先从数据仓库中根据企业的规模、行业、地区等维度查找出若干企业,将这些数据再用数据挖掘软件查找纳税额明显偏低的企业,可以将这些企业作为有逃税嫌疑的企业进行稽查 3.与挖掘少量数据相比,挖掘海量数据的挑战有哪些? 答:1)规模大 高效算法, 并行处理 2)高维特性

导致搜索空间指数级的增长,维度约减 3)过拟合因过分强调对训练样本的效果导致过度拟合,使得对未知预测样本效果就会变差 4)动态、缺失、噪音数据 5)领域知识的运用 6)模式的可理解性

第二章

(a).若手动计算,其公式可参照ppt,下面用matlab编程实现: ave_age =46.4444 ave_pf =28.7833 med_age =51 med_pf =30.7000 std_age =13.2186 std_pf =9.2544(b).(c)

源代码如下:

age=[23,23,27,27,39,41,47,49,50,52,54,54,56,57,58,58,60,61];percent_fat=[9.5,26.5,7.8,17.8,31.4,25.9,27.4,27.2,31.2,34.6,42.5,28.8,33.4,30.2,34.1,32.9,41.2,35.7];

ave_age = mean(age)ave_pf = mean(percent_fat)

med_age = median(age)med_pf = median(percent_fat)

std_age = std(age)std_pf = std(percent_fat)

boxplot(age);title('age盒图');figure;boxplot(percent_fat);title('%fat盒图');figure;scatter(age,percent_fat);title('age%fat分位数-分位数图')

数据挖掘

第4章 无监督学习4.1基本概念图4.1数据点的三个自然4.2k-均值聚类4.2.1k-均值算法图4.2k-均值算法计算机组成原理(第三版)图4.3k-均值算法的运行实例4.2.2k-均值算法的硬盘......

数据仓库与数据挖掘第一次作业

数据仓库与数据挖掘第一次作业电子商务这一行业目前还处于摸索期,有很多需要完善和可以创新的地方。这学期选修了袁老师的《电子商务》,印象最深的就是老师提过这样的想法:电商......

西安交通大学

(西安交通大学)创新产学研合作模式 提升高校社会服务能力努力为创新型国家建设和省部合作做贡献来源: 西安交通大学2007-06-20新世纪召开的全国科技大会,党中央、国务院做出了......

西安交通大学

西安交通大学西安交通大学是国家教育部直属重点大学,为我国最早兴办的高等学府之一。其前身是1896年创建于上海的南洋公学,1921年改称交通大学,1956年国务院决定交通大学内迁西......

西安交通大学

西安交通大学 学校简介西安交通大学是国家教育部直属重点大学,为我国最早兴办的高等学府之一。其前身是1896年创建于上海的南洋公学,1921年改称交通大学,1956年国务院决定交通......

《西安交通大学数据挖掘作业1.docx》
将本文的Word文档下载,方便收藏和打印
推荐度:
西安交通大学数据挖掘作业1
点击下载文档
相关专题 西安交通大学作业 作业 西安交通大学 数据挖掘 西安交通大学作业 作业 西安交通大学 数据挖掘
[其他范文]相关推荐
[其他范文]热门文章
下载全文