数据挖掘技术在图书采购中的应用初探.专题_数据挖掘技术及应用
数据挖掘技术在图书采购中的应用初探.专题由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“数据挖掘技术及应用”。
数据挖掘技术在图书采购中的应用初探 湖南理工学院图书馆 张 晖
[摘 要]数据挖掘是一种新的信息技术,在许多行业有着广泛的应用。高校图书馆同样可以成为其应用的一个领域。在图书采购中,可以应用数据挖掘技术来提高采购的效率和针对性。
[关键词]数据挖掘 高校图书馆 图书采购
计算机网络与数据库技术的发展和广泛应用,信息日益成为企业的一种重要资源,人们利用信息技术生产和搜集数据的能力大幅度提高,在这些数据背后隐藏着极为重要的商业知识,但是这些商业知识是隐含的、事先未知的。面对“人们被数据淹没,人们却饥饿于知识”的挑战,数据挖掘技术应运而生,越来越显示出其强大的生命力。
1数据挖掘技术概述
数据挖掘(D ata M in ing是一种新的信息处理技术,其主要特点是对单位、企业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,以从中提取辅助管理决策的关键性数据。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。常用的数据挖掘技术主要有以下几种: 1.1人工神经网络
仿照生理神经网络结构的非线性预测模型,主要由“神经元”的互联,或按层组织的节点构成,通常由输入层、中间层和输出层三个层次组成,在每个神经元求得输入值后,再汇总计算输入值;由过滤机制比较输入值,确定网络的输出值。
1.2决策树
决策树是一个类似流程图的树型结构,其中每个内部节点表示在一个属性上的测试,每个分枝代表1个测试输出,而每个树叶点代表类或类分布。树的最顶层节点是根节点。目前,在数据挖掘中使用的决策树方法有多种,典型的在国际上影响较大的决策树方法是Q n in lan研制的I D3算法。
1.3遗传算法
遗传算法是模拟生物进化过程的计算模型,是自然遗传学与计算机科学相互结合渗透的计算方法。遗传分析应用搜索技术,先找出两个合适的父样本,通过“交叉”“变异”等带有生物遗传特点的操作产生下一代样本,对子样本反复“交叉”“变异”操作直到子样本收敛为此,再找另外两个合适的父样本重复上述过程,就能得到下一代的样本集。由此得到当前样本集较可能的发展方向。
1.4近邻算法
用该方法进行预测的基本概念就是相互之间“接近”的对象具有相似的预测值。如果知道其中一个对象的预测值后,可以预测其最近的邻居对象。
1.5规则推导
根据统计意义上对数据中的规则“如果条件怎么样、怎么样,那么结果或情况就怎么样”,对给定的一组项目和一个记录集合,通过分析记录集合,推导出项目间的相关性。
1.6聚类方法
聚类分析方法按一定的距离或相似性测度将数据分成系列相互区分的组,它是不需要预定义知识而直接发现一些有意义的结构与模式。可采用拓扑结构分析、空间缓冲区及距离分析、覆盖分析等方法,旨在发现目标在空间上的相连、相邻和共生等关联关系。
1.7可视化技术
可视化技术在数据挖掘过程中的数据准备阶段是非常重要的,它能够帮助人们进行快速直观地分析数据。利用可视化方法,很容易找到数据之间可能存在的模式、关系和异常情况等。
2高校图书馆可以成为数据挖掘技术的应用领域
目前,在很多领域,数据挖掘都是一个很时髦的词,尤其是在银行、电信、保险、交通、零售(如超级市场等商业领域。同样,数据挖掘技术在高校图书馆中的应用,将为图书馆在数字资源的组织和管理、服务质量的提升和服务方式的拓展等方面提供技术支持,并显示出强大的生命力。高校图书馆可以成为数据挖掘技术的应用领域,理由如下: 2.1高校图书馆管理的需要
在信息化社会中,图书馆的生存与发展和先进技术的运用是密不可分的。目前,高校图书馆利用的信息管理系统可以高效地实现传统图书馆信息管理中的数据的录入、查询、统计、流通借阅等功能,相对于从前的手工加工管理时代,可以说是一次飞跃,但图书情报部门的工作仍然主要是对信息的载体进行管理,以提供信息的外在特征服务为主,无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。高校图书馆作为学术性、科研性、服务性机构,在高等教育中承担着重要角色,特别是在向数字化图书馆转型过程中,迫切需要应用分类、回归分析、聚类、关联规则、特征、变化和偏差分析、W eb网页挖掘等技术手段对信息进行深加工,以推动图书馆业务与管理的全面进步。运用数据挖掘技术,实现海量数据的存储和利用,支持图书馆各种层次的科学决策,促进图书馆管理的发展。
2.2图书馆物质基础的形成在现代科学技术推动下,高校图书馆正朝着自动化、数字化和信息化的方向发展。一方面,我国的图书馆系统经过多年的自动化建设,已具备相当的物质条件和人才储备,并积累了大量数据,为数据挖掘应用奠定了一定的物质基础。另一方面,图书
馆的数字化发展是我国信息化建设的重要组成部分,国家对此给予了高度的重视并提供了大量政策上和经济上的支持,为行业
— 8 5 1 —
性数据挖掘的实施提供了良好的政策环境和经济保障。2.3实现技术的成熟
数据挖掘在经过多年的发展之后已经形成相对成熟的技术体系,特别是在数据挖掘设计、数据抽取以及联机分析处理技术等方面都取得了令人满意的进展,为数据挖掘的应用奠定了技术基础。另外,数据挖掘技术在发达国家的电信、制造、零售、金融等领域已有较深程度的应用,并取得了巨大的回报,这些成功应用的例子为我们提供了可资借鉴的宝贵经验。
3应用数据挖掘技术开展图书采购工作
目前,国际上已经将图书馆的信息服务纳入了电子商务之中,数据挖掘技术不仅在商业界倍受青睐,它在现代化图书馆中的应用前景也十分广阔,而图书采购则是数据挖掘技术在高校图书馆应用中的一个典型领域。基于数据挖掘技术的图书采购策略的基本思路是:利用计算机图书管理数据库积累的图书借阅流通资料,利用数据挖掘技术得到读者借阅频率较高的图书类型的关键词、出版社、编著者信息,考虑缺书比例较大的图书,依此决定采购策略。
3.1读者信息资源的收集
采访部门职能发挥的好坏关系到图书馆资金及资源利用率的高低,如何采购高质量的书刊是图书馆工作的重中之重。因此,准确地定位读者对象的需求就成为提高资源利用率的一个主要因素。根据流通数据库的集成数据进行数据挖掘,能够得到读者对图书资源的使用频率表,对读者进行分类的同时对适合不同类别的读者的图书资源进行聚类,可以快速而精确地得到订书单。通过收集整理图书馆网站上的在线调查、留言簿等数据,或是设计读者调查表,包括读者的基本情况、阅读兴趣、查阅资料的途径及对国内外文献资源的需求情况等,将这些元数据转化为标准的结构化数据库,利用数据挖掘方法分析读者行为倾向,发现用户兴趣模式,就能动态的调整采购策略,有针对性地应对需求。
3.2确定采购的重点
图书馆每年的文献购置费是有限的,各门学科之间如何分配、各种文献载体形式如何均衡才能使这些经费最好地发挥效益,这是一件令人头疼的事。随着出版物的数量日益增多,载体日益丰富,高校图书馆信息结构、读者需求与资金利用的平衡问题越来越不易把握,也令采购工作的决策变得更加复杂。数据挖掘技术可以对流通数据库和采访数据库中的历史记录数据进行关联性分析和序列分析,可以轻松地统计出文献的拒借集合和频繁借阅集合,科学分析各类文献的利用率,为采购文献提供科学合理的各种分析报告及预测信息,从而指导采访人员对文献种类进行科学地筛选,合理地确定各种文献所需的复本量,及时补充短缺的文献,剔除过时的文献,帮助采购人员确定采购重点,保障图书馆信息资源体系的科学性和合理性。
3.3订购渠道的管理
图书订购是图书馆采访部门的主要工作,它是图书馆工作链的开端,也是现代化图书馆资源建设的开始。传统图书馆的订购信息大多来源于出版社和书商,信息量有限,这样会导致重复订购和馆藏资源不足的矛盾现象出现。随着信息技术的发展,图书订购渠道已呈现多样化,包括专家订书、光盘检索、电子文献、借阅数据库查询等。通过数据挖掘技术可以为图书采购提供科学的、合理的分析和预测,从而实
现订购渠道的管理,选择合适的订购渠道,为图书馆节省可贵的经费,买到最适用的图书。
3.4确定图书的学科比例
图书馆要全面兼顾不同类型的读者,考虑各个学科内容的完整搭配组合。即使最近一段时间武侠小说非常流行,也不能全部只购买武侠小说。大学的图书馆必须结合学校的专业设置,为各个专业的教学科研配备参考书,不能顾此失彼。应当结合馆藏图书的学科专业分布、发展趋势以及现有藏书量,控制不同学科的图书占总采购金额的比例。对于馆藏数量少,而根据发展趋势急需加强的学科需要扩大比例。通过流通、采访系统数据进行如关联性分析、序列分析等挖掘方法得到的结果,可以分析出文献的利用率,及时补充短缺的文献,剔除过时的文献信息,为采购文献提供科学合理的各种分析报告及预测信息,指导采访人员对购书的种类、所需复本数量等进行科学的筛选,优化馆藏结构,合理确定各学科的图书比例。
3.5采购经费的管理
传统图书馆信息采集多由专门采访人员独自确定或与少数专家商讨决定,不可避免的带有极大的主观性以及个人喜好;而且图书馆每年的文献购置费是有限的,各门学科之间如何分配,各种文献载体形式如何均衡才能使这些经费最好地发挥效益,这是一件令人头疼的事。而运用数据挖掘技术可以通过对图书馆的借阅流通记录、检索请求进行分析、挖掘,有针对性的补充和丰富信息资源,并可以籍此分析出文献的利用率,从而实现采购经费的合理管理,区分轻重缓急,“好钢用在刀刃上”。
参考文献
[1]王向辉等.数据挖掘技术及其在决策支持系统中的应用[J]计算技术与自动化,2004(4 [2]陈瑞雪.数据仓储与数据挖掘技术在现代化图书馆中的应用[J].图书馆学研究,2004(11
[3]张存禄等.数据挖掘在图书采购中的应用[J].情报科学,2004(5 [4]刘晓东.数据挖掘在图书馆工作中的应用[J].情报杂志,2005(8 [5]鲍翠梅等.数据挖掘技术及其在图书馆中的应用[J].情报杂志,2004(9 — 9 5 1 —
数据挖掘技术在软件开发信息管理中的应用论文文章通过介绍数据挖掘技术概述,分析软件开发信息管理数据挖掘面临的挑战,对数据挖掘技术在软件开发信息管理中的应用展开探讨,旨在......
数据挖掘技术在科技期刊网站中的应用论文随着互联网技术的快速发展,学术研究环境较以前更加开放,对传统的科技出版业提出了开放性、互动性和快速性的要求; 因此,以信息技术为基......
刀豆文库小编为你整合推荐3篇数据挖掘技术在软件开发信息管理中的应用论文,也许这些就是您需要的文章,但愿刀豆文库能带给您一些学习、工作上的帮助。......
数据挖掘技术在客户关系管理中如何应用根据波特的影响企业的利益相关者理论,企业有五个利益相关者,分别是客户、竞争对手、供应商、分销商和政府等其他利益相关者。其中,最......
刀豆文库小编为你整合推荐3篇网络营销中数据挖掘技术的应用论文,也许这些就是您需要的文章,但愿刀豆文库能带给您一些学习、工作上的帮助。......
