目 录 1 引言................................................................ 1 http://www.paper51.com 2 数据挖掘的基本概念、过程............................................ 1 http://www.paper51.com
2.1 数据挖掘的概念................................................. 1 copyright paper51.com 2.2 数据挖掘过程................................................... 1 paper51.com 3 决策树方法......................................................... 2 http://www.paper51.com 3.1 决策树的基本概念............................................... 2 paper51.com 3.2 决策树的基本原理和步骤......................................... 2 内容来自论文无忧网 www.paper51.com 3.2.1 决策树的基本原理.......................................... 2 copyright paper51.com
3.2.2 建立决策树的步骤.......................................... 3 copyright paper51.com
3.3 数据挖掘软件................................................... 3 copyright paper51.com 4 案例分析............................................................ 4 内容来自论文无忧网 www.paper51.com 4.1 案例........................................................... 4 内容来自www.paper51.com 4.2 决策树方法在我国零售业中的应用意义............................. 7 copyright paper51.com 5 总结................................................................ 7 内容来自www.paper51.com 参考文献............................................................... 8 paper51.com 致 谢................................................................. 9 http://www.paper51.com 内容来自论文无忧网 www.paper51.com 1 引言 copyright paper51.com 随着我国加入WTO,零售业逐步开放,外资零售巨头纷纷加入我国零售业的竞争中,促使国内的零售业机构越来越多。在激烈的市场竞争中,推行客户忠诚度管理是零售企业获得新顾客留住老顾客,增强市场竞争力的重要途径。有效的客户忠诚度管理离不开客户数据分析,而数据挖掘则是进行客户数据分析的重要技术和方法。 paper51.com
本文基于数据挖掘的视角,采用决策树方法对零售企业的不同客户信息进行分析与处理,以帮助零售行业提高客户管理水平及制定相关政策提供有力依据。 内容来自www.paper51.com 2 数据挖掘的基本概念、过程2.1 数据挖掘的概念 http://www.paper51.com 数据挖掘(DataMining),又称为数据库中的知识发现(Knowledge Discovery in Database,KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程[1]。简单地说,数据挖掘就是从大量数据中提取或“挖掘”知识。它是一门涉及面很广的交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。数据挖掘有着非常广泛的应用:银行客户关系管理和风险管理的数据挖掘;生物医学和DNA数据分析的数据挖掘;金融数据的挖掘;零售业的数据挖掘;电信业的数据挖掘等。 http://www.paper51.com
2.2 数据挖掘过程 paper51.com
数据挖掘一般需要经历:确定业务对象、数据准备、数据挖掘、结果分析、知识的同化。[2] http://www.paper51.com
内容来自www.paper51.com
⑴确定业务对象:确定业务对象,清晰了解所存在业务问题,认清数据挖掘的目的。 paper51.com ⑵数据准备,包括数据的选择、数据的预处理、数据的转换。 http://www.paper51.com ①数据的选择:搜索相关业务数据信息,并从中选择出适用于数据挖掘应用的数据。 内容来自论文无忧网 www.paper51.com ②数据的预处理:指在主要的处理以前对数据进行的一些处理。研究数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型。 http://www.paper51.com ③数据的转换:将数据转换成一个针对于数据挖掘方法的分析模型。 copyright paper51.com
⑶数据挖掘:对经过转换所得到的数据进行挖掘。 http://www.paper51.com ⑷结果分析:对数据挖掘过程进行解释并评估结果,其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术。 copyright paper51.com ⑸知识的同化:也就是结果的应用,将分析所得到的数据集成到业务信息系统的组织结构中去。 paper51.com 3 决策树方法3.1 决策树的基本概念 copyright paper51.com
决策树(decision tree)又称判定树,是将决策过程各个阶段之间的结构绘制成一张树形图,适合描述问题处理中具有多个判断,而且每个决策与若干条件有关。它是根据逻辑关系将决策问题绘制成一个树型图,按照从树梢至树根的顺序,计算各节点的值,然后根据所得到的值准则进行决策的方法。决策树是数据挖掘中一种经常要用到的技术,常用的算法有CHAID、CART、Quest和C5.0等。 内容来自www.paper51.com 3.2 决策树的基本原理和步骤3.2.1 决策树的基本原理 paper51.com
使用决策树(判定树)进行描述时,应该从问题的文字描述中分清哪些是判定条件,哪些是判定的决策,根据描述材料中的联结词找出判定条件的从属关系、并列关系、选择关系,根据它们构造判定树。对于判定树的描述,我们可以通过图3.1来进行解释说明。 copyright paper51.com paper51.com |