目 录 引言... 1 copyright paper51.com 一、数据挖掘的概念和过程... 1 内容来自论文无忧网 www.paper51.com 1.1 数据挖掘的概念... 1 http://www.paper51.com 1.2 数据挖掘的常用工具... 1 内容来自论文无忧网 www.paper51.com 1.3 数据挖掘的过程... 1 paper51.com 二、数据仓库的概念与系统的特点... 2 内容来自论文无忧网 www.paper51.com 2.1 数据仓库的概念... 2 内容来自www.paper51.com
2.2 数据仓库的系统特点... 2 内容来自论文无忧网 www.paper51.com 2.3 电信行业数据仓库的构建历程... 3 http://www.paper51.com
三、客户关系管理... 3 内容来自www.paper51.com
3.1 客户关系管理的概念... 3 内容来自论文无忧网 www.paper51.com 3.2 客户关系管理的基本构成... 4 http://www.paper51.com
3.2.1 销售管理... 4 内容来自www.paper51.com 3.2.2 市场管理... 4 内容来自www.paper51.com 3.2.3 客户服务... 4 paper51.com 3.2.4 技术支持... 5 内容来自www.paper51.com 四、 数据挖掘在电信CRM中的运用... 5 内容来自论文无忧网 www.paper51.com 4.1 客户消费模式分析... 5 paper51.com 4.2 客户信誉度分析和动态防欺诈... 5 copyright paper51.com 4.3 客户市场推广分析... 5 内容来自www.paper51.com 4.4 客户流失分析... 5 paper51.com 4.5 呼叫数据分析... 6 内容来自www.paper51.com
五、数据挖掘应用实例分析... 6 copyright paper51.com 六、总结... 11 http://www.paper51.com 参考文献 http://www.paper51.com 致谢 内容来自www.paper51.com 引言 copyright paper51.com 从2000年开始,随着电信行业垄断的格局被打破,国内电信运营商间的竞争也越来越激烈,而网络服务质量方面的差别也在逐渐减少,单纯的价格战将对竞争的双方造成损失。因此电信企业都在寻求改善服务质量、提高市场竞争力的方法。面对这种越来越激烈的资费竞争,中国电信面临着前所未有的考验,机遇与挑战并存。电信运营商如何运用现有的客户关系管理系统积累的海量客户数据资源,利用先进的数据挖掘技术,充分挖掘客户需求,提高业务营销、客户服务水平,提高企业核心竞争力,已经成为电信企业进一步发展的焦点问题。所以电信企业信息化建设需要跨越各个业务运营系统,建立综合的信息资源平台,利用数据仓库技术和数据挖掘技术,以及CRM( 客户关系管理) 的管理方式,深层次地挖掘、分析当前和历史的生产业务数据以及相关环境数据,才能自动快速获取其中有用的决策信息,为企业提供快速、准确和便捷的决策支持,从而产生经济效益。 paper51.com 一、数据挖掘的概念和过程 http://www.paper51.com
1.1 数据挖掘的概念 paper51.com
数据挖掘就是从大量的、不完全的、有噪声的、模糊的和随机的原始数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程[1]。它可以从大型数据库或数据仓库中提取隐藏的预测性信息;它能发掘出潜在的模式,找出最有价值的信息,指导商业行为或决策。简单的说,数据挖掘就是从大量的数据中提取或“挖掘”有用的知识,而在电信行业,数据挖掘就是从大量的客户数据、业务数据中提取出对电信业务发展有用的数据,并进行归类处理。 copyright paper51.com 1.2 数据挖掘的常用工具 内容来自论文无忧网 www.paper51.com 数据挖掘工具可以划分为专用数据挖掘工具和通用数据挖掘工具两类:专用数据挖掘工具是针对某个特定领域的问题提供解决方案,在涉及算法的时候充分考虑数据、需求的特殊性,并作优化。例如,芬兰赫尔辛基大学所研制的TASA,能够采用特殊算法处理网络通信中的数据对网络通信故障发出警报;而通用数据挖掘工具不区分具体数据的含义,采用通用的数据挖掘算法,处理常见的数据类型[2]。例如,SPSS公司的统计软件包SPSS在统计领域处于的地位,其中的线形回归分析结果和类似的数据挖掘工具对数据挖掘的结果是一致的,而这些数据挖掘工具采用的是传统统计方法[3]。Redbrick系统公司的Red Brick数据挖掘工具是第一个将数据挖掘解决方案与数据库集成在一起的数据挖掘软件。与数据库的联结,减少了传统数据挖掘中需要的大量数据准备时间,并提供扩展的SQL语言。 内容来自论文无忧网 www.paper51.com 一个好的数据挖掘工具应该为每个步骤提供相应的功能集合,并能够方便的导出挖掘模型;除此之外,还应该能够处理尽可能大的数据量、尽可能多的数据类型。在尽可能的保证数据处理的有效性之余,还应尽可能提高数据处理效率。 内容来自www.paper51.com 1.3 数据挖掘的过程 内容来自论文无忧网 www.paper51.com 数据挖掘的过程是一个循环往复的过程,正如淘金者淘金不断的重复着矿石的搜寻准备,分析矿石含金程度、从中挖掘提取出黄金一样,数据挖掘通常涉及数据准备、建立模型、评估和解释模型、运用和巩固模型等循环的步骤。 copyright paper51.com (1) 数据准备:数据准备是我们进行数据挖掘过程的第一步,实际上就是对业务内相关数据的准备工作,选择相关和合适的业务、客户数据在数据挖掘中是至关重要的,如果数据选择错误将会导致往后步骤的失败;在选择好数据之后应对所选数据进行分析,了解数据分布情况和异常数据等情况并进行预处理。 http://www.paper51.com
(2)建立模型:在这里需要运用到数据挖掘工具以及数据挖掘的算法,应用于准备好的数据,选取相应参数,生成模型。 内容来自www.paper51.com (3)评估和解释模型:这里是对数据挖掘过程中所产生的模型进行比较和评估,是数据挖掘过程中的一个优化步骤。评估和解释模型的意义重在生成一个相对最优模型,并对此模型用业务语言加以解释,易于用户的理解。 paper51.com (4)运用和巩固模型:运用和巩固模型可以说是数据挖掘工具的尾声部分,与其他运用软件一样,我们在模型建立后依然需要对其进行观察,了解其运作情况以及是否满足预期的要求。如果模型表现不好、未能达到预期的要求,则对模型作进一步的考察和修正(即重复以上3个步骤),以反映业务运作规律的变化。 paper51.com 二、数据仓库的概念与系统的特点 内容来自论文无忧网 www.paper51.com 2.1 数据仓库的概念 内容来自论文无忧网 www.paper51.com 在信息世界浩瀚的数据海洋中,为了便于获得决策所需要的信息,就有必要将整个企业的数据,不管其地理位置、格式和通信要求统统集成在一起,并能把当前使用的业务信息分离出来,以统一的形式集成存储在一起,形成一个一个面向主题的、具有集成性和相对稳定性、随时间变化的、非易失的数据集合,用于支持管理决策,这就是数据仓库。 http://www.paper51.com 2.2 数据仓库的系统特点 http://www.paper51.com 数据仓库的特点可以从数据仓库的定义来理解。目前数据仓库的定义是不统一的。公认的数据仓库之父W.Hinmon将其定义为:“数据仓库是支持管理决策过程的、面向主题的、集成的、随时间而变的、持久的数据集合[4]。”他指出了数据仓库面向主题、集成、稳定和随时间变化这4个最重要的特征。 http://www.paper51.com (1) 面向主题性:不同类型的公司其主题集合是不同的。对一个电信行业来说,应用问题可能是电信产品、产品质保,电信公司的主题域却可能是顾客与保修单。而对于一个生产商来说,主要主题域可能是产品、定单、销售商、材料单与原货物。如表1所示。 内容来自论文无忧网 www.paper51.com (2) 集成性:在所有数据仓库的特性中,集成性是最重要的。数据仓库中的数据是从多个不同的数据源传送来的。当这些数据进入数据仓库时就需对这些原有分散的数据库数据抽取、清理,经过系统的加工、汇总和整理。消除原数据中的不一致性,保证数据仓库内的信息是关于整个电信行业一致的全局信息。比如在客户主题中,业务数据库的设计中有的字段名属性值设为1,0,有的设置为X,Y,但进入分析数据库时必须使用同一字段的命名和格式,在这里使用m,f。如图1所示。 内容来自www.paper51.com 表1 电信企业数据面向主题 内容来自www.paper51.com 操作型环境 内容来自论文无忧网 www.paper51.com 数据仓库 paper51.com
电信产品 copyright paper51.com 顾客 http://www.paper51.com
产品质保 内容来自论文无忧网 www.paper51.com 保修单 copyright paper51.com
应用 paper51.com
主题 内容来自www.paper51.com
操作型环境 编码 数据仓库 内容来自www.paper51.com 应用A m,f m,f 内容来自www.paper51.com 应用B 1,0 内容来自www.paper51.com
应用C x,y copyright paper51.com
应用D 男,女 http://www.paper51.com
paper51.com
图1 数据仓库的集成性 内容来自www.paper51.com
(3) 非易失性:操作型环境中的数据通常是每时每刻都在更新的,数据根据需要会及时发生变化。数据仓库的数据主要是供行业内决策分析时使用,通常数据进入数据仓库后很少做任何的删除、修改,一般情况下将做长期的保留。而行业内所涉及的操作主要也就是信息的查询,只需在一段时间内加载和更新即可。 copyright paper51.com
(4) 随时间变化性:操作型数据库主要关心的是当前某一个时间(Tn)内的数据,而数据仓库中的数据通常包含了历史信息,系统的记录了企业从过去某一时点(例如开始运用数据仓库的时点)到目前的各个阶段的信息,也就是说,数据仓库记录了系统的各个瞬间,并通过将各个瞬态连接起来形成动画,从而在数据分析的时候再现系统运动的全过程。如图2所示。通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。 paper51.com
内容来自www.paper51.com |