基于数据挖掘的物流信息系统研究
更新时间:2020-08-11 15:35:01
摘要随着现代科学技术尤其是因特网的发展,人类积累的数据量正以前所未有的速度增长。物流业和其他行业一样,信息化的物流网
0 引言
现代物流系统是一个复杂的系统,包括运输、仓储、配送、搬运、包装和物流再加工等诸多环节,信息流量十分巨大。巨大的数据流,使得企业很难对这些数据进行准确、高效的收集和及时处理,因此决策者也就很难做出快速、准确地决策,实现对物流过程的控制,降低整个过程的物流成本。随着知识经济和现代信息技术的迅猛发展,信息技术特别是网络技术的发展,为物流发展提供了强有力的支撑。物流管理信息系统是企业信息系统和企业信息化的基础,能够利用信息技术对物流中的各种信息进行实时、集中、统一管理。
1 数据挖掘技术
1.1 数据挖掘 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的、数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它从已知数据集合中发现各种模型、概要和导出值。数据挖掘不是统计学、机器学习以及其他方法和工具的随意应用,它不是在分析技术空间里面乱闯,而是一个精心策划和深思熟虑过的,决定什么才是最有用的、最有前景的和最有启迪作用的一个过程,是知识发现的关键步骤。
数据挖掘的对象根据信息存储格式分类有关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库、空间数据库、时态数据库、异质数据库以及Internet等。
数据挖掘的主要技术有集合论法、决策树法、遗传算法、神经网络方法等。集合论法又分为粗(糙)集理论方法、概念树方法、覆盖正例排斥反例方法等。决策树法又分为ID3算法、CLS算法、IBLE算法等。遗传算法又分为分布并行遗传算法、进化算法等。
1.2 数据挖掘的流程
1.2.1 确定业务对象 清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的。
1.2.2 数据准备 ①数据的选择:搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。②数据的预处理:研究数据的质量,为进一步的分析作准备,并确定将要进行的挖掘操作的类型。③数据转换:讲数据转换成一个分析模型。这个分析模型是针对挖掘算法建立的,建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。
1.2.3 数据挖掘 对所得到的经过转换的数据进行挖掘,除了完善从选择合适的挖掘算法外,其余一切工作都能自动地完成。
1.2.4 结果分析 解释并评估结果。其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术。
1.2.5 将分析所得到的知识集成到业务信息系统的组织结构中去。
2 数据挖掘在物流信息系统中的应用
随着集成化物流管理信息系统的建立,以及网络技术、EDI、人工智能、条形码与POS等各种先进技术的应用,物流信息的商品化、物流信息收集的数据库化和代码、物流信息处理的电子化和计算机化,把挖掘到的规则与物流管理各方面有机地结合,就能极大地提高企业的竞争力。物流决策系统是一种结合了数据挖掘技术和人工智能的新型经营决策系统,主要通过人工智能对原料采购、加工生产、分销配送到商品销售的各个环节的大量信息进行采集,并利用数据仓库和数据挖掘技术对其进行分析处理,并据此确定相应的经营策略。
2.1 数据仓库的建立 深圳到梧州物流数据仓库作为数据挖掘的基础,不同于传统的联机事务处理系统,它具有面向主题的、集成的、不可更新以及随时间变化的特性。各个联机事务处理系统作为数据仓库的原始数据源,以文件方式提供企业在日常活动中收集的包括定货单、存货单、应付账、交易条款、客户情况等在内的大量数据资料和报表,同时还有大量的外部信息等数据。数据仓库通过ETL过程( 抽取、转换和加载)处理这些接口文件,并且按不同的主题域组织、存储和管理这些客户数据。通过数据仓库接口,对数据仓库中的数据进行联机分析和数据挖掘。在建立完成企业级的信息数据仓库之后,可以基于这个数据仓库平台进行数据挖掘工作。
2.2 基于数据挖掘的物流信息系统的体系结构 基于数据挖掘的物流信息的体系结构主要由以下几部分组成:
2.2.1 物流信息收集与处理:记录物流管理活动中的各类信息,对物流活动的各种信息进行采集、处理、传输,并按照统一的格式存入到数据仓库。
2.2.2 数据挖掘的物流信息管理系统:把收集得到的数据汇总到数据仓库,再根据数据挖掘送来的数据,为管理决策人员提供最新的和最有价值的信息或知识,帮助其快速、正确地做出决策。
2.2.3 数据挖掘:根据决策者提出的问题特点,确定挖掘的任务或目的,对数据仓库中的相关数据进行精简和预处理,再从精简后的数据中挖掘出新的、有效的新知识,提供给数据挖掘的物流信息管理系统,由它给决策者提供有效的知识。
2.2.4 知识库:包括基于部门的数据仓库的组成结构、隶属函数等知识。
汕头到资阳物流2.2.5 开发人员和专家接口:开发人员和专家通过这个接口对知识库中的知识进行定义和维护。
2.深圳到延安物流3 基于数据挖掘的物流信息系统的的功能模块 数据挖掘物流信息的体系结构主要由以下几部分组成:
2.3.1 采购进货管理系统 采购进货管理系统是数据挖掘物流信息体系的重要组成部分,是物流管理的起始阶段,包括向厂商发出订购信息、接收厂商的发货、采购决策、存货控制、采购价格管理等信息管理子系统。在对采购进货管理系统进行数据挖掘时应主要采用基本统计分析方法,依据现有样本的数量接受厂商的发货,依据样本价格估计总体价格。
2.3.2 销货出货管理系统 销货出货管理系统主要负责对客户的需求类型及爱好进行收集、整理,记录好客户的购买情况以及各种类型的销售情况,确定好合理的销售价格,处理好应收货款及退款等。回归分析在销货出货管理系统中应用的最为广泛,分析客户的需求及爱好,根据客户的购买情况确立销货出货与收货款及退款的关系,确立回归方程,利用回归方程对相关内容进行分析。
2.3.3 库存储位管理系统 库存储位管理系统包括储存货管理、进货订货管理等功能子系统,根据货存情况及时作出决策,保证货品的供应量以及流通加工的顺利进行。
2.3.4 财务管理系统 财务管理系统主要功能是对采货、进货以及销售管理所形成的应付、应收账进行会计操作,对整个物流中心的资金进行平衡、测算和分析,编制财务报表,做好银行转账工作,保证资金周转以及整个物流管理顺利进行。
2.3.5 运输配送管理系统 运输配送管理系统主要包括出货配送管理、运输调度计划、分配计划等功能子系统。
2.3.6 物流分析系统 其主要功能是应用相关技术对整个物流运作模式进行分析,完善物流运输方案。
2.3.7 物流决策支持系统 物流决策支持系统的功能主要是在深入了解内部各系统业务信息和外部信息的基础上编制各种报告,提供分析图表。通过建立决策支持系统,及时地了解和掌握商流、物流、资金流和信息流所产生的信息,综合运用数据挖掘工具对历史数据从多角度、多方位进行分析,实现对物流中心的资源的综合管理。物流决策支持系统应综合利用相关分析与时间序列分析两种方法,根据内部信息和外部信息综合分析物流的运作情况,对物流运作的历史数据进行全面分析,根据过去预测未来,实现物流的顺畅运作。
3 关键技术分析
基于数据挖掘的物流管理信息系统的关键技术主要包括数据仓库、数据挖掘、数据分析工具等。
3.1 数据仓库技术。数据仓库是来自多个源的数据的存储库,它可通过Internet将不同的数据库连接起来,并将数据全部或部分复制到一个数据存储中心。数据仓库倾向于一个逻辑的概念,它建立在一定数量的数据库之上,这些数据库在物理上是可以分开的。数据仓库通过Internet打破地域界限,将它们合成一个逻辑整体,把一个海量的数据库展现在用户面前。数据仓库管理系统的一项重要工作是实现对传统数据库进行提取、清理和转载到数据仓库中。
3.2 数据挖掘技术。这是整个系统的难点和重点,主要涉及模式模型和挖掘算法。目前,己形成了多种数据挖掘方法,如分类知识发现、数据总结、数据聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常发现、趋势预测等。各种方法均有它一定的优点,也有它的不足。几种技术并不是单一的使用,而是根据实际情况综合的加以应用。现在一些流行的数据挖掘工具一般都包括了几种方法。
3.3 数据分析工具。数据仓库虽然存有大量数据,但提供辅助决策的信息需要利用各种分析工具,如联机分析处理(OLAP)工具、统计分析和查询优化工具等。这些工具的性能对管理决策的效果有着重要的影响。目前已出现具有智能功能的强大的数据分析工具,这些分析工具不仅能在系统运行时采集和处理数据,同时也支持对其他业务系统的数据进行采集。