一、数据仓库系统的构建及应用研究(论文文献综述)
李英楠[1](2020)在《基于Hive的购销数据仓库系统的设计与实现》文中研究表明科学技术的发展带来了人们生活办公方式的转变,当今时代所倡导的人工智能,大数据等技术的发展都以数据作为基石。数据的价值在生活的方方面面都日益明显,而对于一个企业来说数据的价值更是在一个企业当中扮演着至关重要的角色,企业在日常经营与生产中积累了海量的数据,数据进入了DT时代,如何合理地处理和利用这些数据成了所有企业所关心的重要问题。大数据技术在这种背景下孕育而生,并在潮流之中稳步向前发展,在大数据的浪潮之中,Hadoop技术脱颖而出,并得到了学术界和工业界的广泛认可,Hadoop集群之上的开源数据仓库应用Hive具有模式自由、扩展性高和容错性高等特点,能够很好的为企业级数据仓库的建设提供服务,因此,越来越多的企业开始考虑如何很好地利用Hive数据仓库带来的优势,创建自己企业的数据仓库,使自身的信息化建设迈上一个新的台阶。数据仓库是一个面向主题,经过加工和集成,相对稳定并且随时间变化的数据集合,然而传统数据仓库扩展性、容错性等较低,处理大规模数据效果非常差劲,使数据仓库完全脱离了时代的潮流,发挥不出应有的功能。在数据仓库中,查询是其所有操作的重要组成部分,数据仓库中的数据会长期存在,方便用户直接进行查询操作。大数据背景下,新的数据仓库建设方案迫在眉睫。针对上面所提出的问题本文提出了一种大数据时代下新的数据仓库建设思路,更好的服务于当今社会背景下的企业的信息化建设。企业数据仓库为企业提供数据支持,方便企业更好地进行数据管理和数据挖掘工作,是企业信息化建设的核心所在。文章以数据仓库建设的背景和意义作为文章的开始,而后深刻地分析了现在国内外对数据仓库技术的研究成果,在对现有技术的研究之上,本文采用自动化的数据处理技术和新颖的数据分层思想,并且对目标系统进行了需求分析和设计得知数据处理、数据建模、数据仓库管理和可视化是我们目标系统的四个重要组成部分。因此本文的主要研究内容有:1、数据处理使用Hadoop平台,Hadoop为数据仓库提供高效且廉价的数据处理平台,利用Hive sql方便了数据处理流程,并且自主设计使用SHELL脚本实现了ETL自动化过程,通过实验分析得出最佳线程数,使用Yarn来进行资源管理提高数据仓库的稳定性和扩展性,并且利用Map Reduce并行计算的优势,能够很好地支持企业大规模数据的处理。2、数据建模数据建模的核心是逐层解耦。越到底层越接近业务发生的记录,越到上层,越接近业务目标。数据仓库的建设使用维度建模法,在建模的同时设计数据分层,使数据变得更加可靠,数据结构更加明确,方便我们对数据进行血缘追踪,为数据开发提供极大的便利。3、可视化部分利用spring MVC+spring+mybatis+Echars作为整个系统的框架,向企业展示他们所关心的关键购销数据。4、测试部分针对各个功能模块设计了相应的测试用例。根据我们所设计的测试用例对系统的性能、功能以及安全性进行测试,测试结果在我们的预料之中,系统运转正常。
许诗怡[2](2020)在《森林资源数据仓库管理系统研建与数据分析应用技术研究》文中研究指明本研究首先论述了森林资源异构数据集成以及数据仓库技术在林业上的研究现状。森林资源数据仓库在实际应用中还面临着以下两大问题:一是数据存储存在差异,且数据表中的统计字段名称、类型、代码等的表达形式也存在差异;二是数据存储的差异性造成数据利用率不高,深层次的多维分析、数据挖掘等是基于规范化的数据进行的。针对这些问题,研究以历史上存储的森林资源数据为基础,针对森林生产功能分析、适地适树规则提取、生长收获预测模型拟合等的分析需求,设计建立了两个数据仓库:森林资源小班数据仓库以及标准地/样地数据仓库,并完成对两个数据仓库事实表、维度表字段结构的详细设计。通过对ETL技术的研究,实现对森林资源异构数据源的抽取、清洗和转换,并将处理后的规范化数据存储在目标数据仓库中进行统一管理。在此基础上,研建一个基于B/S体系架构的森林资源数据仓库管理系统。系统的主要功能包括异构数据源获取、森林资源异构数据的清洗转换、森林资源数据多维分析、数据挖掘等。本研究高效的利用已有的森林资源数据可以为林场等经营单位提供生长收获、抚育间伐、规则提取等方面的决策支持。
常有学[3](2020)在《基于智能制造的数据仓库的设计与实现》文中指出《中国制造2025》提出了建设制造业强国的目标,中国的制造业逐渐迈入智能制造时代。随着智能制造的发展和信息化建设的普及,制造业企业的智能终端、传感器和工业软件在生产中会产生海量的业务数据,这些海量的业务数据一般都具有大数据的基本特征,但是企业对这些工业大数据的存储和计算都相对困难。同时,在企业中信息化建设中,由于信息隔离、数据驳杂和标准不统一等原因,各个工业软件间数椐隔离,在企业中产生了“信息孤岛”现象。“信息孤岛”现象使得生产数据未得到充分整合和应用,严重制约了以数据为驱动的智能制造模式的发展。如何解决工业大数据的存储与计算问题,帮助企业消除“信息孤岛”现象,从海量的数据中找到有价值的信息,在企业智能制造的发展中具有重要的意义。针对上述问题,本文以制造业中仓储业务为例进行研究,采用大数据+数据仓库的方式对仓储历史订单数据进行处理和分析,主要解决数据存储、计算困难和数据不互通的问题。设计并实现了一个基于Spark+Impala的分布式数据仓库系统,对制造业仓储业务的相关数据进行统一处理,最后利用数据挖掘和可视化技术将工业软件中的数据进行应用,解决仓库货位摆放的问题,实现工业软件中数据的互联互通,为企业提供数据支撑的决策优化支持。本文所做的主要工作如下:(1)针对生产数据不规则、有缺失和异构等问题,设计并实现基于Kettle+Sqoop 的分布式ETL系统,对数据进行抽取、转换和加载,提高ETL速度的同时解决数据更新问题,实现数据的完整和统一。(2)针对生产数据中存储不一致的问题,设计并实现基于Spark+Impala的数据仓库系统,确定该系统中的多种事实表、维度表、维度模型和总体架构。使用 Spark和Hive对数椐进行转换,使用Impala对数据进行交互式查询,提高不同场景下的计算速度,实现数椐的统存储和快速查询。(3)针对工业数据难以共享和利用的问题,对数据仓库系统进行应用。首先对历史订单数据进行关联规划挖掘,以优化货位摆放位置,同时把货品和销量数据进行可视化展示,实现数据的共享和有利数据的挖掘。
宁航[4](2020)在《刚性接触网数据仓库设计与实现》文中指出随着全国各大城市的地铁建设速度和规模不断增大,地铁在优化城市区域布局并改善城市交通拥堵问题中扮演着越来越重要的角色。刚性接触网作为地铁牵引供电系统中重要的无备用行车设备,其健康状态直接影响着地铁电客车的准时安全运营。随着刚性接触网服役时间的增多,地铁运营公司积累了大量的检修相关数据。将这些数据集成在一起进行多维数据信息的挖掘对刚性接触网健康状态评价和维修决策具有重要指导意义。但是由于刚性接触网的设计参数、实时监测、在线检测、维修日志等数据的记录方式和储存结构各异,将这些数据集成一起面临着困难。为有效解决多源异构数据的集成管理问题,本文通过数据仓库相关技术,基于目前地铁运营公司的业务数据,构建刚性接触网数据仓库。本文的主要研究如下:首先,研究地铁运营公司的检修规程和业务数据的管理现状,了解刚性接触网运维过程中产生的业务数据,分析业务数据在记录和储存方式中存在的问题。为解决数据描述不规范统一的问题,基于检修规程制定刚性接触网数据编码规范。研究刚性接触网数据仓库总体建设需求,以编码规范为原则按选择主题、声明粒度、确定维度表、确定事实表设计四个步骤进行数据仓库概念模型的设计。明确了刚性接触网数据仓库的四个主题:固有参数、故障参数、检测参数、维修参数。各主题数据集市的星形模型明确了事实和维度的字段名以及主外键关联。根据数据源实际情况设计数据抽取、数据转换、数据加载(Extract-Transform-Load,简称ETL)的程序流程。然后,结合实际业务数据在Oracle数据库系统中进行数据仓库物理模型的搭建,明确字段名的数据类型和长度。基于ETL的流程设计完成故障数据的ETL作业过程。将源数据抽取并转化为拥有一致性维度的标准化数据,加载到数据仓库的故障参数主题数据集市中。最后,基于Power BI商业智能软件开发数据仓库的可视化应用。构建的刚性接触网故障数据可视化平台包括线路、故障类型、故障状态、责任部门四个模块。各模块的多维数据可通过切片、上卷、下钻操作进行直观的信息可视化呈现。
李伟超[5](2020)在《停车管理数据仓库构建与可视化分析》文中研究表明停车困难的问题日益严峻,不仅反映了停车站点现存资源的规划缺乏一定的科学性,也体现了企业对于大量停车数据信息分析利用的不完整。充分应用相关数据进行分析并制定正确的决策需要完整、科学的企业解决方案系统,现有的企业级数据管理系统更偏向于数据的查询以及存储功能,面向业务数据分析的应用仍具有一定的不足,而商务智能系统在具备数据存储、数据查询功能的技术基础上提供了面向用户的多维数据分析操作,通过运用商务智能系统可以系统地构建一整套针对相关数据存储、数据质量处理、数据建模分析以及分析结果展示的智能数据平台,在基于数据仓库针对企业数据分析功能的基础上应用可视化技术对数据分析结果进一步展示,实现了对企业相关业务决策制定的支持。本文主要以SQL Server Business Intelligence工具构建停车管理企业的商务智能系统,其中核心技术包括ETL流程设计、数据仓库构建以及可视化技术研究应用。其中,通过ETL技术实现了停车管理部门相关业务数据的质量完善以及各类源数据整合;在构建数据仓库过程中,针对已完善的数据制定相关的分析业务主题并构建多个数据维度,实现停车管理数据的多维度分析;最终应用数据可视化技术灵活、直观地对停车管理数据分析结果进行展示,为用户制定相关决策提供数据支持。本文在ETL流程设计中,针对数据抽取的方式采取了全表插入的方法;对数据进行修改实现数据的清洗设计,并以统一数据类型的方法进行数据转换。在构建数据仓库过程中,针对停车管理企业的业务规则制定了4个业务主题,并对各个主题及其属性组进行逻辑关系划分,最终构建相应的事实表以及维度表完成数据仓库的构建。在以数据报表形式对数据分析展示的基础上进行技术拓展,应用开源代码以及map V、Fine Report工具软件实现基于数据仓库的可视化分析综合应用。通过应用本文研究的技术方法,帮助企业分析了实际的运营情况,对相关决策的制定起到了积极的作用,基本满足企业解决实际问题的需求。
王家欢[6](2020)在《基于语义的数据仓库构建方法研究及应用》文中研究指明数据仓库在数据综合、归类并进行分析上具有很好的处理能力。因此,用数据仓库集成元器件生命周期中的质量数据可以为元器件选型提供支持。但是建立元器件全生命周期质量数据仓库存在以下问题:一、对数据的统一表示困难。由于元器件的生命周期中存在很多部门,分散的数据组成要素不全,缺乏统一的数据表示模型,多源数据之间无法进行数据传递和交换。二、对实例数据的转化困难。由于各个部门的数据具有语义异构、海量的特点,所以转化到数据表示模型之前需要采用语义技术进行消歧,同时针对海量数据需要采用高效率的转化方法。针对上述问题,本文提出了基于语义的数据仓库构建方法。本方法旨在通过语义技术构建数据元模型,将各部门的元器件数据进行统一表示。然后结合语义技术将元器件全生命周期的实例数据高效地抽取、清洗、加载到数据仓库中。在进行设计选型时,为设计师提供可靠的元器件相关质量信息,通过参数匹配、智能分析等,动态地提供设计师所需的元器件,从而避免选型中可能存在的质量风险。本文的主要研究工作包括:一、基于语义的数据仓库构建方法框架研究本文提出了基于语义的数据仓库构建方法框架,该方法框架包括数据元模型构建模块、数据仓库构建模块和应用模块。分别实现了数据仓库建模,数据仓库实例数据导入和元器件选型推荐应用。二、面向元器件全生命周期的数据元模型构建本文提出了构建面向元器件全生命周期的数据元模型,从概念层面消除了元器件部门数据表示的语义异构,解决了数据的统一表示困难问题。首先从元器件全生命周期的业务表单中抽取出业务概念及关系,经过语义融合,得到元数据,然后进行基于元数据的数据仓库维度建模,形成数据仓库元模型。三、基于语义的数据仓库构建本文对数据抽取、清洗与转换、加载和元模型更新进行了研究。本文的主要工作包括两方面:一方面,解决了数据语义异构问题。采用基于同义词字典+规则的数据清洗与转换方法,从实例层面解决了数据语义异构等质量问题。采用基于子节点匹配的数据仓库元模型概念更新方法,通过更新数据仓库元模型,解决数据仓库在数据源变更时产生的概念层面的语义异构问题。另一方面,解决了海量数据转化到数据仓库中的效率问题。采用基于时间戳和日志的增量式抽取方法,解决了数据仓库在海量数据抽取时的效率问题。采用面向实时查询的数据仓库加载方法,解决了数据仓库在海量数据加载时速度慢和实时查询的效率低的问题。最后,基于星环大数据平台构建元器件质量数据仓库,通过元器件选型推荐应用验证,阐明了本文方法的有效性。
马辉[7](2018)在《可拓室内设计数据挖掘研究》文中研究说明可拓室内设计数据挖掘研究是国家自然科学基金项目《面向可拓建筑策划与设计的可拓数据挖掘理论及其方法研究》(51178132)的重要组成部分,是建筑学、可拓学和数据挖掘领域的交叉研究课题。研究建立在以数据为新能源的数据时代发展初期,探索智能化实现室内设计的新路径。是对现有室内设计理论与方法体系的扩充。研究目的在于利用计算机可以识别并运行的可拓设计语言,将可拓学的学理思想充分嵌入到数据挖掘全链条过程中,优解室内设计问题,发现优选模式下的室内设计知识规律,用于数据化实现可拓室内设计,推动室内设计研究向更理性、更科学、更智能、更高效的方向发展。论文运用跨学科交叉研究、可拓创新研究等方法,将可拓建筑学理论和可拓数据挖掘方法融入到室内设计数据挖掘研究中,构筑了可拓室内设计数据挖掘的基础研究、理论研究、方法研究、应用研究的框架结构。可拓室内设计数据挖掘的基本理论研究,是在可拓建筑设计研究和可拓数据挖掘研究的基础上,深度思考可拓室内设计数据挖掘的基本理论问题,提出支撑后续方法和应用研究的基本理论,为研究展开奠定基础。论文提出了可拓室内设计的概念;提出了描述室内精神感受的感元系统;阐述了计算机可以识别的可拓室内设计基元表达理论;阐述了可拓室内设计思维模式理论和可拓集理论;辨析了可拓室内设计数据挖掘的涵义和修辞关系;明确了研究的方向和任务。可拓室内设计数据仓库的设计研究,是在充分思考可拓学的核心优势和充分考虑设计数据特点的基础上,为设计策略输出建立的可拓数据挖掘操作平台研究,是面向可拓室内设计的,适合可拓数据挖掘结构型质的仓库设计指导。研究建立了处理数据和可拓数据的准入端口;确立了仓库的构成内容;提出了符合可拓数据特点和可拓数据挖掘特点的拓点结构;提出了三项重要的建库逻辑:即指导仓库目标系统设计的面向主题性原则、指导仓库动力系统设计的双轮驱动原则、指导仓库结构系统设计的原型设计原则,为可拓室内设计数据挖掘操作提供平台支持。可拓室内设计数据挖掘的方法研究,是在现有数据挖掘方法研究和可拓数据挖掘方法研究的基础上,按照可拓室内设计问题模式建立的挖掘操作方法研究。本质上是在挖掘到的普遍规律约束下寻找设计最优解或最优区间,以灵活的方式提供满足不同需求下的个性化设计对策。研究建立了以技术路线为依据,以挖掘步骤为展开方式,以实例解析为佐证的挖掘方法体系,详细论述了可拓室内设计数据挖掘的三种基本方法和一种创新方法。其中,有监督的可拓分类挖掘方法、无监督的可拓聚类挖掘方法、描述数据依赖关系的可拓关联挖掘方法,是针对剔除数据雍余后的多数模式的数据分析方法,而代表少数模式的离群数据在设计创新中具有非常重要的意义,研究针对这部分异常模式提出了可拓室内设计离群点挖掘方法,是针对设计数据的创新的挖掘方法。可拓室内设计数据挖掘的知识类型及其应用研究,是在可拓室内设计数据挖掘方法研究的基础上进行的挖掘成果研究,以及基于挖掘成果的应用方式研究。数据挖掘也被称作知识发现,此部分研究是自动处理数据工具的最后一环,是可拓数据挖掘技术与专业内容的衔接与落地。研究呈现了通过可拓数据挖掘方法可以生成的具体的室内设计知识内容,囊括了四种主要的知识类型,并分别阐述了不同类型知识的直接应用和可拓应用模式,完成了面向可拓室内设计的可拓数据挖掘的全过程。总之,研究旨在以数据为基础,以模型为工具,以方法为指导,在可拓室内设计数据仓库的平台上,进行可拓数据挖掘研究,发现以预测、优选、创新为核心的室内设计知识规律,探索一条以数据和需求共同驱动,智能化解决设计问题的数据化设计创新之路。为此,研究建立了可拓室内设计数据挖掘的理论体系、数据仓库设计体系、挖掘操作的方法体系、挖掘结果及其应用体系,形成了完整的可拓室内设计数据挖掘的研究结构。研究工作为数据时代设计发展提供了应对的新策略,为室内设计智能化实现提供了逻辑基础,研究成果拓展了可拓建筑学的学术边界。
张见[8](2017)在《AFC动态数据仓库应用系统的关键技术研究》文中研究表明为满足地铁运营管理人员对其系统中数据的价值挖掘需求,部分城市将数据仓库引入了地铁系统,但数据仓库中只有历史数据,不能为地铁运营管理过程中的战略战术决策的制定提供较好的数据支持。因此,本文提出将动态数据仓库引入地铁系统,构建AFC动态数据仓库应用系统,并对构建过程中所需解决的关键技术问题,即变化数据捕获、数据异常检测与处理以及数据存取处理过程中的查询竞争等问题展开研究。本文首先对动态数据仓库中的变化数据捕获技术、数据异常检测和处理技术以及数据存取处理技术的研究现状进行综述,并对数据仓库和动态数据仓库进行详细介绍;接着,详细分析了各主要变化数据捕获方法的技术原理及其优缺点,结合具体系统应用需求,最后选用基于日志的方法对ACC系统中的变化数据进行捕获,同时,对该方法中的日志记录读取和解析问题进行探讨,给出相应的解决方案,并完成了相应的变化数据捕获模块的架构设计工作;然后,基于南京地铁的进站交易数据,对进站客流量数据异常检测和处理方法进行研究,由于本文异常检测阀值范围计算是基于进站客流量数据预测模型进行的,故需首先进行进站客流量数据预测模型构建,本文首先通过CC方法和Wolf方法验证进站客流量时序数据的混沌特性并确定时序数据的时间延迟和最佳嵌入维数,对进站客流量时序数据进行相空间重构以得到模型训练样本集并对其进行归一化处理,同时,以支持向量机回归模型作为基础模型,采用集成学习方法来构建进站客流量数据预测模型,并借鉴Bagging和Random Forest的思想来生成模型集成中的各子模型,同时采用基于模型的方法对各子模型进行集成,生成最终的进站客流量数据预测模型,采用加入人工干扰粒子的方式对粒子群算法进行改进(记作WPSOwGS),并以此来优化集成模型参数,然后以大行宫站和上海路站的数据为例,按文中所述方式进行模型构建和模型参数优化,并应用本文方法进行数据异常检测和处理,实验结果表明,本文参数优化算法有效克服了传统方法易陷入极小值点的问题,并具有较好的参数优化效果,同时,按本文方法构建的预测模型与参照方法相比在模型预测效果方面亦优势明显,在异常检测与处理方面,与参照方法相比,本文方法在算得异常检测阀值范围明显变窄的情况下,异常检测的误报率也明显降低,即其具有更优越的数据异常检测和处理性能;其后,对现有的各查询竞争问题解决方案进行了分析和探讨,结合系统的具体应用需求,选用动态多级缓存的方法,并根据研究成果完成了 AFC动态数据仓库应用系统架构设计工作。总体来说,本课题对AFC动态数据仓库应用系统构建过程中的变化数据捕获、数据异常检测和处理以及数据存取处理过程中的查询竞争等问题做了一些有益的探索,也为实际的AFC动态数据仓库应用系统的构建提供了理论和方法支撑。
孙喆[9](2015)在《健康体检数据仓库的构建与分析系统的实现》文中研究说明随着健康体检业务的不断发展以及体检用户的不断增多,健康体检系统中积累了大量宝贵的数据。如何有效利用这些体检数据为医生和管理者提供决策支持成为相关机构面临的共同问题。本文针对此问题设计实现了一个健康体检数据分析系统。首先,引入数据仓库技术为健康体检数据分析提供了独立的环境,解决了健康体检数据存储和集成问题。通过健康体检数据仓库的维度建模过程,本文对健康体检数据建模涉及的事实、维度、粒度等进行了详细讨论。经过合理的模型构建,仓库数据被重新组织成了适于分析的结构。采用Shell和PL/SQL等高级脚本语言编码实现的ETL系统实现了每日数据的定时加载和更新,同时保证了最大的便捷性和灵活性。其次,为了实现健康体检数据的多维分析,使医生和管理者获得多角度分析关键指标的能力,本文引入了 OLAP技术。通过使用OLAP工具MSTR极大地简化了多维分析报表的开发。利用其提供的ROLAP服务器可以读取关系型数据仓库中的事实表和维度表,将相关数据表模型化成为一个统一的多维度模型。经过工具的配置可以定制多维模型中虚拟立方体的汇集计算结果,最终为医生和管理者提供健康体检数据多维分析报表服务。最后,本文探讨了健康风险评估的方法。通过引入数据挖掘技术中的分类技术,探索用户检验指标和检查结论之间的联系并建立相应的预测模型。文中选取决策树、朴素贝叶斯和支持向量机这三种常用的分类模型在真实数据上进行了实验,三种分类器的准确率都达到了 80%以上,证明了分类方法用于健康风险评估的可行性。此外,针对实验中健康体检数据集出现的非平衡性问题进行了讨论,最终选用数据预处理中的过采样方法对训练数据进行均衡。在对比实验中使用SMOTE算法对训练数据进行预处理之后,三种分类算法在总体分类准确率变化不明显的情况下对少数关注类的分类能力获得了显着提升,最终证明了过采样方法在健康体检数据集的不平衡性问题上应用的可行性。
陈景[10](2014)在《基于棉花仓储的数据仓库构建及可视化技术研究》文中提出中国储备棉管理总公司下设由国家投资兴建的十余座直属棉花储备库,还有近两百个代储库,这些棉花储备库主要分布在全国各主要的棉花产销区,其棉花储备库的仓容能力达到130万吨左右。如此庞大的棉仓管理信息系统,将产生大量棉花流通信息数据以及仓储环境数据,这些数据在短期内作为公司总部决策核心进行实时调控的依据,发挥重要作用,但是过去的一段时期内的数据不再具有实时的效用,本课题就通过对这些历史数据进行抽取、转换和装载一系列操作以及其他的模型化处理,构建棉花仓储数据仓库,对仓库中的大量历史数据进行挖掘,得出隐含其中的,先前未知但具有潜在价值的信息,协助棉花储备库管理员改善仓库环境,或是协助公司决策者调整储备棉的流通状况,做出适合现状的决策。本文应用研究依据“粮棉仓储特征监测安全与质量管理关键技术及系统应用示范”项目展开,本文的研究重点是棉花仓储数据仓库的构建及多维可视化分析与展示,以及基于数据挖掘的棉花仓储预警展示。具体内容包括:1.构建棉花仓储数据仓库。依托“粮棉仓储特征监测安全与质量管理关键技术及系统应用示范”项目设计数据仓库的框架,然后对棉花存储的历史数据进行清洗,转换和装载。2.对棉花仓储数据仓库多维数据进行展示。针对不同用户的查询需求设计不同层次的数据抽象,多维方式组织数据,并以多维方式显示数据,主要采用二维表、数据分布图表、曲线以及以上几种方法的任意组合来直观、快速地为决策者提供决策支持。3.通过ArcGTS软件对棉花仓库的存储环境进行分析展示。利用BP网络算法,对棉花仓储环境数据以及棉花的等级数据进行分析处理,得出环境对棉花等级影响的三种程度,并对有风险的仓库进行提示。
二、数据仓库系统的构建及应用研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、数据仓库系统的构建及应用研究(论文提纲范文)
(1)基于Hive的购销数据仓库系统的设计与实现(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文主要研究内容 |
1.4 论文的组织结构 |
1.5 本章小结 |
第2章 相关理论基础 |
2.1 数据仓库技术 |
2.1.1 数据仓库的产生背景 |
2.1.2 数据仓库定义 |
2.1.3 数据仓库特点 |
2.1.4 数据仓库基本特性 |
2.1.5 数据仓库的相关概念 |
2.1.6 数据仓库的结构 |
2.1.7 数据仓库开发过程 |
2.1.8 数据仓库建模方法 |
2.2 ETL技术 |
2.2.1 ETL技术定义 |
2.2.2 ETL作用 |
2.3 sqoop技术介绍 |
2.4 Flume技术介绍 |
2.5 SSM框架 |
2.5.1 Spring |
2.5.2 Spring Mvc |
2.5.3 Mybatis |
2.6 ECharts |
2.7 本章小结 |
第3章 系统分析 |
3.1 业务需求分析 |
3.2 建设目标 |
3.3 系统功能性分析 |
3.4 系统性能需求 |
3.5 平台构建原则 |
3.6 本章小结 |
第4章 系统设计 |
4.1 系统架构设计 |
4.2 数据仓库设计 |
4.2.1 数据处理模块 |
4.2.2 数据建模模块 |
4.3 数据可视化 |
4.4 本章小结 |
第5章 系统实现 |
5.1 系统开发环境 |
5.2 系统主要功能实现 |
5.2.1 数据仓库实现 |
5.2.2 Web可视化实现 |
5.2.3 其它功能模块 |
5.3 本章小结 |
第6章 系统测试 |
6.1 测试环境 |
6.2 系统测试内容 |
6.2.1 系统功能测试 |
6.2.2 系统性能测试 |
6.3 本章小结 |
第7章 总结与展望 |
7.1 全文工作总结 |
7.2 未来工作展望 |
参考文献 |
致谢 |
(2)森林资源数据仓库管理系统研建与数据分析应用技术研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 森林资源异构数据集成的研究现状 |
1.2.2 数据仓库在林业上的应用研究 |
1.2.3 ETL技术的研究 |
1.2.4 OLAP技术的研究 |
1.2.5 林业数据挖掘技术的研究 |
1.2.6 小结 |
1.3 研究目标和内容 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.3.3 研究拟解决的关键问题 |
1.4 研究方法与研究技术路线 |
1.4.1 研究方法 |
1.4.2 研究的技术路线 |
1.5 研究数据 |
1.6 项目来源与经费支持 |
1.7 论文组织结构 |
2 研究的理论与技术基础 |
2.1 数据仓库技术 |
2.1.1 数据仓库的概念 |
2.1.2 数据仓库建模方法 |
2.2 ETL技术 |
2.3 OLAP技术 |
2.3.1 OLAP技术基本概念 |
2.3.2 多维分析的基本操作 |
2.4 数据挖掘技术 |
2.4.1 数据挖掘的概念 |
2.4.2 常用的森林资源数据挖掘算法 |
2.5 本章小结 |
3 森林资源数据仓库设计与构建 |
3.1 森林资源小班数据仓库设计 |
3.1.1 概念模型设计 |
3.1.2 逻辑模型设计 |
3.1.3 物理模型设计 |
3.2 标准地/样地数据仓库设计 |
3.2.1 逻辑模型设计 |
3.2.2 物理模型设计 |
3.3 本章小结 |
4 森林资源异构数据的ETL技术研究 |
4.1 森林资源异构数据ETL需求分析 |
4.2 数据抽取子模型 |
4.3 数据转换子模型 |
4.3.1 数据清洗模块 |
4.3.2 数据转换模块 |
4.4 数据加载子模型 |
4.5 本章小结 |
5 森林资源数据仓库数据分析实例 |
5.1 OLAP与数据挖掘 |
5.2 森林资源数据OLAP技术应用 |
5.2.1 多维数据立方体的建立 |
5.2.2 森林生产功能分析 |
5.2.3 龄组、林种多样性及动态变化分析 |
5.3 森林资源数据挖掘技术应用 |
5.3.1 适地适树规则提取 |
5.3.2 生长收获预测模型拟合 |
5.4 本章小结 |
6 森林资源数据仓库管理系统的研建 |
6.1 系统需求分析 |
6.1.1 用户需求分析 |
6.1.2 功能需求分析 |
6.2 系统结构设计 |
6.2.1 系统体系结构设计 |
6.2.2 系统功能结构设计 |
6.3 森林资源数据仓库管理系统运行实例 |
6.3.1 异构数据源获取 |
6.3.2 数据清洗、转换 |
6.3.3 数据仓库管理 |
6.4 本章小结 |
7 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
个人简介 |
导师简介 |
致谢 |
(3)基于智能制造的数据仓库的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 选题依据及意义 |
1.2 国内外研究现状 |
1.2.1 智能制造的研究现状 |
1.2.2 数据仓库研究现状 |
1.2.3 分布式计算平台研究现状 |
1.3 课题主要研究内容 |
1.4 本文的组织结构 |
第2章 理论基础、关键技术与需求分析 |
2.1 数据仓库 |
2.1.1 数据仓库的概念和特点 |
2.1.2 数据仓库和数据库的对比 |
2.1.3 数据仓库的架构 |
2.2 大数据理论 |
2.3 Hadoop |
2.4 Spark |
2.4.1 Spark简介 |
2.4.2 Spark的架构 |
2.4.3 Spark和Hadoop自的对比 |
2.5 Hive |
2.6 Impala |
2.7 Kettle |
2.8 需求分析 |
2.9 本章小结 |
第3章 ETL系统的设计 |
3.1 智能制造中ETL系统分析 |
3.1.1 传统ETL系统的介绍及其劣势 |
3.1.2 分布式ETL系统的介绍及其优势 |
3.2 ETL系统的架构设计 |
3.3 分布式ETL系统的模型设计 |
3.3.1 数据抽取 |
3.3.2 数据转换 |
3.3.3 数据加载 |
3.4 本章小结 |
第4章 数据仓库系统的设计 |
4.1 智能制造中仓储业务分析 |
4.2 数据仓库系统的架构设计 |
4.3 建模方法介绍及选择 |
4.3.1 范式建模 |
4.3.2 维度建模 |
4.3.3 独立数据集市 |
4.3.4 数据仓库模型选择 |
4.4 数据仓库的模型设计 |
4.4.1 选择业务过程 |
4.4.2 声明粒度 |
4.4.3 维度表设计 |
4.4.4 事实表设计 |
4.4.5 模型设计 |
4.5 本章小结 |
第5章 系统的实现、应用与性能分析 |
5.1 系统环境部署 |
5.2 系统的实现 |
5.2.1 ETL系统的实现 |
5.2.2 数据仓库系统的实现 |
5.3 系统的应用 |
5.3.1 基于数据挖掘的货位优化 |
5.3.2 数据可视化 |
5.4 系统性能实验分析 |
5.4.1 MapReduce和Spark数据处理速度的对比 |
5.4.2 Impala、Hive和MySQL的查询速度对比 |
5.5 本章小结 |
第6章 结论与展望 |
6.1 结论 |
6.2 展望 |
致谢 |
参考文献 |
攻读学位期间的研究成果 |
(4)刚性接触网数据仓库设计与实现(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 刚性接触网数据应用的现状 |
1.2.2 数据仓库的研究现状 |
1.3 本论文主要工作 |
第2章 刚性接触网业务数据及其编码规范 |
2.1 刚性接触网的检修业务过程 |
2.1.1 组织架构 |
2.1.2 设备监测 |
2.1.3 检修方式 |
2.2 地铁刚性接触网的数据源 |
2.2.1 LMIS维修信息系统 |
2.2.2 人工巡视数据 |
2.3 编码的设计和制定 |
2.3.1 总体设计思路 |
2.3.2 固有参数编码 |
2.3.3 故障参数编码 |
2.4 本章小结 |
第3章 刚性接触网数据仓库的设计 |
3.1 数据仓库构建需求 |
3.2 架构设计方案 |
3.3 功能设计方案 |
3.4 数据仓库概念模型的设计 |
3.4.1 选择主题 |
3.4.2 声明粒度 |
3.4.3 维度表和事实表的设计 |
3.5 ETL设计 |
3.5.1 数据抽取的设计 |
3.5.2 数据转换的设计 |
3.5.3 数据加载的设计 |
3.6 本章小结 |
第4章 刚性接触网数据仓库的实现 |
4.1 数据仓库物理模型的实现 |
4.1.1 系统开发环境 |
4.1.2 物理模型的构建 |
4.2 数据连接及抽取的实现 |
4.3 数据转换的实现 |
4.4 数据加载的实现 |
4.5 ETL作业 |
4.6 本章小结 |
第5章 数据仓库的可视化应用 |
5.1 刚性接触网故障数据可视化需求 |
5.2 刚性接触网故障数据可视化平台的实现 |
5.2.1 线路模块 |
5.2.2 故障类型模块 |
5.2.3 故障状态模块 |
5.2.4 责任部门模块 |
5.3 可视化平台的发布 |
5.4 本章小结 |
结论与展望 |
致谢 |
参考文献 |
攻读硕士学位期间发表的论文及科研成果 |
(5)停车管理数据仓库构建与可视化分析(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究动态 |
1.3 研究内容 |
1.4 研究方法与技术路线 |
1.5 论文结构安排 |
第二章 商务智能相关理论及方法 |
2.1 商务智能主要理论 |
2.1.1 商务智能概念 |
2.1.2 商务智能核心架构 |
2.2 商务智能主要技术方法 |
2.2.1 ETL技术 |
2.2.2 数据仓库技术 |
2.2.3 联机分析处理技术 |
2.2.4 数据挖掘技术 |
2.2.5 报表展示技术 |
2.3 数据可视化理论及方法 |
2.3.1 数据可视化技术概述 |
2.3.2 基于数据仓库的数据报表技术 |
2.3.3 动态可视化技术 |
2.4 本章小结 |
第三章 基于停车管理的数据仓库设计与构建 |
3.1 业务需求分析 |
3.2 数据仓库设计 |
3.2.1 概念模型设计 |
3.2.2 逻辑模型设计 |
3.2.3 物理模型设计 |
3.3 ETL流程设计 |
3.3.1 数据抽取设计 |
3.3.2 数据清洗与转换设计 |
3.3.3 数据加载设计 |
3.4 本章小结 |
第四章 停车数据的可视化分析 |
4.1 基于数据仓库的数据报表系统设计与展示 |
4.1.1 报表主题分析与设计 |
4.1.2 报表设计 |
4.1.3 报表展示 |
4.1.4 报表的部署与管理 |
4.2 停车管理数据的可视化展示 |
4.2.1 可视化技术方法的比较与选择 |
4.2.2 规划目标分析以及应用软件设置 |
4.2.3 基于前端技术软件的停车数据可视化分析 |
4.3 本章小结 |
第五章 总结与展望 |
5.1 研究结论 |
5.2 研究展望 |
参考文献 |
致谢 |
附录 |
作者简介 |
(6)基于语义的数据仓库构建方法研究及应用(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 数据仓库元数据 |
1.2.2 数据仓库ETL技术 |
1.2.3 数据仓库模型更新 |
1.2.4 国内外研究现状总结 |
1.3 主要研究内容 |
1.4 论文组织结构 |
第二章 基于语义的数据仓库构建方法框架研究 |
2.1 业务场景分析 |
2.2 基于语义的数据仓库构建方法整体框架 |
2.3 本章小结 |
第三章 面向元器件全生命周期的数据元模型构建 |
3.1 元数据定义 |
3.2 元数据抽取 |
3.3 元数据融合 |
3.4 基于元数据的数据仓库维度建模 |
3.5 本章小结 |
第四章 基于语义的数据仓库构建 |
4.1 基于时间戳和日志的增量式数据抽取方法 |
4.1.1 基于时间戳的增加和修改数据增量抽取 |
4.1.2 基于日志的删除数据增量抽取 |
4.2 基于同义词字典+规则的数据清洗与转换方法 |
4.2.1 同义词字典 |
4.2.2 清洗规则制定 |
4.2.3 清洗过程 |
4.2.4 数据转换 |
4.3 面向实时查询的数据仓库加载方法 |
4.3.1 数据仓库表的更新 |
4.3.2 临时表加载新数据 |
4.3.3 实时查询更新 |
4.3.4 数据仓库打包和优化 |
4.4 基于子节点匹配的数据仓库元模型概念更新方法 |
4.5 实验验证 |
4.5.1 数据集和实验工具 |
4.5.2 评估指标 |
4.5.3 评估结果 |
4.6 本章小结 |
第五章 元器件选型推荐系统实现与讨论 |
5.1 平台应用背景及方法 |
5.1.1 元器件基本信息校验 |
5.1.2 元器件选用评估 |
5.1.3 元器件选型推荐 |
5.2 系统架构设计 |
5.3 系统详细设计 |
5.3.1 存储层 |
5.3.2 控制层 |
5.3.3 应用层 |
5.4 原型系统验证及展示 |
5.4.1 数据元模型构建 |
5.4.2 数据仓库构建 |
5.4.3 基于数据仓库的典型应用 |
5.5 系统讨论与分析 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 全文工作总结 |
6.2 未来工作展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文目录 |
(7)可拓室内设计数据挖掘研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及研究的目的与意义 |
1.1.1 研究背景 |
1.1.2 研究的目的与意义 |
1.2 国内外研究现状 |
1.2.1 建筑及室内设计人工智能的相关研究 |
1.2.2 可拓学与可拓建筑学的相关研究 |
1.2.3 数据挖掘与可拓数据挖掘的相关研究 |
1.2.4 研究综述 |
1.3 研究的内容与方法 |
1.3.1 研究的内容 |
1.3.2 研究的方法 |
1.4 论文研究框架 |
第2章 可拓室内设计数据挖掘的基本理论 |
2.1 可拓室内设计的理论基础 |
2.1.1 可拓室内设计的概念与模型表达 |
2.1.2 可拓室内设计的思维模式 |
2.1.3 可拓室内设计的分析方法 |
2.2 可拓数据挖掘的理论基础 |
2.2.1 可拓集理论 |
2.2.2 可拓室内设计数据挖掘的内涵 |
2.3 可拓室内设计数据挖掘的特点 |
2.3.1 面向可拓室内设计的可拓数据挖掘的特点 |
2.3.2 基于可拓数据挖掘的可拓室内设计的优势 |
2.4 可拓室内设计数据挖掘的任务与目标知识类型 |
2.4.1 描述性任务 |
2.4.2 预测性任务 |
2.4.3 目标知识类型 |
2.5 本章小结 |
第3章 可拓室内设计数据仓库的设计 |
3.1 建构可拓室内设计数据仓库的基础 |
3.1.1 可拓室内设计数据仓库与现有数据库的区别 |
3.1.2 数据库和数据仓库的平台选择 |
3.1.3 数据仓库的数据基础 |
3.1.4 数据仓库与联机分析处理技术 |
3.2 可拓室内设计数据仓库设计的原则 |
3.2.1 面向主题原则 |
3.2.2 双轮驱动原则 |
3.2.3 原型设计原则 |
3.3 可拓室内设计数据仓库的构成 |
3.3.1 基础数据仓库 |
3.3.2 可拓数据仓库 |
3.3.3 知识仓库 |
3.4 可拓室内设计数据仓库的拓点结构 |
3.4.1 量值拓点的关系体系 |
3.4.2 特征拓点的关系体系 |
3.5 本章小结 |
第4章 可拓室内设计数据挖掘方法 |
4.1 可拓室内设计分类挖掘方法 |
4.1.1 可拓室内设计分类挖掘方法阐释 |
4.1.2 确立分类挖掘设计问题 |
4.1.3 基于设计问题类别数据域的建立 |
4.1.4 基于可拓分析的可拓集建立与可拓挖掘 |
4.1.5 实例解析 |
4.2 可拓室内设计聚类挖掘方法 |
4.2.1 可拓室内设计聚类挖掘方法阐释 |
4.2.2 确立聚类挖掘设计问题 |
4.2.3 基于设计问题聚类特征树的建立 |
4.2.4 基于聚类分析的叶节点聚类与可拓挖掘 |
4.2.5 实例解析 |
4.3 可拓室内设计关联挖掘方法 |
4.3.1 可拓室内设计关联挖掘方法阐释 |
4.3.2 确立关联挖掘设计问题 |
4.3.3 基于设计问题数据项集的建立 |
4.3.4 基于关联分析的频繁项集发现与可拓挖掘 |
4.3.5 实例解析 |
4.4 可拓室内设计离群点挖掘方法 |
4.4.1 发散式挖掘 |
4.4.2 传导式挖掘 |
4.4.3 共轭式挖掘 |
4.4.4 转换桥式挖掘 |
4.5 本章小结 |
第5章 可拓室内设计数据挖掘的知识成果及其应用 |
5.1 可拓室内设计数据挖掘的形态要素型知识及其应用 |
5.1.1 挖掘的形态要素型知识 |
5.1.2 挖掘的形态要素型知识直接应用 |
5.1.3 挖掘的形态要素型知识可拓应用 |
5.2 可拓室内设计数据挖掘的主题风格型知识及其应用 |
5.2.1 挖掘的主题风格型知识 |
5.2.2 挖掘的主题风格型知识直接应用 |
5.2.3 挖掘的主题风格型知识可拓应用 |
5.3 可拓室内设计数据挖掘的文化特征型知识及其应用 |
5.3.1 挖掘的文化特征型知识 |
5.3.2 挖掘的文化特征型知识直接应用 |
5.3.3 挖掘的文化特征型知识可拓应用 |
5.4 可拓室内设计数据挖掘的行为与情境体验型知识及其应用 |
5.4.1 挖掘的行为体验型知识 |
5.4.2 挖掘的情境体验型知识 |
5.4.3 挖掘的行为与情境体验型知识直接应用 |
5.4.4 挖掘的行为与情境体验型知识可拓应用 |
5.5 本章小结 |
结论 |
参考文献 |
攻读学位期间发表的学术论文及其它成果 |
致谢 |
个人简历 |
(8)AFC动态数据仓库应用系统的关键技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究综述 |
1.2.1 CDC技术 |
1.2.2 数据清洗技术 |
1.2.3 数据存取处理技术 |
1.3 本文的主要内容和技术路线 |
第二章 数据仓库与动态数据仓库技术 |
2.1 数据仓库 |
2.1.1 数据仓库的定义 |
2.1.2 数据仓库的特点 |
2.1.3 数据仓库系统的体系结构 |
2.1.4 数据仓库系统的不足 |
2.2 动态数据仓库 |
2.2.1 动态数据仓库的定义 |
2.2.2 传统数据仓库与动态数据仓库的区别 |
2.2.3 动态数据仓库的应用 |
2.3 本章小结 |
第三章 变化数据捕获技术研究 |
3.1 变化数据捕获的定义 |
3.2 变化数据捕获方法研究 |
3.2.1 基于文件或表的全扫描比对的方法 |
3.2.2 基于触发器的方法 |
3.2.3 基于复制的方法 |
3.2.4 基于时间戳的方法 |
3.2.5 基于日志的方法 |
3.2.6 基于表刷新的方法 |
3.3 变化数据捕获模块设计 |
3.3.1 日志信息读取 |
3.3.2 日志信息分析 |
3.3.3 数据调度策略 |
3.4 本章小结 |
第四章 实时客流量数据异常检测方法研究 |
4.1 客流数据采集与预处理 |
4.2 时间序列的混沌特性判定 |
4.2.1 相空间重构参数确定 |
4.2.2 最大Lyapunov指数 |
4.2.3 实例分析 |
4.3 实时进站客流量数据预测模型构建 |
4.3.1 模型训练数据样本集 |
4.3.2 支持向量机回归模型 |
4.3.3 集成学习 |
4.3.4 粒子群优化算法 |
4.3.5 实例分析 |
4.4 实时进站客流量数据的异常检测与处理 |
4.4.1 阀值确定及相应的数据有效性检测和处理方法 |
4.4.2 实例分析 |
4.5 本章小结 |
第五章 查询竞争问题及其解决方案的分析研究 |
5.1 问题分析 |
5.2 查询冲突问题主要解决方法分析 |
5.2.1 简化或限制实时报表 |
5.2.2 提升数据库系统硬件配置 |
5.2.3 外部实时数据缓存 |
5.2.4 及时信息合并 |
5.2.5 反向及时信息合并 |
5.2.6 实时分区 |
5.2.7 动态多级缓存 |
5.2.8 动态镜像技术 |
5.3 查询冲突问题解决方案架构设计 |
5.4 本章小结 |
第六章 论文工作的总结与展望 |
6.1 论文工作总结 |
6.2 论文工作展望 |
致谢 |
参考文献 |
攻读硕士学位期间所发表论文 |
(9)健康体检数据仓库的构建与分析系统的实现(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题研究背景 |
1.2 课题研究意义及应用价值 |
1.3 本文的主要研究内容 |
1.4 论文的组织结构 |
第2章 数据仓库与数据分析技术 |
2.1 数据仓库技术 |
2.1.1 定义及特性 |
2.1.2 数据集市 |
2.1.3 操作数据存储 |
2.1.4 元数据 |
2.1.5 ETL技术 |
2.1.6 数据仓库的一般架构 |
2.2 联机分析处理技术 |
2.2.1 OLAP概述 |
2.2.2 多维数据模型 |
2.2.3 多维分析的主要操作 |
2.3 数据挖掘技术 |
2.3.1 数据挖掘技术概述 |
2.3.2 数据挖掘技术的分类 |
2.3.3 数据挖掘技术在健康领域的应用 |
2.4 基于数据仓库的数据分析 |
2.5 本章小结 |
第3章 健康体检数据仓库的构建 |
3.1 数据仓库构建概述 |
3.1.1 仓库架构选择 |
3.1.2 仓库构建方法 |
3.2 业务及需求概述 |
3.2.1 健康体检业务流程概述 |
3.2.2 健康体检分析需求概述 |
3.3 数据分析系统技术架构 |
3.4 健康体检数据仓库维度建模 |
3.4.1 关系型数据库多维建模 |
3.4.2 业务过程选取 |
3.4.3 粒度声明 |
3.4.4 维度识别 |
3.4.5 事实识别 |
3.4.6 模型建立 |
3.5 健康体检数据仓库物理设计 |
3.5.1 仓库层次规划 |
3.5.2 物理表结构设计 |
3.5.3 索引设计 |
3.6 本章小结 |
第4章 健康体检数据仓库ETL设计与实现 |
4.1 方案选择 |
4.2 源数据治理 |
4.3 抽取方案设计 |
4.3.1 数据捕捉 |
4.3.2 数据传输 |
4.4 转换方案设计 |
4.4.1 主数据管理系统 |
4.4.2 数据一致化 |
4.4.3 数据清洗 |
4.5 加载方案设计 |
4.5.1 首次加载 |
4.5.2 增量加载 |
4.6 管理方案设计 |
4.6.1 任务调度 |
4.6.2 错误处理 |
4.6.3 ETL元数据设计 |
4.7 ETL实现 |
4.7.1 DB到ODS的实现 |
4.7.2 ODS到DW的实现 |
4.7.3 DW到DM的实现 |
4.8 本章小结 |
第5章 健康体检数据多维分析 |
5.1 多维分析原理 |
5.1.1 多维分析方式 |
5.1.2 关系型仓库多维分析原理 |
5.2 MSTR简介 |
5.2.1 MSTR实现原理 |
5.2.2 MSTR核心组件 |
5.3 基于MSTR的多维分析设计方案 |
5.4 基于MSTR的多维分析实现 |
5.4.1 MSTR项目结构 |
5.4.2 MSTR多维分析报表的实现 |
5.5 本章小结 |
第6章 基于健康体检数据仓库的数据挖掘 |
6.1 数据挖掘集市构建 |
6.1.1 数据模型描述 |
6.1.2 数据模型构建 |
6.2 基于分类技术的健康风险评估研究 |
6.2.1 评估框架 |
6.2.2 分类算法 |
6.2.3 评价标准 |
6.2.4 数据实验 |
6.3 非平衡健康数据集分类提升研究 |
6.3.1 非平衡数据集处理方法 |
6.3.2 SMOTE算法原理 |
6.3.3 对比实验 |
6.4 本章小结 |
第7章 工作总结与展望 |
7.1 工作总结 |
7.2 工作展望 |
参考文献 |
致谢 |
(10)基于棉花仓储的数据仓库构建及可视化技术研究(论文提纲范文)
摘要 |
Abstract |
目录 |
图目录 |
表目录 |
第一章 引言 |
1.1 课题研究的背景和意义 |
1.2 国内外研究现状 |
1.3 论文的主要研究内容以及组织结构 |
第二章 数据仓库、多维分析概述 |
2.1 数据仓库的概念 |
2.2 数据仓库中的数据 |
2.2.1 数据仓库的数据组织 |
2.2.2 粒度与分割 |
2.2.3 数据模型 |
2.3 OLAP及其多维分析 |
2.3.1 OLAP的特点 |
2.3.2 OLAP的多维数据模型 |
2.4 数据挖掘技术 |
2.4.1 数据挖掘的定义 |
2.4.2 数据挖掘的分类 |
2.5 数据仓库与OLAP、数据挖掘的关系 |
2.6 本章小结 |
第三章 基于棉花仓储的数据仓库的构建 |
3.1 基于棉花仓储数据仓库特点分析 |
3.2 棉花仓储数据仓库的设计 |
3.2.1 概念模型设计 |
3.2.2 逻辑模型设计 |
3.2.3 物理模型设计 |
3.3 构建棉花仓储数据仓库 |
3.3.1 开发工具的选择 |
3.3.2 ETI的分析与设计 |
3.3.3 生成棉花仓储数据仓库 |
3.4 本章小结 |
第四章 棉花仓储数据多维可视化分析与展示 |
4.1 OLAP的关键技术 |
4.1.1 统一维度建模 |
4.1.2 利用多维表达式(MDX)扩展OLAP的功能 |
4.2 SSAS 2012中的OLAP设计方法 |
4.2.1 自下而上的模式 |
4.2.2 自上而下的模式 |
4.3 棉花仓储数据立方体的构建及使用 |
4.3.1 自下而上建立棉花仓储数据仓库数据立方体 |
4.3.2 棉花仓储数据仓库OLAP系统多维数据集的存储 |
4.4 棉花仓储数据仓库OLAP系统的展现与分析 |
4.4.1 基于棉花仓储流通的OLAP分析 |
4.4.2 基于棉花存储环境以及质量等级的OLAP分析 |
4.5 本章小结 |
第五章 数据挖掘技术在棉花仓储环境分析中的应用 |
5.1 棉花仓储环境分析的现实意义 |
5.2 BP神经网络简介 |
5.2.1 BP算法基本原理 |
5.2.2 BP算法的训练过程 |
5.2.3 BP算法的计算步骤 |
5.2.4 BP学习算法的缺点及改进 |
5.3 基于BP神经网络的棉花仓储环境风险点评定 |
5.3.1 样本数据准备 |
5.3.2 网络拓扑结构的确定 |
5.3.3 网络训练参数的设定 |
5.4 BP网络模型评价结果 |
5.4.1 BP网络评价 |
5.4.2 BP网络模型评价结果 |
5.5 棉花仓库环境分析展示 |
5.6 小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间的论文与科研情况 |
四、数据仓库系统的构建及应用研究(论文参考文献)
- [1]基于Hive的购销数据仓库系统的设计与实现[D]. 李英楠. 西南大学, 2020(05)
- [2]森林资源数据仓库管理系统研建与数据分析应用技术研究[D]. 许诗怡. 北京林业大学, 2020
- [3]基于智能制造的数据仓库的设计与实现[D]. 常有学. 南昌大学, 2020(01)
- [4]刚性接触网数据仓库设计与实现[D]. 宁航. 西南交通大学, 2020(07)
- [5]停车管理数据仓库构建与可视化分析[D]. 李伟超. 西安电子科技大学, 2020(05)
- [6]基于语义的数据仓库构建方法研究及应用[D]. 王家欢. 上海交通大学, 2020(01)
- [7]可拓室内设计数据挖掘研究[D]. 马辉. 哈尔滨工业大学, 2018(01)
- [8]AFC动态数据仓库应用系统的关键技术研究[D]. 张见. 东南大学, 2017(04)
- [9]健康体检数据仓库的构建与分析系统的实现[D]. 孙喆. 东北大学, 2015(01)
- [10]基于棉花仓储的数据仓库构建及可视化技术研究[D]. 陈景. 首都师范大学, 2014(01)