一、相关性分析在关联规则挖掘中的应用(论文文献综述)
徐林[1](2021)在《基于兴趣挖掘的网络用户行为的分析与研究》文中研究说明21世纪以来,随着计算机技术的高速发展,人工智能领域也在快速地进步。数据挖掘作为人工智能领域的重要研究内容,得到了广泛的关注与研究,已形成了聚类分析、关联规则等方向的研究课题。关联规则挖掘是数据挖掘领域的一个重要组成部分,传统挖掘算法的研究,主要集中在支持度和置信度的基础上。这种挖掘框架易产生误导的规则,忽略了部分低支持度而高相关性的规则。为了解决这类问题,引入了兴趣度度量模型,用以验证挖掘结果是否真正对用户具有价值。首先,针对传统关联规则挖掘框架的缺陷,对常用的兴趣度度量模型进行了分析。对于客观兴趣度中存在的项集对称性和度量值等存在的问题,引入了主观兴趣度度量,提出了一种基于主观和客观兴趣度结合的兴趣度融合模型。另外,通过对正负关联规则算法的分析与研究,针对挖掘负关联规则时规则爆炸问题,引入了 Max-支持度的定义,达到在挖掘频繁项集时限制项集的生成,在此基础上提出了针对正负关联规则的兴趣度挖掘算法。对该算法通过两组真实数据集进行了验证。实验结果表明,该算法能够有效的挖掘正负关联规则并且减少了无用规则和存在误导性规则的生成。然后,使用提出的基于兴趣度的正负关联规则挖掘算法对网络用户行为数据进行挖掘实践,发现其中具有价值的规则。另外,为了提高挖掘效率,在对高维子空间聚类算法进行分析与研究的基础上,提出了基于数据特征的DC-clique算法。在数据预处理之后,利用DC-clique算法对网络用户数据集进行聚类,将具有相同特征的数据进行分簇,在簇内进行兴趣度关联规则的挖掘。实验结果表明,在对网络用户行为方面,提出的兴趣度模型和关联规则挖掘算法的是有效的。该方法对网站使用者和平台运营有一定的帮助和指导作用。
于帅[2](2020)在《基于气象条件与交通流交互作用的高速公路事故风险分析及预测》文中进行了进一步梳理道路交通事故目前在世界范围内是第五大致死因素,而在道路交通事故中,高速公路单次交通事故的严重程度更大、伤亡人数更多。传统的高速公路风险管理是被动的、静态的管理,将重点放在了“事后”应急中,已无法适应高速公路现代化、智能化管理的需求。近年来,数据采集、分析技术的发展,以及交通事故预警系统的研发,使高速公路风险管理由“事后应急管理”开始转变为“事前主动防控”。高速公路风险“事前”管理是运用数据挖掘手段,通过对与高速公路交通事故相关的高精度交通流特征、天气条件等数据的分析,识别影响高速公路安全运行的风险因素,判断高速公路运行的安全状态,对当前运行环境下高速公路是否会发生事故进行精准预测。高速公路管理部门可以根据以上分析及预测结果,提前进行针对性的高速公路预警及布置应急工作,提升高速公路安全管控水平,降低交通事故发生数量,减轻事故严重程度。目前我国高速公路风险主动管理还处于初级阶段,需要科学、实用的方法对其建设进行支撑,因此本文以高速公路安全风险为研究对象,以高速公路交通流动态特征与气象条件的交互作用为切入点,运用风险分析理论架构,从风险识别、风险评估及风险预测三个角度对高速公路主动风险管理的关键技术进行研究,为高速公路管理部门制定风险防控措施提供决策支持,主要研究内容包括以下三个方面:(1)高速公路事故风险因素识别首先,利用关联规则挖掘方法识别影响高速公路安全运行的风险因素。在收集、整理并分析高速公路交通事故统计数据的基础上,发现影响高速公路安全运行的风险因素具有多层次、多维度的特点,且不同因素之间存在相关性,因此提出了基于Apriori算法改进的多维多层AHP加权Top-k关联规则挖掘算法的高速公路风险因素识别方法,该方法克服了传统统计分析方法无法避免的影响因素之间相关性问题,同时解决了经典关联规则需要在挖掘过程中设置最小支持度阈值导致错失重要关联规则的问题,实现了对影响高速公路安全运行风险因素的深度挖掘。通过对挖掘出来的关联规则进行筛选和对比分析,有效识别了影响高速公路安全的关键风险因素为交通流特征和天气特征,为接下来的高速公路安全状态评估提供了研究基础。(2)基于气象条件与交通流交互作用的高速公路安全状态划分和评价其次,对高速公路安全风险状态进行评估。综合考虑天气特征与交通流特征之间的关联关系,运用“病例-对照”样本结构数据匹配方法,提取高速公路交通事故发生点对应的事故发生前上下游交通流状态数据以及与其相匹配的高精度天气数据,避免了其他混杂因素的影响;在此基础上计算能够表征交通安全状态的复合指标,并采用随机森林算法筛选出变量重要度靠前的重要指标,解决了后面计算过程中的维度灾难问题。接着针对评价指标同时包含数值型数据与分类型数据的混合型数据特点,提出了基于模糊k-prototypes算法的高速公路安全状态划分方法,并基于贝叶斯Logistic回归方法评估不同交通安全状态对事故风险的影响。结果表明同时考虑天气和交通流动态特征条件下高速公路安全状态可以划分为6类,而只考虑交通流特征时只能将高速公路安全状态划分为5类,说明同时考虑天气条件和交通流动态特征条件下的高速公路安全状态划分的更加精细。(3)基于气象条件与交通流交互作用的高速公路事故风险预测最后,对高速公路安全风险进行预测。定量分析天气因素与交通流特征之间存在的交互效应,并证明了在高速公路安全风险评估中加入天气因素能够提升模型对高速公路事故风险的判别精度。接着在考虑天气因素与交通流特征的基础上提出了基于学习率自适应随机梯度提升算法的高速公路事故风险预测模型,实现对基于气象条件与交通流交互作用的高速公路安全风险进行预测。预测结果显示本文所建模型在同时考虑天气及交通流特征情况下预测准确率最高,同时在数据有缺失值及异常值情况下仍有较高的预测准确率。
李鹏[3](2020)在《通信网告警规则挖掘系统的设计与实现》文中进行了进一步梳理在普及通信和网络的时代,民众对通信网络质量的要求很高。通信网设备故障不但会导致网络质量下降,还会对用户体验产生负面影响,甚至会造成经济上的损失。由此,对于通信网络质量的要求达到苛刻的程度。通信网告警是反应通信网络状态最敏感的信号。现在的通信网组网密集且复杂,单一原因引起的故障很容易产生告警风暴。现有的分析逻辑是:事先给出规则来进行告警归并和分析处理。这种方法没有办法对新的规则自动发现,无法响应新出现的各种状况;也无法有效应对通信网日益复杂的组网结构和处理告警风暴。因此,通信网告警规则的自动发现是有价值、有意义的。本文针对通信网告警数据的特点,结合关联分析算法进行分析,使得告警规则可以被主动发现。针对实际告警数据的特点和算法输入所需数据结构的要求,设计并实现从现网抽取告警数据,关联资源,过滤无效值,进行有效分组等操作,以满足数据挖掘算法的输入要求。本文采用从批处理到分布式,再到流式数据的处理方式;应用大数据与流式数据处理分析平台等技术,挖掘出相关告警规则。对于算法挖掘出的结果进行分析、归类和总结。完成界面和数据挖掘处理相关模块的设计、实现和功能测试。主要的成果有:运用软件工程的思想,结合通信网告警数据的现实分析需求,应用数据挖掘中关联分析的相关算法技术,对系统进行了需求分析、详细设计及实现,最后给出测试结果并进行分析、总结、归纳。设计并实现界面层相关模块,实现结果查看、任务下发、派发专家组等功能。实现应用频繁模式算法(Apriori、FP-Growth)、序列模式数据挖掘算法(Prefix Span)分析告警数据,得到可用的告警频繁模式和告警序列模式。设计并实现从常规数据量分析到Spark集群上基于机器学习(MLlib)包的分布式分析相关模块,实现对海量告警数据分析。设计并实现从静态到流式数据分析(Spark Streaming)相关模块,实现对告警数据流的分析。分析通信网告警数据中的频繁模式和序列模式,针对挖掘出的告警规则进行分析和归类,探索达到可以实际应用所需要的参数参考阈值。并对系统进行充分的测试,达到预期效果。
刘云豪[4](2020)在《基于数据挖掘技术的综合网管告警系统设计与实现》文中提出随着黑龙江广电网络规模和各类业务的迅速发展,网络复杂性变得逐渐提高,导致黑龙江广电接入网中故障告警种类和数量不断增多、告警信息之间的关联性也更加复杂,使得关键告警信息无法得到及时识别与处理,给广电网络的运营管理带来了极大困难。综合网管告警系统作为支撑广电网络运维的重要手段亟须解决这些问题,因此需要采用合适的技术和方法提升系统整体智能化处理能力。本文在分析黑龙江广电网络现有问题的基础上,根据综合网管告警系统的建设目的,结合数据挖掘、告警相关性分析等关键技术与理论,设计并实现了基于数据挖掘技术的综合网管告警系统,系统整体有告警数据采集、处理以及告警呈现与管理三部分组成。在告警系统中使用加权FP-growth数据挖掘算法自动完成对历史告警数据间关联性规则挖掘并进行告警规则库的更新与维护,同时告警系统结合规则库和关联分析引擎完成对采集到的实时告警数据智能匹配分析,有效识别关键告警信息,减少大量告警的呈现,从而最终帮助运维人员根据系统提供的多种呈现与查询方式,实现对故障告警的分析与管理。最后对系统所采用的算法和各项功能进行了测试,经过测试验证了系统的准确性与实际应用效果,结果表明系统整体已较好地实现了初期的设计与建设目标,可以有效地提高告警数据的智能化处理能力和运维人员的工作效率,满足了系统故障告警管理的要求。
陈颖[5](2020)在《基于电信网管告警数据分析的网络故障预测研究》文中进行了进一步梳理网络故障管理为保障整个通信网络稳定可靠运行起到了关键的作用。告警相关性分析和网络故障预测是目前网络故障管理中两个重要的研究内容。运用数据挖掘和机器学习来分析告警数据中的潜在关系并预测故障的发生,对于促进电信网络智能转型、提升业务服务品质有着重要的影响和意义。本论文依托于企业合作项目,从企业需求出发针对电信网管系统中告警的相关性和故障的发生规律进行研究,设计了一个从告警数据相关性分析到网络故障预测的整体方案。本论文的主要工作内容如下:1)本论文总结了电信网络管理中告警和故障的概念、特点及基本处理步骤;综述了国内外告警数据相关性分析和网络故障预测的研究成果和应用情况,最后阐述了本论文中涉及的相关算法理论知识。2)针对整个网络中告警存在冗余、不同子网络间告警相互重叠的问题,提出了一个告警数据相关性分析方法,得到告警间的时序关系并定位根源告警。首先提出了基于网络拓扑结构的K模式(K-Modes based on Network Topology,K-MNT)聚类改进算法对告警数据进行预处理,得到具有网络拓扑关系的告警聚类簇。然后构建了动态滑动时间窗口对每个聚类簇选取告警序列集,动态适应不同的告警数据分布,保证关联的告警都能被包含在同一个时间窗口中。在此基础上运用序列模式挖掘的方法挖掘告警的时序相关关系,从而过滤掉告警数据中的伴随告警,定位到根源告警,最终实现根源告警与故障的关联。3)进一步,在告警-故障关联数据基础上,提出了基于多模型集成的网络故障预测方法。统计分析关联数据的分布情况及各属性的特点,提出将因子分解机(Factorization Machine,FM)、极端梯度提升(Extreme Gradient Boosting,XGBoost)等传统机器学习算法与双向长短时记忆(Bidirectional Long-Short Time Memory,BI-LSTM)、卷积神经网络(Convolutional Neural Networks,CNN)相融合的FBCXEnsemble(FM,BI-LSTM,CNN and XGBoost Ensemble)模型,充分学习特征表达的信息。另外,本论文提出了一个基于真阳率和假阳率进行计算的头部故障评估指标。该指标关注ROC曲线中头部位置的故障预测情况,应用于本论文实验的模型效果评估中衡量错判率较小的情况下正样本的预测准确率。将FBCXEnsemble模型与单模型进行性能对比,实验表明集成模型具有更好的故障识别度。
宋富强[6](2020)在《考虑需求相关性的电商物流网络库存分配策略研究》文中研究指明近年来,随着信息技术的不断发展和移动设施的普及,互联网迅速走进千家万户,彻底改变了人们的学习、工作和生活方式,电子商务也因此迅速发展,商品购买渠道也由传统的线下更多的转至线上,网上购物成为人们最喜欢的消费方式之一。根据艾媒咨询的数据显示,2019年上半年,中国的网络零售总额已达到195209.7亿元,占社会零售总额的24.7%,截至2019年,中国移动电商用户将突破7亿人。电子商务的迅速普及和用户规模的不断扩大,为电商企业的物流网络带来严峻的挑战。对于电商企业来说,如何在快速交付订单的同时,实现成本的降低和顾客满意度的平衡已成为当务之急。随着数据挖掘方法的发展,如何利用电商平台积累的历史订单数据,将数据挖掘方法同供应链管理有效结合,实现物流网络成本的降低,逐渐成为研究热点。此外,目前物流网络的库存分配问题中,考虑需求相关性对于库存分配策略的影响研究较少。基于此,本文提出考虑需求相关性的电商物流网络库存分配策略研究,通过数据挖掘的方法提取产品需求相关性,并建立了成本最小化的数学模型,利用Cplex对数学模型进行求解,并对重要参数进行分析,探讨了不同环境下的库存分配策略。本文首先以国内某领先电商J的物流网络为研究对象,对其物流网络结构进行了分析,并收集了华东区(江苏省、安徽省)物流网络三个月内的历史订单数据。通过对数据进行清洗、归一化、聚类等处理,筛选出43种典型产品作为研究对象,对其随机需求进行了分布拟合。为了提取蕴含在海量订单数据中的需求相关性规则,基于预设的支持度阈值和置信度阈值,运用经典的Apriori算法进行需求相关性规则挖掘,从而获得了43种产品的需求相关性规则,并对挖掘出的规则进行了分析。针对库存分配决策,引入了需求相关性约束,从而实现了从关联规则到数学约束的转化。在提取出的需求相关性规则基础上,本文研究了单周期的库存分配策略,主要聚焦于一个决策周期内的库存分配问题,通过引入需求相关性约束,建立了以存储成本和运输成本加权和为目标函数的混合整数规划模型。通过设置合理的算例参数,运用Cplex软件进行算例求解。算例对比了考虑需求相关性和不考虑需求相关性的结果,并对置信度阈值、服务水平、需求波动性等关键参数进行分析,探讨了不同参数对于J电商企业物流网络库存分配策略的影响,为实际的电商库存分配决策提供了支持。在单周期库存分配问题基础上,进一步拓展到多周期的库存分配问题,实行多周期决策,以更符合实际决策场景。在一定时间内,可以认为不同周期内的需求相关性规则是相同的。多周期库存分配问题考虑了多个决策周期之间的库存周转,通过建立以存储成本和运输成本加权和为目标函数的数学模型,对多周期的库存分配模型进行求解。算例实验结果表明,考虑需求相关性的多周期库存分配问题相较于单周期,能够有效降低供应链成本,并针对置信度阈值、单周期和多周期、需求波动性、服务水平等方面进行对比,对库存分配策略进行分析,给出了参考性建议。
薛水晶[7](2019)在《基于文本挖掘的折叠电动自行车用户需求研究》文中提出在产品创新设计研发过程中,用户需求研究是最基础也是最核心的一部分。用户需求产生于人的欲望,由欲望引发用户动机,并体现于用户与产品或系统的交互——用户体验的过程中。用户体验是动态的过程,随着用户、场景与产品状态的改变,相应的用户对产品的需求也会发生变化。因此,用户需求识别/挖掘研究与用户体验的过程密不可分。在发达的互联网环境下,在线用户评论数据内容丰富,且蕴含着大量用户信息,是获取用户需求的重要数据来源。为了从在线用户评论中准确而全面的获取用户需求,本研究提出一种基于用户体验过程的文本挖掘用户需求识别方法,综合考虑“用户-场景-产品”特征及其关系,结合情感分析与关联规则挖掘方法,识别用户需求,为产品研发提供数据服务。本研究主要的工作内容包括以下几个方面:(1)构建研究模型。从体验的层次出发,对用户体验过程及其影响因素进行分析,构建基于用户体验过程的用户需求识别模型,并结合该模型构建本研究的核心框架——基于用户体验的文本挖掘用户需求分析框架。(2)构建折叠电动自行车领域本体词库。基于网购评论文本挖掘技术,将传统设计开发的研究方法与数据挖掘技术结合,搭建折叠电动自行车领域本体结构,并以此为基础构建折叠电动自行车领域本体词库、情感词库与本研究的样本特征词库,建立样本特征属性分级词表。(3)基于情感分析进行产品特征属性挖掘研究。建立基于情感分析的产品特征属性挖掘流程框架,在该框架的基础上,进行特征属性标签匹配,基于情感词典对样本分句评论进行情感极性分析,对样本评论分句的进行<特征,情感>映射。本研究提出一种基于评论用户的特征情感极性确定计算方法,进行基于特征提及频次、基于评论用户的<特征,情感>映射数据统计,从而获取准确度更高的用户需求偏好。(4)基于用户体验过程进行产品特征属性偏好关联规则挖掘。基于用户对“用户-场景-产品”各个特征属性的情感分数,进行“用户-场景-产品”情感态度的相关性分析。通过进行具体的“用户-场景”与各级产品特征属性之间的偏好关联规则挖掘,获取不同用户体验过程中用户对产品特征属性的情感态度与偏好程度,识别用户需求,并提出相应的产品设计意见。
钟雨洋[8](2019)在《工业过程参数与故障相关性分析的量化关联规则挖掘研究》文中提出近年来,工业生产系统不断向自动化、智能化、大型化方向发展,生产过程也日趋复杂。为了保障工业过程安全可靠地运行,必须利用相关技术发现并确定故障发生的位置与故障的性质,找出引发故障的原因,预测故障的发展趋势。为了确定表征故障的关键参数,需要对工业过程参数与故障进行相关性分析,通过对历史监测数据集中的大量故障数据进行挖掘分析,寻找参数与故障间的对应关系,以及确定表征故障的关键参数,然后用故障规则的形式来描述这种相关性。这些故障规则可以为决策者提供协助支持,指导故障的检测与定位,并预测潜在的故障。为了分析工业过程参数与故障的相关性,本文进行了以下工作:针对工业过程数据量大但利用率低,并且目前相关性分析多用于单一设备和特定对象的现状,本文将关联规则挖掘方法应用于工业过程参数与故障的相关性分析过程中。首先,构建了相关性分析模型,探讨了工业过程参数与故障相关性分析的特点和实现过程中存在的适用性问题,并将其归纳为量化关联规则挖掘问题,提出了相应的挖掘模型。其次,针对既有方法只对单一参数分别进行聚类以及事先无法获取划分区间详细信息的问题,提出使用ISODATA聚类进行缓变参数离散化,并针对原始算法对初始聚类中心和噪声点敏感的问题,引入一种基于密度的方法对其进行改进,避免了获取划分区间结果的偶然性,将原始故障数据集转化为易于挖掘的数据集。最后,针对工业过程参数与故障相关性分析中故障规则形式的适用性问题,提出了基于约束优化矩阵的故障规则挖掘算法,调整了矩阵结构和挖掘过程并加入约束条件,通过获取带约束的最大频繁项集来生成合适的故障表征规则,能够更好的描述工业过程参数与故障之间的相关性。总的来说,本文以发现工业过程参数与故障的相关性为切入点,提出了一种基于密度ISODATA聚类和约束优化矩阵的量化关联规则挖掘算法(NISO-CIMC)。该算法对工业过程缓变参数历史数据集中的大量故障数据进行挖掘,将工业过程参数与故障之间的相关性描述为形式统一、表述直观、便于理解解释、易于传承的故障规则,并通过基于TE过程故障数据集的仿真实验,验证了NISO-CIMC算法的有效性和准确性。
胡秋秋[9](2019)在《移动通信网络运行数据处理与分析》文中认为随着信息技术的迅速升级和移动通信网络规模的持续扩大,移动网管中心每时每刻都会收到大量的告警数据,使网络监控系统的负担越来越大。告警相关性分析可以挖掘告警数据中的相关规则从而搜索与故障相关的根源告警,是网络管理的主要部分。另外,计算机网络的持续发展使通信网络的安全问题也开始倍受人们的重视,入侵检测技术是检测及防御网络威胁行为的重要手段。因此,研究如何构建有效的机制帮助网络管理人员进行网络故障诊断和入侵检测显得尤为重要。本文主要研究内容如下:(1)根据目前已有的告警相关性分析方法以及入侵检测技术的实现策略,对其进行了分类和总结,并重点论述和分析了普遍应用于告警相关性分析和入侵检测的经典数据挖掘算法。接下来介绍了移动通信网络系统的基本组成结构,然后引入了通信网络中告警和故障的相关概念,并根据移动运营商所提供的真实告警数据从多方面对告警数据特征进行了分析;最后给出了告警数据分析的流程结构以及本文中告警数据预处理的相关过程和处理结果。(2)提出了一种基于加权的告警分析方法。该方法考虑到通信网络中不同类型告警对网络的影响程度不同,首先采用熵值法为不同类型的告警分配不同的权值,并将告警数据转换成序列数据集;然后系统地设计了一种加权告警序列模式挖掘算法来搜索告警数据集中的加权告警序列模式,并采用了一种新颖的剪枝策略来缩减需要搜索的数据集大小,从而提高算法效率。通过对移动通信网络真实告警数据分析的结果表明,该告警分析方法在剪枝效果、挖掘重要告警序列模式和执行效率方面都具有很好的性能。(3)设计了一种基于MapReduce框架的并行异常检测算法进行网络入侵检测。该算法针对局部异常因子(Local Outlier Factor,LOF)算法中重复点对局部异常因子(LOF值)的影响和计算复杂度高的不足,重新定义了k-邻近距离以避免某些重复点的LOF值无法计算的情况;同时将整个数据集逻辑地划分成若干个数据块,并利用MapReduce原理使得每个数据点的k-邻近距离和LOF值的计算仅在单个块中执行。然后,将每一个数据块中LOF值大于指定阈值的数据点合并后进一步更新其k-邻近距离和LOF值,得到最终异常数据。最后,通过对真实网络入侵数据的异常检测结果表明,该方法检测网络入侵的异常数据时在准确度、灵敏度和执行效率方面都有很大的优势。
朱樱[10](2019)在《数据挖掘技术研究及其在地灾系统中的应用》文中研究指明我国是一个地质灾害频繁发生的国家,常见的泥石流、滑坡、地面塌陷等灾害对社会的发展及人们的生命、财产安全造成了很大的威胁和隐患,因此推动了很多研究人员对地质灾害监测预警技术的研究。本文主要是对地质灾害监测系统中的历史数据进行分析、关联规则挖掘出有价值信息,以提高预测效果。在本文中,对传统的增量式关联规则挖掘FUP算法进行改进,使其满足地质灾害监测系统的历史数据挖掘。FUP算法存在一些不足:1)当统计项目集合频数时,需要频繁扫描数据库;2)当数据增新挖掘时,最小支持度阈值没有随着数据增新进行调整;3)对于挖掘出来的结果没有进行正相关性判断。在地质灾害监测系统中为了提高算法对历史数据关联规则挖掘的有效性,本文探讨了FUP算法在频繁项目集获取及挖掘过程中的优化问题,提出了一种基于倒排索引树的增量式FUP改进算法IIBTree-FUP(Improved FUP algorithm based on inverted index B-tree),主要研究工作如下:(1)在原始数据集上统计频数时,用树形结构来存储信息。本文选择用基于B+树实现的倒排索引树形结构来存储已经得到的项目集和频数,当数据增新时也只需要将新增数据信息添加到已有的树形结构中。(2)当数据增新时,运用牛顿插值公式对最小支持度阈值进行预估及调整,在一定程度上降低算法的时间复杂度和空间复杂度,使得挖掘出来的关联规则更具科学性。(3)对挖掘出来的关联规则进行正相关性分析,筛选得到有价值的规则以提高在系统预警模块中的实用性。改进的算法既能自适应的调整最小支持度阈值,又能减少对数据库的频繁扫描,在很大程度上提高了关联规则挖掘的科学性。将改进后的IIBTree-FUP算法应用于地灾监测系统的已有数据集中进行关联规则的挖掘,实验结果表明,IIBTree-FUP算法在频繁1项集获取过程中,时间及空间复杂度都有了明显的降低,并且得到正相关性的潜在关联规则。
二、相关性分析在关联规则挖掘中的应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、相关性分析在关联规则挖掘中的应用(论文提纲范文)
(1)基于兴趣挖掘的网络用户行为的分析与研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.2.3 存在的问题 |
1.3 本文的研究内容 |
1.4 论文组织结构 |
2 兴趣度关联规则与聚类分析概述 |
2.1 兴趣度关联规则 |
2.1.1 关联规则 |
2.1.2 兴趣度 |
2.1.3 关联规则的经典算法 |
2.2 聚类算法 |
2.2.1 聚类算法的评价标准 |
2.2.2 高维子空间聚类算法 |
2.3 本章小结 |
3 基于兴趣度融合模型的正负关联规则算法 |
3.1 兴趣度度量的提出 |
3.1.1 传统的关联规则挖掘算法 |
3.1.2 兴趣度度量的提出与分类 |
3.2 新的兴趣度度量融合模型 |
3.2.1 改进的客观兴趣度模型 |
3.2.2 融合主观兴趣度模型 |
3.3 基于兴趣度的正负关联规则算法 |
3.3.1 正负关联规则算法的研究 |
3.3.2 基于兴趣度融合模型的正负规则挖掘算法 |
3.3.3 实验结果与分析 |
3.4 本章小结 |
4 基于兴趣度和聚类的网络用户行为分析 |
4.1 网络用户数据来源 |
4.1.1 网络用户数据概述 |
4.1.2 本文的分析对象和数据源 |
4.2 数据预处理 |
4.3 高维子空间聚类算法在兴趣挖掘中的应用 |
4.3.1 clique聚类算法 |
4.3.2 改进的基于数据特征的DC-clique聚类算法 |
4.4 基于兴趣挖掘的网络用户行为分析 |
4.4.1 用户行为与作品时长和观看点的关系分析 |
4.4.2 用户行为与用户城市的关系分析 |
4.4.3 用户行为与音乐id的关系分析 |
4.5 本章小结 |
5 总结与展望 |
5.1 本文的研究内容总结 |
5.2 不足与展望 |
致谢 |
参考文献 |
附录 攻读硕士学位期间公开发表的学术论文 |
(2)基于气象条件与交通流交互作用的高速公路事故风险分析及预测(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究目的、研究范围与研究内容 |
1.2.1 研究目的 |
1.2.2 研究范围 |
1.2.3 研究内容 |
1.3 研究思路与技术路线 |
1.4 论文结构 |
2 理论方法与研究综述 |
2.1 风险管理理论 |
2.1.1 风险管理的含义 |
2.1.2 风险管理的目标 |
2.1.3 风险管理的一般程序 |
2.2 高速公路安全预警工作研究现状 |
2.3 高速公路事故风险识别研究现状 |
2.4 高速公路事故风险评估研究现状 |
2.5 高速公路事故风险预测研究现状 |
2.6 研究现状总结 |
3 基于关联规则挖掘的高速公路事故风险识别 |
3.1 概述 |
3.2 高速公路事故与风险因素关联规则简介 |
3.2.1 高速公路安全风险关联规则基本概念 |
3.2.2 关联规则筛选标准 |
3.2.3 高速公路事故与其风险因素之间关联规则分类 |
3.3 高速公路事故与风险因素加权关联规则 |
3.3.1 加权关联规则概述 |
3.3.2 加权关联规则权重确定方法 |
3.3.3 加权关联规则评价指标计算 |
3.4 高速公路事故与风险因素关联规则挖掘 |
3.4.1 Apriori关联规则挖掘算法 |
3.4.2 关联规则有效性检验 |
3.4.3 基于Apriori算法改进的多维多层AHP加权Top-k关联规则挖掘算法 |
3.5 实例分析 |
3.5.1 数据收集 |
3.5.2 数据处理 |
3.5.3 结果分析 |
3.6 本章小结 |
4 基于气象与交通流特征关联风险的高速公路安全状态评价 |
4.1 概述 |
4.2 基于随机森林算法的影响高速公路安全状态评价指标筛选 |
4.2.1 随机森林算法原理 |
4.2.2 变量筛选评价指标 |
4.2.3 随机森林算法筛选重要变量步骤 |
4.3 基于模糊k-prototypes算法的高速公路安全状态划分 |
4.3.1 算法描述 |
4.3.2 算法实现 |
4.4 基于贝叶斯Logistic回归的高速公路交通安全状态评估 |
4.5 实例分析 |
4.5.1 数据收集 |
4.5.2 数据处理 |
4.5.3 结果分析 |
4.6 本章小结 |
5 基于天气与交通流特征交互效应的高速公路事故风险预测 |
5.1 概述 |
5.2 天气特征与交通流动态特征的交互作用 |
5.2.1 变量交互作用介绍 |
5.2.2 数据收集与处理 |
5.2.3 模型估计结果分析 |
5.3 基于学习率自适应随机梯度提升算法的高速公路事故风险预测 |
5.3.1 集成学习概述 |
5.3.2 梯度提升算法 |
5.3.3 基于学习率自适应的随机梯度提升预测模型 |
5.4 实例分析 |
5.4.1 数据描述 |
5.4.2 结果分析 |
5.5 本章小结 |
6 研究结论及展望 |
6.1 主要研究结论 |
6.2 创新点 |
6.3 研究展望 |
参考文献 |
作者简历及攻读博士学位期间取得的研究成果 |
学位论文数据集 |
(3)通信网告警规则挖掘系统的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景及研究的目的和意义 |
1.2 国内外研究现状分析 |
1.2.1 告警相关性分析的国内外研究现状 |
1.2.2 关联分析国内外研究现状 |
1.2.3 大数据和数据流处理技术的国内外研究现状 |
1.2.4 故障告警相关性研究存在的问题 |
1.3 本文的主要研究内容和结构 |
1.3.1 本文的主要研究内容 |
1.3.2 本文的结构及章节安排 |
第2章 系统需求分析和关键技术 |
2.1 系统业务需求分析 |
2.2 系统功能需求分析 |
2.3 非功能性需求分析 |
2.4 关键技术 |
2.4.1 频繁模式分析技术 |
2.4.2 序列模式分析技术 |
2.4.3 Spark机器学习和流数据处理技术 |
2.5 本章小结 |
第3章 告警规则挖掘系统设计与实现 |
3.1 系统总体设计 |
3.1.1 系统架构设计 |
3.1.2 系统功能结构设计 |
3.1.3 系统数据库设计 |
3.1.4 系统部署设计 |
3.1.5 数据提取与预处理 |
3.2 用户管理模块设计与实现 |
3.3 算法配置与任务管理模块设计与实现 |
3.4 数据分析模块设计与实现 |
3.5 常规数据频繁模式算法分析模块设计与实现 |
3.5.1 Apriori算法实现 |
3.5.2 FP-Growth算法实现 |
3.5.3 模块设计与实现 |
3.6 常规数据序列模式算法分析模块设计与实现 |
3.6.1 Prefix Span算法实现 |
3.6.2 模块设计与实现 |
3.7 大数据频繁模式算法分析模块设计与实现 |
3.8 大数据序列模式算法分析模块设计与实现 |
3.9 流式数据告警规则挖掘分析模块设计与实现 |
3.10 本章小结 |
第4章 告警规则挖掘系统测试 |
4.1 模块测试 |
4.2 结果分析 |
4.2.1 FP-Growth算法分析结果 |
4.2.2 Prefix Span算法分析结果 |
4.3 非功能性需求测试 |
4.4 本章小结 |
结论 |
参考文献 |
致谢 |
个人简历 |
(4)基于数据挖掘技术的综合网管告警系统设计与实现(论文提纲范文)
中文摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外发展概况 |
1.2.1 数据挖掘技术发展与研究现状 |
1.2.2 告警相关性分析研究现状 |
1.3 本文研究的主要内容与章节安排 |
第2章 相关理论与关键技术 |
2.1 广电网络告警相关性分析 |
2.1.1 广电网络告警的生成与特点分析 |
2.1.2 告警相关性分析定义 |
2.1.3 告警相关性分析方法分类 |
2.1.4 告警相关性分析方法比较 |
2.2 数据挖掘技术 |
2.2.1 数据挖掘技术概述 |
2.2.2 数据挖掘过程 |
2.3 关联规则挖掘算法 |
2.3.1 关联规则挖掘的基本概念 |
2.3.2 几种典型的关联规则挖掘算法 |
2.4 本章小结 |
第3章 综合网管告警系统设计 |
3.1 项目开发背景与建设目标 |
3.2 系统总体设计 |
3.2.1 系统总体架构设计 |
3.2.2 系统功能框架设计 |
3.2.3 系统数据库设计 |
3.3 告警系统功能设计 |
3.3.1 告警数据采集 |
3.3.2 告警数据处理 |
3.3.3 告警信息呈现与管理 |
3.4 本章小结 |
第4章 告警相关性分析子系统设计与实现 |
4.1 告警相关性分析子系统概述 |
4.2 告警关联规则挖掘模块 |
4.2.1 告警数据预处理 |
4.2.2 告警关联规则挖掘算法实现过程 |
4.2.3 关联规则的后处理与分析 |
4.3 告警关联分析模块 |
4.3.1 告警关联分析模块设计与实现 |
4.3.2 告警关联分析处理方法分析 |
4.3.3 告警关联分析的实现流程 |
4.4 本章小结 |
第5章 系统测试与运行效果 |
5.1 系统测试及结果分析 |
5.1.1 测试环境 |
5.1.2 数据挖掘算法对比测试 |
5.1.3 告警呈现与查询测试 |
5.1.4 应用数据挖掘技术的告警相关性分析测试 |
5.2 系统主要功能运行效果展示 |
5.2.1 告警采集 |
5.2.2 实时告警 |
5.2.3 历史告警 |
5.2.4 关联告警 |
5.2.5 关联规则配置 |
5.2.6 告警重定义配置 |
5.2.7 告警生成配置 |
5.3 本章小结 |
结论 |
参考文献 |
致谢 |
攻读学位期间学术成果 |
(5)基于电信网管告警数据分析的网络故障预测研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 主要研究内容 |
1.3 论文结构安排 |
第二章 告警相关性分析及故障预测研究综述 |
2.1 电信网络告警及故障管理 |
2.1.1 电信网络管理及特点 |
2.1.2 告警和故障的概念及特点 |
2.1.3 告警分析与故障预测的难点及基本步骤 |
2.2 告警数据相关性分析 |
2.2.1 告警数据相关性分析方法 |
2.2.2 告警数据相关性分析研究现状 |
2.3 网络故障预测 |
2.3.1 网络故障预测方法 |
2.3.2 网络故障预测研究现状 |
2.4 本章小结 |
第三章 告警数据相关性分析 |
3.1 告警数据相关性分析的问题分析 |
3.1.1 问题描述 |
3.1.2 告警数据相关性分析整体流程 |
3.2 基于序列模式挖掘的告警相关性分析 |
3.2.1 基于网络拓扑结构的K-MNT聚类算法 |
3.2.2 动态滑动时间窗口 |
3.2.3 基于PrefixSpan算法的序列模式挖掘 |
3.3 性能验证与分析 |
3.4 本章小结 |
第四章 基于告警相关性分析的网络故障预测 |
4.1 告警-故障关联数据的统计分析 |
4.2 网络故障预测集成模型 |
4.2.1 问题描述 |
4.2.2 网络故障预测集成模型的设计 |
4.2.3 网络故障预测集成模型的搭建及特点 |
4.3 性能验证与分析 |
4.3.1 模型评估指标 |
4.3.2 实验参数设置 |
4.3.3 实验结果分析 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 论文工作总结 |
5.2 未来工作展望 |
参考文献 |
缩略语 |
致谢 |
(6)考虑需求相关性的电商物流网络库存分配策略研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 国内外研究现状 |
1.3.1 考虑需求相关性的库存分配问题 |
1.3.2 考虑时间周期的库存分配问题 |
1.3.3 结合数据挖掘的库存分配问题 |
1.3.4 研究现状总结 |
1.4 研究方法 |
1.5 研究内容 |
第二章 J电商物流网络分析 |
2.1 J电商企业概述 |
2.2 J电商物流网络结构 |
2.3 数据获取及处理 |
2.3.1 数据获取 |
2.3.2 产品筛选 |
2.3.3 需求拟合 |
2.3.4 数据预处理 |
2.3.5 数据转换 |
2.4 本章小结 |
第三章 需求相关性分析 |
3.1 关联规则挖掘理论概述 |
3.1.1 基本概念 |
3.1.2 关联规则挖掘分类 |
3.1.3 关联规则挖掘算法 |
3.2 Apriori关联规则算法 |
3.3 关联规则提取 |
3.4 需求相关性定义 |
3.5 本章小结 |
第四章 考虑需求相关性的单周期库存分配策略研究 |
4.1 问题定义 |
4.2 模型构建 |
4.3 算例求解 |
4.4 不同参数对库存分配策略的影响 |
4.4.1 置信度阈值对库存分配策略的影响 |
4.4.2 需求波动性对库存分配策略的影响 |
4.4.3 服务水平对库存分配策略的影响 |
4.5 本章小结 |
第五章 考虑需求相关性的多周期库存分配策略研究 |
5.1 问题定义 |
5.2 模型构建 |
5.3 算例求解 |
5.4 不同参数对库存分配策略的影响 |
5.4.1 单周期和多周期对库存分配策略的影响 |
5.4.2 置信度对库存分配策略的影响 |
5.4.3 需求波动性对库存分配策略的影响 |
5.4.4 服务水平对库存分配策略的影响 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 文章总结 |
6.2 研究展望 |
参考文献 |
附录1 需求相关性规则 |
致谢 |
攻读硕士学位期间已发表或录用的论文 |
(7)基于文本挖掘的折叠电动自行车用户需求研究(论文提纲范文)
摘要 |
ABSTRACT |
字母注释表 |
第一章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 文本挖掘相关技术研究现状 |
1.2.2 产品特征提取相关研究现状 |
1.2.3 情感分析相关研究现状 |
1.2.4 文本挖掘在用户研究中的应用现状 |
1.2.5 国内外研究存在问题 |
1.3 相关概念研究 |
1.3.1 产品设计与用户研究 |
1.3.2 文本挖掘与情感分析 |
1.4 研究内容与方法 |
1.4.1 研究内容 |
1.4.2 研究方法 |
1.5 论文结构框架 |
1.6 本章小结 |
第二章 基于用户体验过程的文本挖掘用户需求识别框架 |
2.1 基于用户体验过程的用户需求识别研究 |
2.1.1 基于体验层次的用户体验过程分析 |
2.1.2 基于用户体验过程的影响因素分析 |
2.1.3 基于用户体验过程的用户需求识别模型构建 |
2.2 基于用户体验过程的文本挖掘用户需求分析框架构建 |
2.3 在线评论文本挖掘技术与数据分析方法研究 |
2.3.1 文本挖掘开发工具 |
2.3.2 文本预处理技术方法 |
2.3.3 文本情感分析方法 |
2.3.4 关联规则挖掘方法 |
2.4 本章小结 |
第三章 在线产品评论数据准备与领域本体知识词库构建 |
3.1 在线产品评论数据准备 |
3.1.1 实验环境与数据采集 |
3.1.2 文本预处理 |
3.2 领域本体知识词库构建 |
3.2.1 折叠电动自行车领域本体结构构建 |
3.2.2 领域本体知识词库构建 |
3.3 产品特征属性分级词表建立 |
3.4 本章小结 |
第四章 基于情感分析的产品特征属性挖掘研究 |
4.1 基于情感分析的产品特征属性挖掘方法 |
4.2 特征属性标签匹配 |
4.3 情感极性分析 |
4.4 “特征-情感”映射与数据可视化分析 |
4.4.1 基于特征提及频次的“特征-情感”映射分析 |
4.4.2 基于评论用户的“特征-情感”映射分析 |
4.5 本章小结 |
第五章 基于用户体验过程的产品特征属性偏好关联规则挖掘与评估 |
5.1 基于用户体验过程的产品特征属性偏好关联规则挖掘方法 |
5.2 基于用户体验过程的“用户-场景-产品”相关性分析 |
5.2.1 “用户-场景-产品”特征相关性分析数据准备 |
5.2.2 相关性分析指标和方法 |
5.2.3 “用户-场景-产品”特征相关性分析结果 |
5.3 基于用户体验过程的产品特征属性偏好关联规则挖掘 |
5.3.1 关联规则挖掘数据准备与规则设定 |
5.3.2 “用户-场景”与产品特征属性的偏好挖掘与分析 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 研究总结与结论 |
6.2 研究创新点 |
6.3 研究展望 |
参考文献 |
附录 |
发表论文和参加科研情况说明 |
致谢 |
(8)工业过程参数与故障相关性分析的量化关联规则挖掘研究(论文提纲范文)
中文摘要 |
英文摘要 |
1 绪论 |
1.1 研究背景及意义 |
1.2 工业过程参数与故障的相关性 |
1.3 关联规则研究现状 |
1.3.1 关联规则相关概念 |
1.3.2 关联规则形式的扩展 |
1.3.3 关联规则挖掘方法 |
1.4 关联规则在相关性分析中的应用 |
1.5 本文的内容与结构 |
2 工业过程参数与故障的相关性分析 |
2.1 参数与故障相关性分析模型 |
2.1.1 模型建立 |
2.1.2 问题分析 |
2.1.3 参数离散化 |
2.1.4 故障规则挖掘 |
2.2 典型的量化关联规则挖掘算法 |
2.2.1 基于聚类的量化关联规则挖掘算法MAQA |
2.2.2 基于模糊理论的量化关联规则挖掘算法FARMA |
2.2.3 典型算法在参数与故障相关性分析中的问题 |
2.3 参数与故障相关性分析中的量化关联规则挖掘模型 |
2.3.1 参数与故障相关性分析中的量化关联规则概念 |
2.3.2 参数与故障相关性分析中的量化关联规则挖掘步骤 |
2.4 本章小结 |
3 基于密度ISODATA聚类的缓变参数离散化 |
3.1 ISODATA聚类算法 |
3.2 基于密度的ISODATA聚类 |
3.3 基于密度ISODATA聚类的缓变参数离散化算法实现 |
3.4 本章小结 |
4 基于约束优化矩阵的故障规则挖掘 |
4.1 基于矩阵的关联规则挖掘算法 |
4.2 约束优化矩阵的改进方向 |
4.2.1 矩阵结构 |
4.2.2 挖掘过程 |
4.2.3 基于约束的关联规则 |
4.3 基于约束优化矩阵的故障规则挖掘算法实现 |
4.4 本章小结 |
5 实验与仿真 |
5.1 TE过程介绍 |
5.1.1 TE过程工艺流程 |
5.1.2 过程变量和故障 |
5.1.3 故障数据集获取 |
5.2 TE过程参数与故障相关性分析的量化关联规则挖掘 |
5.2.1 缓变参数离散化 |
5.2.2 故障数据集布尔化 |
5.2.3 故障规则挖掘 |
5.2.4 故障规则反布尔化 |
5.3 TE过程参数与故障相关性实验的结果分析 |
5.4 本章小结 |
6 总结与展望 |
6.1 论文研究总结 |
6.2 论文研究展望 |
参考文献 |
附录 |
A. 作者在攻读硕士学位期间发表的论文目录 |
B. 作者在攻读硕士学位期间参与的科研项目目录 |
C. 作者在攻读硕士学位期间取得的奖学金和荣誉 |
D. 学位论文数据集 |
致谢 |
(9)移动通信网络运行数据处理与分析(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 告警相关性分析方法 |
1.2.2 基于异常检测的网络入侵检测方法 |
1.3 论文主要工作 |
第二章 数据挖掘中相关算法分析 |
2.1 数据挖掘 |
2.2 关联规则挖掘算法 |
2.2.1 关联规则挖掘算法相关概念 |
2.2.2 经典关联规则挖掘算法 |
2.3 序列模式挖掘算法 |
2.3.1 序列模式挖掘算法相关概念 |
2.3.2 经典序列模式挖掘算法 |
2.4 异常检测算法 |
2.4.1 异常检测算法类别概述 |
2.4.2 经典无监督异常检测算法 |
2.5 本章小结 |
第三章 通信网络告警数据特征研究 |
3.1 移动通信系统基本网络结构 |
3.2 网络故障和告警 |
3.3 移动通信网络告警特征分析 |
3.3.1 告警数据格式 |
3.3.2 告警数据分类及特点 |
3.4 告警预处理 |
3.5 本章小结 |
第四章 基于加权的告警分析方法研究 |
4.1 引言 |
4.2 基于熵值法的告警权重设计 |
4.2.1 熵值法的相关概念 |
4.2.2 告警权重的设计方法 |
4.3 加权告警序列模式挖掘算法(WASP算法)设计 |
4.3.1 WASP算法的相关概念定义 |
4.3.2 WASP算法的算法模型和剪枝策略 |
4.3.3 WASP算法流程及算法分析 |
4.4 实验结果与性能分析 |
4.4.1 实验数据集 |
4.4.2 实验评估 |
4.5 结论 |
第五章 并行异常检测算法研究 |
5.1 引言 |
5.2 Hadoop技术 |
5.2.1 Hadoop MapReduce |
5.2.2 Hadoop HDFS |
5.3 基于MapReduce的并行异常检测算法(MR-DLOF算法)设计 |
5.3.1 MR-DLOF算法的概念定义 |
5.3.2 MR-DLOF算法思想及流程 |
5.4 实验结果与分析 |
5.4.1 实验平台及数据集 |
5.4.2 实验评估 |
5.5 结论 |
第六章 工作总结和研究展望 |
6.1 工作总结 |
6.2 研究展望 |
参考文献 |
致谢 |
作者简介 |
(10)数据挖掘技术研究及其在地灾系统中的应用(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 课题研究的背景 |
1.2 地质灾害监测系统数据挖掘的意义 |
1.3 数据挖掘 |
1.3.1 数据挖掘步骤 |
1.3.2 数据挖掘的发展历程 |
1.3.3 数据挖掘功能 |
1.3.4 数据挖掘的任务 |
1.4 关联规则 |
1.4.1 关联规则的相关概念 |
1.4.2 关联规则的挖掘步骤 |
1.4.3 关联规则挖掘分类 |
1.4.4 关联规则的一般性问题 |
1.5 关联规则的国内外研究现状 |
1.6 课题研究的主要内容 |
1.7 论文组织结构 |
1.8 本章小结 |
2 数据挖掘关联规则算法分析 |
2.1 Apriori算法 |
2.1.1 Apriori算法基本思想 |
2.1.2 Apriori算法的性质 |
2.1.3 Apriori算法基本流程 |
2.1.4 Apriori算法缺点分析 |
2.2 增量更新关联规则的挖掘过程 |
2.3 传统FUP关联规则挖掘算法 |
2.3.1 FUP算法概述 |
2.3.2 FUP算法基本思想 |
2.3.3 FUP算法详述 |
2.3.4 FUP算法缺点分析 |
2.3.5 FUP算法流程图 |
2.4 FP-Growth算法 |
2.4.1 FP-Growth算法的基本思想 |
2.4.2 FP-Growth算法的基本流程 |
2.4.3 FP-Growth算法的缺点分析 |
2.5 本章小结 |
3 一种改进的数据挖掘关联算法IIBTree-FUP |
3.1 FP-Growth算法的改进 |
3.1.1 改进FP-Growth算法的基本思路 |
3.1.2 改进FP-Growth算法描述 |
3.2 阈值的设置 |
3.2.1 牛顿插值公式基本理论 |
3.2.2 阈值的牛顿插值公式推导 |
3.2.3 牛顿插值公式实现阈值的具体步骤 |
3.3 关联规则相关性分析 |
3.4 IIBTree-FUP算法 |
3.4.1 IIBTree-FUP算法实现步骤 |
3.4.2 IIBTree-FUP算法实现流程图 |
3.5 本章总结 |
4 实验与结果分析 |
4.1 实验数据 |
4.2 实验环境 |
4.3 初始参数设置 |
4.4 强关联规则的评判标准 |
4.5 实验内容和结果分析 |
4.6 本章小结 |
5 IIBTree-FUP算法在地质灾害监测系统中的应用 |
5.1 地质灾害监测系统中数据挖掘技术的意义 |
5.2 地质灾害监测系统中数据对象的选取与预处理 |
5.2.1 数据对象的选取 |
5.2.2 数据对象的预处理 |
5.2.3 地质灾害监测系统历史数据的预处理 |
5.3 IIBTree-FUP算法在地质灾害数据上的挖掘 |
5.3.1 规则的挖掘形式 |
5.3.2 候选项集维数的确定 |
5.3.3 频繁项集的获取 |
5.3.4 算法的最小支持度阈值设置 |
5.3.5 规则结果的分析及评价 |
5.4 传统FUP算法与IIBTree-FUP算法实验对比 |
5.5 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 以后要研究的方向 |
参考文献 |
攻读硕士学位期间发表的论文 |
致谢 |
四、相关性分析在关联规则挖掘中的应用(论文参考文献)
- [1]基于兴趣挖掘的网络用户行为的分析与研究[D]. 徐林. 西安科技大学, 2021(02)
- [2]基于气象条件与交通流交互作用的高速公路事故风险分析及预测[D]. 于帅. 北京交通大学, 2020(03)
- [3]通信网告警规则挖掘系统的设计与实现[D]. 李鹏. 哈尔滨工业大学, 2020(01)
- [4]基于数据挖掘技术的综合网管告警系统设计与实现[D]. 刘云豪. 黑龙江大学, 2020(04)
- [5]基于电信网管告警数据分析的网络故障预测研究[D]. 陈颖. 北京邮电大学, 2020(05)
- [6]考虑需求相关性的电商物流网络库存分配策略研究[D]. 宋富强. 上海交通大学, 2020(01)
- [7]基于文本挖掘的折叠电动自行车用户需求研究[D]. 薛水晶. 天津大学, 2019(01)
- [8]工业过程参数与故障相关性分析的量化关联规则挖掘研究[D]. 钟雨洋. 重庆大学, 2019(01)
- [9]移动通信网络运行数据处理与分析[D]. 胡秋秋. 西安电子科技大学, 2019(02)
- [10]数据挖掘技术研究及其在地灾系统中的应用[D]. 朱樱. 西安工业大学, 2019(03)