Xmind8 update6版本破解版
该Xmind 8 update6版本破解版是非常辛苦才找到的,里面包含软件、证书和安装说明,分享给大家!
数据分析师必备的python编程基础知识
该文档是根据网络资源整理而成,全本只有22页,知识点言简意赅,可以用于快速python入门。
《机器学习实战》 ——思维导图
本资源是经典机器学习教材《机器学习实战》的各章节机器学习思维导图(可编辑源文件)、图片版本和整本书的PDF打印版本文件。附赠吴恩达课程思维导图。
《机器学习实战》[美]Peter Harrington著 ——思维导图
机器学习是人工智能研究领域中的一个极其重要的方向。在现今大数据时代的背景下捕获数据并从中萃取有价值的信息或模式使得这一过去为分析师与数学家所专属的研究领域越来越为人们瞩目。本书通过精心排的实例切入日常工作任务摒弃学术化语言利用高效可复用的Python 代码阐释如何处理统计数据进行数据分析及可视化。读者可从中学到一些核心的机器学习算法并将其运用于某些策略性任务中如分类、预测及推荐等。本书适合机器学习相关研究人员及互联网从业人员学习参考。
IBMSPSS Modeler18.0 解决方案部署(中文).pdf
IBMSPSS Modeler18.0 解决方案部署(中文).pdf 官方帮助文档 实用权威
IBM SPSS Modeler Source、Process和Output节点(中文).pdf
IBM SPSS Modeler Source、Process和Output节点(中文).pdf
IBM SPSS Modeler Server18.0 管理与性能指南(中文).pdf
IBM SPSS Modeler Server18.0 管理与性能指南(中文).pdf 官方中文帮助文档,实用权威
IBM SPSS Modeler Entity Analytics 18.0 用户指南(中文).pdf
IBM SPSS Modeler Entity Analytics 18.0 用户指南(中文).pdf 官方中文帮助文档,实用权威
IBM SPSS Modeler CRISP-DM指南(中文).pdf
IBM SPSS Modeler CRISP-DM指南(中文).pdf 官方中文帮助文档 实用权威
IBM SPSS Modeler 18.0 中文用户指南.pdf
IBM SPSS Modeler 18.0 中文用户指南.pdf,官方中文帮助文档 实用权威
IBM SPSS Modeler 18.0 数据库内挖掘指南(中文).pdf
IBM SPSS Modeler 18.0 数据库内挖掘指南(中文).pdf 官方中文帮助文档,实用权威
IBM SPSS Modeler 18.0 批处理用户指南(中文).PDF
IBM SPSS Modeler 18.0 批处理用户指南(中文)官方中文帮助文档 使用权威
IBM SPSS Modeler 18.0 Python脚本编制和自动化指南(中文)
IBM SPSS Modeler 18.0 Python脚本编制和自动化指南(中文),官方帮助文档,实用权威
IBM SPSS Modeler 18.0 部署指南(中文)
IBM SPSS Modeler 18.0 部署指南(中文),官方指南,实用权威
IBM SPSS Modeler 18.0 程序应用指南(中文)
IBM SPSS Modeler 18.0 程序应用指南(中文),官方中文指南,实用权威
数据挖掘导论(完整版)PPT及课后习题答案
数据挖掘导论 完整版 Introduction to Data Mining
陈封能,斯坦巴赫,库玛尔 著,范明,范宏建 等 译
详解数据挖掘概念与技术 为数据化运营实战打好基础 信息管理专家 科技作家涂子沛倾情推荐 带你进入真正的大数据时代
《RapidMiner数据分析与挖掘实战》第20章 航空公司客户价值分析
信息时代的来临使得企业营销焦点从产品中心转变为客户中心,客户关系管理成为企业的核心问题。客户关系管理的关键问题是客户分类,通过客户分类,区分无价值客户、高价值客户,企业针对不同价值的客户制定优化的个性化服务方案,采取不同营销策略,将有限营销资源集中于高价值客户,实现企业利润最大化目标。准确的客户分类结果是企业优化营销资源分配的重要依据,客户分类越来越成为客户关系管理中亟待解决的关键问题之一。
《RapidMiner数据分析与挖掘实战》第19章 电力窃漏电用户自动识别
传统的防窃漏电方法主要通过定期巡检、定期校验电表、用户举报窃电等手段来发现窃电或计量装置故障。但这种方法对人的依赖性太强,抓窃查漏的目标不明确。目前很多供电局主要通过营销稽查人员、用电检查人员和计量工作人员利用计量异常报警功能和电能量数据查询功能开展用户用电情况的在线监控工作,通过采集电量异常、负荷异常、终端报警、主站报警、线损异常等信息,建立数据分析模型,来实时监测窃漏电情况和发现计量装置的故障。根据报警事件发生前后客户计量点有关的电流、电压、负荷数据情况等,构建基于指标加权的用电异常分析模型,实现检查客户是否存在窃电、违章用电及计量装置故障等。
《RapidMiner数据分析与挖掘实战》第18章 异常检测
离群点检测是数据挖掘中重要的一部分,它的任务是发现与大部分其他对象显著不同的对象。大部分数据挖掘方法都将这种差异信息视为噪声而丢弃,然而在一些应用中,罕见的数据可能蕴含着更大的研究价值。
《RapidMiner数据分析与挖掘实战》第17章 宏、循环和数据集处理
经过前面几章的学习,我们已经知道了数据挖掘的基本流程,在真实的数据挖掘工作中,算法模型的建立所许付出的时间只占一小部分,数据的清洗、转换、加工部分往往占据很大一部分,在这一章中,我们将在学习前面数据处理的基础上,详细介绍数据集处理的高级部分。
《RapidMiner数据分析与挖掘实战》第16章 时间序列
拿到一个观察值序列后,首先要对它的纯随机性和平稳性进行检验,这两个重要的检验称为序列的预处理。根据检验结果可以将序列分为不同的类型,对不同类型的序列会采取不同的分析方法。
对于纯随机序列,又叫白噪声序列,序列的各项之间没有任何相关关系,序列在进行完全无序的随机波动,可以终止对该序列的分析。白噪声序列是没有信息可提取的平稳序列;
《RapidMiner数据分析与挖掘实战》第15章 模型评估与优化
如何评估判断某个挖掘算法对挖掘分析预测结果的准确性影响?
对某一个业务数据集进行预测时,如何在多个可选的挖掘模型之间选择最佳模型?为什么选择模型A,而不是模型B?凭经验?还是。。。各个模型的特性指标能否横向可视化对比?
系统能否从多个可选模型中自动为我们推荐一个最好的模型算法?
某个预测模型的最佳挖掘算法选定后,还能否基于该算法进行更深入的调优?调优方法有哪些?
在保证预测准确性的同时,能否提高挖掘流程执行的速度?
《RapidMiner数据分析与挖掘实战》第14章 推荐系统
在学习完本节课后,您应能够:
解释什么是推荐系统、如何使用推荐系统。
识别推荐系统挖掘可能采取的数据格式,以便进行推荐系统构建。
在 RapidMiner 中开发推荐系统。
《RapidMiner数据分析与挖掘实战》第12章 文本挖掘
本章介绍文本分类。由于大部分交流信息以文本格式保存,文本分类是文本挖掘中的一个重要主题。我们将建立一个RapidMiner挖掘流程,来学习垃圾短信和我们实际想阅读的短信之间的区别。然后我们将应用此学习到的模型到新的短信中,来确定其是否为垃圾短信。垃圾短信是许多熟悉主题中的一种,自然地,我们由此就开始动手工作。用于垃圾短信分类的相同的技术可以在许多其他文本挖掘领域中使用。
《RapidMiner数据分析与挖掘实战》第11章 决策树与神经网络
决策树方法在分类、预测、规则提取等领域有着广泛应用。在20世纪70年代后期和80年代初期,机器学习研究者J.Ross Quinilan提出了ID3[5-2]算法以后,决策树在机器学习、数据挖掘邻域得到极大的发展。Quinilan后来又提出了C4.5,成为新的监督学习算法。1984年几位统计学家提出了CART分类算法。ID3和ART算法大约同时被提出,但都是采用类似的方法从训练样本中学习决策树。
《RapidMiner数据分析与挖掘实战》第10章 线性回归与逻辑回归
回归分析是通过建立模型来研究变量之间相互关系的密切程度、结构状态及进行模型预测的一种有效工具,在工商管理、经济、社会、医学和生物学等领域应用十分广泛。从19世纪初高斯提出最小二乘估计算起,回归分析的历史已有200多年。从经典的回归分析方法到近代的回归分析方法,按照研究方法划分,回归分析研究的范围大致如下:
《RapidMiner数据分析与挖掘实战》第9章 K-Means 聚类、辨别分析
与分类不同,聚类分析是在没有给定划分类别的情况下,根据数据相似度进行样本分组的一种方法。与分类模型需要使用有类标记样本构成的训练数据不同,聚类模型可以建立在无类标记的数据上,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度将他们划分为若干组,划分的原则是组内样本最小化而组间(外部)距离最大化,如图9 1所示。
《RapidMiner数据分析与挖掘实战》第8章 关联分析与关联规则
关联规则分析是数据挖掘中最活跃的研究方法之一,目的是在一个数据集中找出各项之间的关联关系,而这种关系并没有在数据中直接表示出来。
8.1.1 常用关联规则算法
常用关联算法如所表8 1所示。
《RapidMiner数据分析与挖掘实战》第7章 数据预处理
在数据挖掘中,海量的原始数据中存在着大量不完整(有缺失值)、不一致、有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据清洗就显得尤为重要,数据清洗完成后接着进行或者同时进行数据集成、转换、规约等一系列的处理,该过程就是数据预处理。数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具。统计发现,在数据挖掘的过程中,数据预处理工作量占到了整个过程的60%。
数据预处理的主要内容包括数据清洗,数据集成,数据变换和数据规约。处理过程如图7 1所示。
《RapidMiner数据分析与挖掘实战》第6章 数据探索
根据观测、调查收集到初步的样本数据集后,接下来要考虑的问题是:样本数据集的数量和质量是否满足模型构建的要求?有没有出现从未设想过的数据状态?其中有没有什么明显的规律和趋势?各因素之间有什么样的关联性?
通过检验数据集的数据质量、绘制图表、计算某些特征量等手段,对样本数据集的结构和规律进行分析的过程就是数据探索。数据探索有助于选择合适的数据预处理和建模方法,甚至可以完成一些通常由数据挖掘解决的问题。
本章从数据质量分析和数据特征分析两个角度对数据进行探索。
《RapidMiner数据分析与挖掘实战》第5章 数据管理:资源库
表格,数据,文本集,日志,网址,测量值---这些以及其它类似的信息是每一个数据挖掘流程在一开始就要用到的。准备好的数据会被转化并合并,最后您会得到一个新的或是以不同方式显示出来的数据、模型或报告。在这一章我们会为您介绍如何用RapidMiner Studio处理这些信息。
《RapidMiner数据分析与挖掘实战》第4章 数据和结果可视化
前面的部分中,我们已经看到了RapidMiner Studio图形用户界面是如何建立起来的,以及如何用它来定义和执行分析流程。在流程的最后,流程结果会显示在结果视图中。现在在工具栏上点击一下就能跳转到结果视图了。这一章会详细阐述结果视图。依据您是否已经生成了可被描述的结果,在默认设置前提下,您现在应该至少能大致看到这些显示内容,如图4.1所示。
《Rapidminer数据分析与挖掘实战(中文版)》第2章 RapidMiner简介 Word版
第2章 RapidMiner Studio简介
RapidMiner Studio 结合技术性和适用性,为最新的及已建立的人性化数据挖掘技术提供服务。通过推拽算子,设置参数及组合算子,在RapidMiner Studio中定义分析流程。
《RapidMiner数据分析与挖掘实战(中文版)》第1章 数据挖掘基础Word版
基础篇
第1章 数据挖掘基础
1.1 某知名连锁餐饮企业的困惑
国内某餐饮连锁有限公司(以下简称T餐饮)成立于1998年,主要经营粤菜,兼顾湘菜、川菜、中餐等综合菜系。至今已经发展成为在国内具有一定知名度、美誉度,多品牌、立体化的大型餐饮连锁企业。属下员工1000多人,拥有16家直营分店,经营总面积近13000平方米,年营业额近亿元。其旗下各分店均坐落在繁华市区主干道,雅致的装潢,配之以精致的饰品、灯具、器物,出品精美,服务规范。
Hadoop集群(第12期副刊)_Hbase性能优化
Hadoop集群(第12期副刊)
——HBase性能优化
1、从配置角度优化
1.1 修改Linux配置
Linux系统最大可打开文件数一般默认的参数值是1024,如果你不进行修改并发量上来的时候会出现“Too Many Open Files”的错误,导致整个HBase不可运行,你可以用ulimit -n 命令进行修改,或者修改/etc/security/limits.conf 和/proc/sys/fs/file-max的参数,具体如何修改可以去Google 关键字“linux limits.conf ”
细细品味Hadoop(Hadoop安装及配置)
一、集群网络环境介绍
集群包含三个节点:1 个namenode,2 个datanode,节点之间局域网连接,
可以相互ping 通。节点IP 地址分布如下:
Namenode: zhangpeng@192.168.90.91
Datanode1: zhangruixue@192.168.90.94
Datanode2: guanxiansun@192.168.90.205