自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Jason的专栏

大数据分析技术跟踪,分析和评论

  • 博客(18)
  • 资源 (1)
  • 收藏
  • 关注

转载 大数据与数据挖掘的相对绝对关系

(文/David J. TenenBaum)泄密者爱德华·斯诺登(Edward Snowden)还在寻求容身之所的时候,美国国家安全局(NSA)全方位收集电话和电子邮件记录之事经过他的披露,已经引发了不安和愤怒。奥巴马当局声称,监听数据带来了安全,然而左翼和右翼都在谴责这种窥探行为是对隐私的侵犯。数据不是信息,而是有待理解的原材料。但有一件事是确定无疑的:当NSA为了从其海量数据中“挖掘”

2014-10-26 20:39:03 3014

转载 “量化风投”:用数据挖掘潜在项目

引自:ITONGJI.CN本文由汤森路透中国区数据和产品业务部总监刘欣推荐6月2日消息,对于硅谷风投来说,YCombinator等创业孵化器的“展示日”(DemoDay)是发掘“潜力股”的必经途径,但是如今的科技创投领域正在悄然发生变化,如果只是坐等“展示日”就会错失良机,因为越来越多风投机构开始借助数据专家的力量进行前瞻性的量化分析,从而提早发现“潜力股”。科技博客网站TechC

2014-10-26 20:34:09 1143

转载 如何根据变量类型选择数据分析方法?

面对大量数据,你将如何开展数据分析?您会选择什么样的数据分析方法呢?您是否看着数据感到迷茫,无所适从。认真读完这篇文章,或许你将有所收获。把握两个关键         1、抓住业务问题不放松。您费大力气收集数据的动机是什么?你想解决什么问题?这是核心,是方向,这是业务把握层面。         2、全面理解数据。哪些变量,什么类型?适合或者可以用什么统计方法,这是数据分析技

2014-10-21 23:18:17 1415

转载 常见数据挖掘分析方法介绍

下面介绍十种数据挖掘(Data Mining)的分析方法,以便于大家对模型的初步了解,这些都是日常挖掘中经常遇到的算法,希望对大家有用!(甚至有数据挖掘公司,用其中的一种算法就能独步天下)

2014-10-21 23:14:06 2540

转载 数据可视化工具选型指南

引自TableauTableau Desktop是Tableau公司开发的桌面系统中最简单的商业智能工具软件,Tableau没有强迫用户编写自定义代码,新的控制台也可完全自定义配置。在控制台上,不仅能够监测信息,而且还提供完整的分析能力。Tableau控制台灵活,具有高度的动态性。Table

2014-10-20 22:36:04 1444

转载 22个免费的数据可视化和分析工具推荐

本文总结推荐22个免费的数据可视化和分析工具。列表如下:  数据清理(Data cleaning)  当你分析和可视化数据前,常需要“清理”工作。比如一些输入性列表“New York City" ,同时其他人会说"New York, NY" 。因此你需要标准化这些工作,使看到统一的样式。下面的两个工具被用来帮助使数据处于最佳的状态。  1、DataWrangler 

2014-10-20 21:09:40 1202 1

原创 数据分析在线学习网站推荐

https://www.coursera.org/https://www.udacity.com/Coursera课程如此富有成效的原因与斯坦福教授Andrew Ng的治学理念密不可分。Ng认为这与自己在硅谷的氛围有关,如果不是与硅谷最优秀科学家们的紧密交流,Coursera的课程不可能如此成功。此外,Ng的课程侧重实际应用,在解决实际问题的过程中学习技术,他将更多的时间花

2014-10-20 20:36:16 1577

转载 数据挖掘案例:建立客户流失模型

随着市场竞争的加剧,中国电信面临的压力越来越大,客户流失也日益增大。从统计数据看,今年固话小灵通的销户数已经超过了开户数。面对如此严峻的市场形式,当务之急就是要尽全力减少客户的流失。因此,利用数据挖掘方法,建立一套可以及时预测客户流失率的模型就相当有必要。    (一)确定客户流失模型的目标:预测可能流失的客户名单。经过对市场的分析,我们发现固话小灵通流失率比较大,而宽带等数据业务还处于增

2014-10-20 20:32:59 8560

转载 大数据金融行业企业应用几点思考

一、数据挖掘的价值体现  任何数据分析或者挖掘的项目都不会直接产生经济价值和意义,分析出的数据结果既不能给企业直接带来一个客户,也不能帮助企业卖出一件产品。数据分析的价值体现在于业务部门根据分析结果制定相关的经营策略并贯彻执行。二、大数据之困-通道  大数据之困-如何打通底层数据存储到上层数据服务的通道问题,讲成为制约大数据发展的关键因素。当越来越多的人意识到大数据的未来在

2014-10-19 14:46:05 1095

转载 数据挖掘与数据建模的9个经验之谈

数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识。当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平台发展的支撑下适合商业分析的一种形式。也许是因为数据挖掘源于实践而非 理论,在其过程的理解上不太引人注意。20世纪90年代晚期发展的CRISP-DM,逐渐成为数据挖掘过程的一种标准化过程,被越来越多的数

2014-10-19 14:43:35 6126

转载 数据分析和用户研究

转自:itongji

2014-10-19 14:40:16 1637

转载 解决数据质量问题是大数据应用的关键

研究称,整个人类文明所获得的全部数据量,有90%是最近两年内产生的。随着移动互联大潮的席卷,预计通过网路产生的数据量还将呈几何级增长。庞大的数据资源蕴藏着无限的宝藏,过去的一年无论是企业、政府还是媒体,都在谈论大数据。有人说大数据是黄金、是竞争力,然而在这一切谈论的背后却鲜有人关注数据质量这个最根本的问题。普元数据产品总监王轩认为,大数据处理的关键就是解决数据质量问题,规避数据错误、保障数据质量才

2014-10-19 14:32:36 4014

转载 如何对建模型数据进行预处理

当今现实世界的数据极易受噪声,丢失数据和不一致数据的侵扰,低质量的数据将导致低质量的挖掘结果,数据预处理技术可以提高数据质量,从而提高数据挖掘结果的质量和性能。数据预处理的方法主要有如下三种:数据清理、数据集成与变换、数据归约。数据清理例程通过填写缺失值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。分析中往往包含来自多个数据源的数据,这涉及集成多个数据库、数据立方体或文件,即数据集

2014-10-19 11:43:16 3373

转载 大数据玩家eBay:猜出你的购买欲

在网络世界,数据就是金钱。        毫无疑问,eBay拥有的数据量是惊人的。其每天都要处理100PB的数据,其中包括50TB的机器数据。可以说,eBay每天都面临着天文数字般的大数据挑战。        早在2006年,eBay就成立了大数据分析平台。为了准确分析用户的购物行为,eBay定义了成百上千种类型的数据,并以此对顾客的行为进行跟踪分析。然而,这同时也为eBay带来了

2014-10-19 11:38:42 518

转载 数据分析师必懂的10种分析思维

一、逻辑思维逻辑思维即明白价值链,明白各项数据中的关系; 该方法的关键在于明白其中的关系要求你对这项工作要了解、熟悉,要细致和慎密,要清楚充分性和必要性的关系。 实际上也就是指:你需要那些数据?如何获得这些数据?数据之间的关系如何?二、向上思维在看完数据之后,要站在更高的角度去看这些数据,站在更高的位置上,从更长远的观点来看,从组织、公司的角度来看,从更长的时间段(年、季度

2014-10-19 11:35:43 2800

转载 一则小故事看产品数据分析

网上有个故事很有趣,说3个人去投宿,一晚30元.三个人每人掏了10元凑够30元交给了老板. 後来老板说今天优惠只要25元就够了,拿出5元命令服务生退还给他们, 服务生偷偷藏起了2元, 然后,把剩下的3元钱分给了那三个人,每人分到1元.这样,一开始每人掏了10元,现在又退回1元,也就是10-1=9,每人只花了9元钱, 3个人每人9元,3 X 9 = 27 元 + 服务生藏起的2元=29元,还有一元钱

2014-10-19 11:29:43 610

转载 大数据在传统行业引爆后如何落地

国庆期间,全国各处景点人满为患,水泄不通。然而一些景点却在爆冷门:10月1日五台山人数比去年同期减少近3成,黄山全天游客人数只与双休日水平相当。如果假期到来前,有相关数据预测各地景点人流量,大家即可提前做好准备,错峰出行。事实上,在国庆假期之前,艺龙、同程等旅游网站已根据机票、酒店、景点门票预订量出具相应的数据分析报告:热门出游目的地中三亚最火爆,客流量最扎堆的城市是北京——大数据正悄然在我们身边

2014-10-19 11:24:01 552

转载 阿里云推出RDS只读实例 分担数据库读写压力

近日,阿里云推出RDS只读实例,将满足大量的数据库读取工作负载,帮助用户应对数据库读取压力,实现读取能力的弹性扩展。目前,RDS只读实例属于公测阶段,用户可登陆阿里云官网申请免费使用。阿里云RDS产品经理王义成表示,阿里云RDS只读实例不但适用于专业的DBA,也非常适用于“小白客户”,备份设置、参数修改、阈值报警等数据库常用应用都是图形化操作,对于不精通数据库的用户也可以“零门槛”使用。

2014-10-18 22:14:17 2767

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除