10 tuohuangs

尚未进行身份认证

暂无相关简介

等级
TA的排名 2w+

Mysql5.7 免安装安装配置

之前都用的5.6版本的安装版,好久不用发现5.7都是免安装版了,不过也走了弯路,关键的两步一个是加上 my.ini; 一个是在cmd里面指向my.ini;[mysql]# 设置mysql客户端默认字符集default-character-set=utf8[mysqld]#安装目录basedir =D:\Program Files\MySQL\mysql-5.7.19-win

2017-08-06 10:27:47

Pig学习记录

Pig 常用操作http://blog.csdn.net/zythy/article/details/18426347拿student和teacher的例子說明了常用的操作及如何把python嵌入到pig中

2017-05-08 23:18:05

Flume相关知识链接

大数据采集常用工具 http://developer.51cto.com/art/201601/504888.htm  Flume概念http://www.jb51.net/article/53542.htm  附带的例子很好

2017-05-08 23:05:02

修改表的主键

把原先的自增主键id去掉,新增auto_pk字段为自增主键,并把id作为唯一索引

2017-05-08 22:50:27

hadoop hive的lzo总结

hive中指定压缩编解码器:hadoop集群启用了压缩,就需要在Hive建表的时候指定压缩时所使用的编解码器,否则Hive无法正确读取数据。Gzip和Bzip2由于是hadoop默认支持的,所以无需指定特殊的编解码器,只要指定Text类型即可。

2016-11-01 18:50:56

Hive开发例子- lzo方式存储

lzo的设置:set mapred.output.compress=true; set hive.exec.compress.output=true; set mapred.output.compression.codec=com.hadoop.compression.lzo.LzopCodec; set io.compression.codecs=com.hadoop.compr

2016-11-01 18:46:22

京东库房数据接入方法

数据仓库作为数据采集、数据加工和数据输出工厂,支撑了数据分析、报表、挖掘等多种数据需求,发挥了数据驱动价值的作用。其中从分布式数据库服务器采集数据是数据进入数据仓库的关键步骤,接入数据的质量和时效,将直接影响到数据在数据仓库的加工和输出质量。

2016-10-18 14:17:20

数据仓库基本知识你了解多少

数据仓库是商业智能系统的基础,以往的数据库系统主要用于事务处理,很难或无法实现分析处理。近年来,越来越多的数据分析与决策信息支持在被企业所重视,数据仓库技术应运而生。

2016-10-17 20:36:26

数据仓库系统的实现与使用(含OLAP重点讲解)

前言        上一篇重点讲解了数据仓库建模,它是数据仓库开发中最核心的部分。然而完整的数据仓库系统还会涉及其他一些组件的开发,其中最主要的是ETL工程,在线分析处理工具(OLAP)和商务智能(BI)应用等。        本文将对这些方面做一个总体性的介绍(尤其是OLAP),旨在让读者对数据仓库的认识提升到一个全局性的高度。创建数据仓库        数据仓库

2016-10-17 20:32:21

数据仓库与数据集市建模

前言        数据仓库建模包含了几种数据建模技术,除了之前在数据库系列中介绍过的ER建模和关系建模,还包括专门针对数据仓库的维度建模技术。        本文将详细介绍数据仓库维度建模技术,并重点讨论三种基于ER建模/关系建模/维度建模的数据仓库总体建模体系:规范化数据仓库,维度建模数据仓库,以及独立数据集市。维度建模的基本概念        维度建模(dim

2016-10-17 20:21:47

京东实时大数据平台

JRDW(JDRealtimeDataWarehouse)是京东大数据部为了解决公司越来越广泛的实时业务需求,而推出的一整套技术解决方案,包括数据的实时接入、实时解析、实时传输、实时计算和实时查询等技术环节。通过JRDW来解决实时业务开发中各环节的技术难点,在流程上统一业务开发需求,使业务方只专注于业务开发,不用过多关心技术上的问题,极大地降低了实时业务开发的技术难度。

2016-10-17 19:53:44

腾讯QQ精准TIPS消息营销介绍

Tips消息:Tips消息是一种腾讯特有的消息精准告知方式,是在QQ用户在线时,不定时触发的一个图文并茂的消息框,该消息框在屏幕窗口右下角弹出,用户不主动点击则不会在桌面消失,保持时间长,点击效率高,宣传效果好。Tips消息是点对点定向QQ号码发送,因此能够很精确地定向发到目标用户。同时,配合网络的本身优势,可以很好地实现商家与客户之间的直接互动。如推出QQ炫舞活动信息,可锁定QQ炫舞的用户发送。

2016-10-16 17:45:32

2016京腾计划战略会分享

京腾魔方是京腾计划推出的基于京东和腾讯海量用户画像体系的创新营销产品。基于京东1.88亿高价值购买用户与腾讯10亿高价值社交用户的大数据分析,通过京东的购物大数据,先挖掘出对品牌感兴趣的人群,然后根据用户社交等属性分析在腾讯的大数据中进行人群扩展,从而找到符合品牌营销需求的那部分用户群体,事项精准定向、效果分析和用户洞察。可以说,京腾魔方是实现精准投放的DMP营销工具。

2016-10-16 17:42:50

Jmeter压力测试-http的post请求实例

(来自baidu)Apache JMeter是Apache组织开发的基于Java的压力测试工具。用于对软件做压力测试,它最初被设计用于Web应用测试,但后来扩展到其他测试领域。 它可以用于测试静态和动态资源,例如静态文件、Java 小服务程序、CGI 脚本、Java 对象、数据库、FTP 服务器, 等等。JMeter 可以用于对服务器、网络或对象模拟巨大的负载,来自不同压力类别下测试它们的强度

2016-10-10 14:09:11

信息流zt_使用json参数拼接sql语句

信息流zt项目中,server端接收前端发送的httpjson请求,解析后来拼接sql,如果单纯string拼接就比较麻烦,因此使用并改写了SqlHandle代码

2016-10-05 14:55:09

JSON格式串以CSV格式保存

在报表项目开发过程中,UI端显示的数据用户想通过界面的”下载“按钮保存下来,而数据已经以JSON格式得到了,这是只需要把json格式的文件转化为excel,怎么转化,开源的有org.json.CDL,但这个东东的缺点是转化后就不能UI上的顺序保持一致。

2016-10-05 14:43:39

信息流zt_bin脚本

bin脚本主要是mysql建表语句和上端数据源同步

2016-10-05 14:21:31

信息流zt_maven的pom.xml详解

一个项目里总会有很多配置文件。而且一般都会有多套环境。开发的、测试的、正式的。而在这些不同的环境这些配置的值都会不一样。比如mail的配置、服务的url配置这些都是很常见的。所以在打包的时候就要根据environment来选不同的值或者配置文件。比较常用的办法就是为不同的环境建立不同的配置文件目录。在打包的时候用对应的文件目录下的配置文件。

2016-10-05 13:46:40

信息流zt报表服务端summary

最近上线了一个服务端数据response的开发,比较简单,该服务端的作用是响应前端(nodejs是实现的)发送的httpjson格式的数据请求,返回json数据。新建maven Dynamic web 项目使用maven进行package(http://blog.csdn.net/remote_roamer/article/details/51724378)。码管理是git

2016-10-05 13:45:04

曝光量 点击量 反馈量 具体意思是什么

曝光量点击量反馈量具体意思是什么?当买家在阿里巴巴中文站上找到您的供求信息以及公司介绍后,您的信息被展示在页面上,都会被计算入曝光量。常见的有:1)买家通过关键词搜索,您的信息展示在搜索结果页面中,即会被统计进入曝光量,2)当买家查看供应信息详细页面的时候,下面会有其他公司产品推荐在这里出现,也计入曝光量,3)当买家搜索到您的公司介绍,您的公司展示在公司库的搜索结果中,也会计

2016-10-05 13:40:32

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!