自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 数据分析——问卷调查从模型到算法

也就是说,当x=1/e的时候,在我们的男主试探(认识了N*个女主)有最大的概率即约为37%的概率遇到我们的真命女主——那个我们男主最想要的的女主。从理论模型我们回到现实,也即是说当我们的男主在时间序列上遇到了100个女主(N=100),那么我们的男主要认识37次女主(k=37,),以进行判断真命女主,在37次接触中,只要碰到从第37个开始,比前36个价值最高的女主还高,那么该女主就以最大可能性成为我们的最高价值女主。那么这就是你最认可的另一半了。

2017-03-19 18:35:37 16727 1

原创 window10下spark2.1.0单节点环境及开发环境搭建及运行全流程走通

作为一名初入spark编程的初级工程师,在工作中总是会有一些程序需要先在自己的spark环境下试跑,所以需要自己在自己电脑中安装自己的spark运行环境以及开发,方便用于调试,还可以时不时的测试一下API,玩一玩自己随手编的小程序,以便学习,因为开源的东西变化太快,总是需要你不断学习...最近在工作中就有这样的一个需求,而网上也没有最新的资源,抱着和大家分享一起学习的心态,从头到尾咱们来一遍!

2017-02-09 20:12:41 5056

原创 hadoop之MR字节码转换

但是在生产环境中,输入输出字符集格式总是不一定会是utf-8格式,有可能处理之后的文本要求输出格式是GBK、BIG5等之类,作为下一个程序的输入格式,尤其是银行业,日志格式一般都是GBK,指定输出格式是GBK替换上面的源代码中的UTF-8即可,但是字符集编码格式那么多,做一个大数据的平台产品,面向的就是全世界的客户,这样去指定输出格式没有那么自动化,受众也是极窄的。如果是我们能够在MR程序的设置指定字符集那就完美契合生产环境中复杂的需求。故而修改源码如下:

2016-11-02 18:54:03 565

原创 设计HashMap中元素put顺序和输出顺序相同

因此,我们put进去元素的时候,元素因为自己的hashcode值分配到的存储位置而导致了元素的无序。所以要使得put进去元素和输出元素的顺序一样,只需要我们put进去的hashcode值和我们put的次序相同,或者hashcode值按次序从小到大即可满足。重写hashcode源码如下:

2016-10-26 09:47:46 8065 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除