自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

空空如也

本博客主要发布关于大数据,算法,编程语言相关的帖子

  • 博客(8)
  • 收藏
  • 关注

原创 【工程类】【Linux】用网线连接Windows和Linux台式机,并实现Linux共享Windows的WiFi网络

前言由于工作需要,需要利用网线将自己的笔记本和Linux台式机进行连接,实现Windows可以远程登录Linux机器,并实现Linux共享Windows的WiFi网络。网上的很多方法可以实现两台机器互ping,但是我这边一旦连上无线网,这两台机器就ping不通了。经过反复折腾,终于搞定了这个问题。准备工作一条可以用的网线笔记本电脑,可以连接WiFi,且有网口台式机。(我这边的系统是L...

2020-03-26 10:57:58 4358 1

原创 【程序人生】【目标计划】目标计划(更新至2020年)

今天是2020年2月18号,开始立flag1、回顾20192019年已经过去了,回顾2019年的计划,我觉得很是惭愧,可以说几个目标几乎一个都没达成。绩效目标本来定的是绩效目标中必须有一个A,但是今年所有的绩效都是B,究其原因,有自己的原因,也有上级的原因,回顾这几个季度,可以说算是比较努力,但是成绩一直没有达到领导的要求,在最后一次绩效考核中,领导也间接表达了不会让我升职的意向,所以,...

2020-02-18 20:49:20 353

原创 【工程类】【Hadoop】Hadoop streaming 在使用stream.num.map.output.key.fields命令时注意事项

使用HadoopStreaming的一个小case,分享给大家,避免日后出bug:当我们在用-D stream.num.map.output.key.fields=“2” 这个参数时,如果map端输出的长度小于或者等于2,则在reduce端打印的时候会多加一个空值。比如:map端输出为 A\tB,则在reduce端输入为 A\tB\t"",因为在map端输出时,没有value可以输出了,所以...

2019-01-18 16:08:34 4555

原创 【程序人生】【网址汇总】一名算法工程师常用网址汇总(持续更新中)

一、学术方面1、sci论文下载:http://www.sciencedirect.com/science2、paperweekly3、google学术4、TensorFlow中文社区:http://www.tensorfly.cn/tfdoc/tutorials/mnist_download.html TensorFlow英文版:https://www.tensorflow.org/t...

2018-10-29 10:24:47 368

原创 【工程类】【Python】Python3读中文乱码问题汇总

1、open(filepath).readlines()报错究极解决办法:for line in open(“yiliao.final”,encoding=“gb18030”,errors=‘ignore’).readlines()

2018-10-16 19:42:33 1041

原创 【算法类】【预处理】利用skit-learn分割训练集测试集

当我们获取到数据集的时候,会觉得写一个单独写一个分割数据集的函数很费事,要考虑到随机性和训练集测试集的比例大小。skit-learn提供了一种分割训练集测试集的函数X_train,X_test,y_train,y_test = train_test_split(features, labels, test_size=0.2, shuffle=False, random_state=42) t...

2018-09-30 09:55:50 1247

原创 【工程类】【Python】一文搞懂Python字符编码问题

简书这篇写的不错 https://www.jianshu.com/p/53bb448fe85b

2018-05-03 17:29:12 376

原创 【工程类】【Hadoop】性能调优方法

当我们写完一个MR程序之后,我们希望能够加快程序的执行速度,那么怎么进行性能的调优呢,有如下几种方法?1、mapper的数量适当调整mapper的数量,使得每个mapper的运行时间在1分钟为宜。因为mapper数量过小,则会导致整体速度过慢。太多则导致文件的寻址开销,以及namenode和datanode的交互更加频繁。2、reducer的数量集群中reducer的数量应该略少于...

2018-04-11 09:18:06 405

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除