4 明日韭菜

尚未进行身份认证

qq: 1463675384

等级
TA的排名 4w+

【转载】Presto日常优化

查询速度慢,如何优化?解决方法1:避免单节点处理虽然Presto是分布式查询引擎,但是一些操作是必须在单节点中处理的.例如:count(distinctx)考虑使用approx_distinct(x)代替但是需要注意这个函数有个大约在2.3%的标准误差,如果需要精确统计的情况,请绕道.UNIONUNION有个功能是:如果两条记录一样,会只保留一条记录(去...

2019-09-25 16:33:23

2017-春招实习生之路:机器学习、大数据开发、研发等岗位面经

前言刚过完年,就开始到处找实习了,可惜后来发生了一些事情,耽误了春招实习,也完全改变了人生方向。。。后来到处找散招的实习以及参加春招的暑假实习生笔面试,总共经历了十家公司的面试,相比我秋招的二十家面试少了一半,呵呵哒。。。同时欢迎大家看我的秋招面经帖子,干货很多的2017-我的秋招之路:机器学习/算法工程师(含大量面经)算法/研发岗位实习生面经高德地图(数据挖掘实习生,电话一面,201

2017-11-12 20:16:35

2017-我的秋招之路:机器学习/算法工程师(含大量面经)

前言:从今年的8月1号正式开启秋招到现在,过去三个多月了,发生了很多事情,经历了N多场笔试和面试,深深感慨到本硕双非的学生找算法岗的艰辛。。。,当经过了8、9月份的种种面试挂掉后,终于从十月下旬陆续收到了几个offer,而且其中还有自己喜欢的公司,不得不感慨那句《极限挑战》的结束语“这,就是,命!”奇怪的数字:对于我的整个秋招情况,有下面几组数据,我感觉很有意思,而且感觉和自然数e有关:发送的申请

2017-11-05 11:03:16

SQL之考点总结

数据库知识总结

2017-09-04 10:58:08

拼多多内推笔试一:求数组中任意三个数的最大乘积

数组中可能有正数、负数和0,所以解题思路是:找出最小的两个负数和最大的正数相乘以及三个最大的正数相乘,两者取其中最大值。

2017-08-02 17:26:32

拼多多内推笔试二:数字字符串两个字符串相乘/大数相乘

这是四道笔试题的第二题:两个字符串形式的数字,求相乘结果并保存到字符串,结果可能会很长,所以只能用字符串模拟乘法操作。1、c+++代码如下:#include<iostream>#include<cstdio>#include<string>#include<vector>#include<sstream>usingnamespacestd;stringmultipl

2017-08-02 14:00:50

【转载】C++常见问题: 字符串分割函数 split

C++常见问题:字符串分割函数split

2017-04-30 21:58:53

C/C++中带空格的字符串的输入

带空格的字符串输入

2017-04-27 21:33:49

【转载】ubutun中VanetMobiSim的安装和初步使用

ubutun中VanetMobiSim的安装和初步使用

2017-04-23 22:15:32

【转载】Anaconda2下的Python2.7和Python3.5的共存

Anaconda2下的Python2.7和Python3.5的共存

2017-04-23 21:59:50

【转载】Spark中:reduceByKey和groupByKey区别与用法

reduceByKey和groupByKey的区别

2017-04-23 21:53:03

堆排序和快速排序的c++实现

面试时关于排序方面被问到最多的就是手写快速排序,其次就是手写堆排序

2017-04-18 20:37:57

Numpy多维数组保存文档时,解决报错TypeError: Mismatch 的方法

TypeError:Mismatchbetweenarraydtype(‘float64’)andformatspecifier(‘%.18e%.18e’)

2017-04-08 20:56:11

python:在for遍历list时使用remove出现的问题以及解析

a=[1,2,3,4,5]foriina:a.remove(i)printa

2017-03-21 16:56:42

win10下安装theano和keras

win10安装theano和keras

2017-01-08 17:17:16

如何在Spark2.0.2中启动Ipython Notebook

spark2.0.2启动IpythonNotebook

2016-12-13 22:01:04

ubuntu彻底卸载软件 :关于安装openssh-server后没有启动,22端口没有打开的问题

ssh的服务端启动不了,22端口没有打开

2016-11-17 10:21:16

Scrapy中用xpath/css爬取豆瓣电影Top250:解决403HTTP status code is not handled or not allowed

scrapy爬取豆瓣电影top25,采用了selector的xpath和css

2016-11-06 11:47:39

python中lxml+cssselect爬取豆瓣电影Top250

上一篇博客已经说了,本想参考[这篇博客](http://blog.csdn.net/fighting_no1/article/details/50926008)博客爬取豆瓣电影T250的,谁知最后竟是乱码和编码的问题,解决方式呢,上一篇已经说了。我又重新按照自己的学的东西采用lxml和cssselect做了一遍,速度也挺快,效果还行,但是需要注意的是输出文件是csv文件,用excel打开时会是乱码

2016-11-02 21:48:57

python下字符编码和解码问题:UnicodeEncodeError: 'gbk' codec can't encode character u'\xa0'

UnicodeEncodeError:'gbk'codeccan'tencodecharacteru'\xa0'

2016-11-01 11:14:10

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取