4 __Lingyue__

尚未进行身份认证

我要认证

微软亚洲研究院 实习生

等级
TA的排名 1w+

pandas 为什么要用 Category 类型 而不是 Str?

category是一种pandas的类型pd.Series(["a", "b", "c", "a"], dtype="category")pd.Series(["a", "b", "c", "a"], dtype="str")之前自己的代码都是用str,或者直接就是python自己的object类型,那么我们什么时候需要用category而不是str呢?当 这一列 的值的种类(numbe...

2020-04-21 00:10:58

AutoGluon Tabular 表数据全流程自动机器学习 AutoML

论文链接:https://arxiv.org/abs/2003.06505代码链接:https://github.com/awslabs/autogluon背景表数据的AutoML近几年很火,但是目前没有一个框架做到了集大成,各有一些特色,但效果也一言难尽,比赛中选手常常用到一些可以提升效果的技术,之前的AutoML框架也都没有过多关注,关注点主要放在了模型选择和超参数调节上。这篇文章...

2020-03-24 18:10:31

DeepGBM: A Deep Learning Framework Distilled by GBDT for Online Prediction Tasks

DeepGBM: A Deep Learning Framework Distilled by GBDT for Online Prediction Tasks论文链接:https://dl.acm.org/citation.cfm?id=3330858代码链接:https://github.com/motefly/DeepGBM背景Guolin Ke是lightgbm的核心作者之一,我幸...

2019-11-15 18:34:56

Kolmogorov-Smirnov KS 定义 python实现 KS值的正负

定义TP: True Postive 预测正类,实际也是正类FP:False Positive 预测正类,实际是负类TN:True Negtive 预测负类,实际也是负类FN:False Negtive 预测负类,实际是正类TPR:TP / (TP+FN) 所有正例中有多少个正例被分出来。FPR: FP / (TN+FP) 所有负例中有多少例子被分为正例。模型预测的结果通常是一...

2019-11-05 17:04:07

DARTS 可微 架构搜索

论文链接:DifferentiableArchitectureSearch源代码:quark0/darts背景我们现在主流的效果最好的两种方法,进化学习(evolution)和强化学习(Reinforcement),他们的搜索空间都是不可微的,而现在作者提出了一种可微的方法,可以用梯度下降来解决架构搜索的问题,所以效率可以比之前不可微的方法快几个数量级。可以这么通俗的理解:之前...

2018-08-07 13:29:03

Net2Net 知识迁移 加速神经网络的训练

论文链接:Net2Net: ACCELERATING LEARNING VIA KNOWLEDGE TRANSFER什么是Net2Net?Net2Net(Net to Net) 是利用知识迁移来解决大型网络的训练速度慢的问题,例如先训练一个小的网络,然后Net2Net,训练一个更大的网络,训练更大的网络时可以利用在小网络中已经训练好的权重,使得再训练大型的网络速度就变的非常快,利用小...

2018-07-05 15:37:48

基于梯度下降的可微架构搜索方法

文章转载自机器之心,没有做任何修改,机器之心原文 寻找最优神经网络架构的任务通常需要机器学习专家花费大量时间来完成,最近人们提出的自动架构搜索方法释放了我们的精力,但却非常消耗算力。由卡耐基梅隆大学(CMU)在读博士刘寒骁、DeepMind 研究员 Karen Simonyan 以及 CMU 教授杨一鸣提出的「可微架构搜索」DARTS 方法基于连续搜索空间的梯度下降,可让计算机更高效地搜索...

2018-07-04 15:50:54

深度学习 过拟合 CheckList

参考资料: 量子位-怎样构建深度学习模型?第1步:损失函数 回归问题用MSE(均方误差)多类别分类问题用交叉熵(衡量相似性)二分类问题用二值交叉熵第2步:初始神经网络架构 结构化学习(结构化数据):一个激活节点的个数数在输入和输出神经元数之间的全连接层,先不要太深太大计算机视觉:从ResNet开始第3步:训练集 用learning rate finder来选学习率,可以得到一...

2018-07-03 14:07:52

Path-Level Network Transformation for Efficient Architecture Search 神经网络架构搜索

论文链接:Path-Level Network Transformation for Efficient Architecture Search架构搜索 根据一个已有的效果比较好的神经网络结构,找到更好的结构,例如将其中的某一层进行替换,增添一层或者减少一层,改变网络的拓扑结构。 为什么要基于已有的网络? 因为在已有的神经网络上更改拓扑结构可以利用已经训练好的权重,在巨人的肩膀上进步...

2018-07-02 17:26:14

CUDA GPU 隔离 CUDA_VISIBLE_DEVICES

场景:有一台服务器,服务器上有多块儿GPU可以供使用,但此时只希望使用第2块和第4块GPU,但是我们希望代码能看到的仍然是有两块GPU,分别编号为0,1,这个时候我们可以使用环境变量CUDA_VISIBLE_DEVICES来解决这个问题。 比如:CUDA_VISIBLE_DEVICES=1 只有编号为1的GPU对程序是可见的,在代码中gpu[0]指的就是这块儿GPUCUDA_VISI...

2018-05-15 12:52:25

git 如何处理换行符? CRLF/LF

什么是CRLF/LFCarriage-Return 回车符\r Line-Feed 换行符\n在Windows环境中,换行符是CRLF,也就是\r\n,但是在Linux环境中,换行符是LF,也就是\n。git如何处理换行符?git在维护版本库的时候统一使用的是LF,这样就可以保证文件跨平台的时候保持一致。 在Linux下默认的换行符也是LF,那也就不存在什么问题。 在Wi...

2018-04-14 14:47:23

Typescript 异步编程范式 Await/Async Deferred/Promise

在Typescript编程当中,我们如何优雅的实现异步编程呢?利用Await/Async写上层逻辑,利用Deferred/Promise封装回调函数。我们先来看一下实际工作环境中的一段代码: 这段代码实现的功能是将本地的文件或文件夹上传至hdfs上。 async upload(localPath: string, hdfsPath: string, recursive = fa...

2018-04-13 21:50:33

Typescript 函数参数占位

问题:如果你没有在tsconfig中设置noUnusedParameters为True的话,当你函数参数声明但没有使用的时候就会报错:’parameter’ is declared but its value is never read.可是在一些回调函数当中,我们不得不声明一个以后不会使用到的参数,比如:function request (opts, (err, res, body) =...

2018-04-07 15:34:53

leetcode 31 Next Permutation

Problem: 求当前排列数的下一个排列数,即实现STL中的next_permutation()。 Solution: 1. 从后往前找到第一个最长的降序序列 2. 找到降序序列中比序列前的那个数大,又是序列中最接近序列钱的那个数的数 3. 交换序列前的数后第二步找到的数 4. 将序列变成从小到大 5. 若整个排列都是降序的,那就全部做一次排序class Solution {...

2018-02-11 23:47:10

leetcode 206 Reverse Linked List

Problem: 单链表转置。 Solution: 1. 利用中间变量保存指针,循环逆置。 2. 递归改变链表指针。 notes: 结束后返回的是新链表的头。 注意处理异常,比如head是空的情况。 利用相同子结构优化冗余逻辑。/** * Definition for singly-linked list. * struct ListNode { * ...

2018-02-11 20:57:54

FZU 1759 Super A^B mod C (欧拉降幂)

Problem: 给一个很大的B,求A^B mod C的值。

2017-12-25 20:03:20

POJ 1182 食物链【关系并查集】

Problem: A吃B,B吃C,C吃A,给了一系列的关系,判断两个东西的关系是否和已给的关系冲突。 Solution: 将关系当做一个权加入并查集当中,相关关系在一个树上。 具体解法这篇链接讲的很清楚,但是它的代码我觉得还有很大的改进空间,比如还可以提炼出举一反三的模板,代码可读性还可以增加,主函数当中的逻辑冗余,所以我在看懂了这篇博客之后自己又进行了修改和总结。 参考链接:http:...

2017-11-10 11:14:20

C语言 实现 peek() 函数

1. c++中的peek()函数可以返回输入流中的下一个字符而不把这个字符从输入流中取出。2. 利用c中的getc和ungetc实现了c++中类似的功能。3. peek_nextchar()和get_nextchar()返回下一个非空的字符。

2017-11-08 09:35:13

算法竞赛 加速输入输出

ios::sync_with_stdio(false) 关掉c++中 iostream 对象和 cstdio 流的同步,关掉后不能同时使用c和c++的输入输出。cout输出换行用cout << “\n”而不要用endl,这样每次会刷新缓冲区,消耗时间。cin.tie(0),cin默认是绑定cout的,以实现每次有输入的时候输出缓冲区都会刷新一次,解绑后速度可以提高。

2017-10-20 18:44:36

cctype 常用字符处理函数

isalnum():字母或数字返回1 isalpha():字母返回1 isdigit():数字返回1 ispunct():标点符号返回1(可打印字符中除了字母数字的部分) isspace():标准空白字符返回1 isprint():打印字符返回1 isgraph():除空格外的打印字符返回 isxdigit():十六进制返回1,比如0-9, a~f, A~F islower():小写

2017-10-20 10:21:41

查看更多

勋章 我的勋章
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。