自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(51)
  • 收藏
  • 关注

原创 pytorch BN函数说明

pytorch中的BN继承自:class _BatchNorm(Module):这个类的代码:class _BatchNorm(Module): def __init__(self, num_features, eps=1e-5, momentum=0.1, affine=True, track_running_stats=True):...

2019-05-13 13:00:40 12455 1

原创 nn.utils.rnn.pack_padded_sequence 与 nn.utils.rnn.pad_packed_sequence

nn.utils.rnn.pack_padded_sequence ,nn.utils.rnn.pad_packed_sequence以及参考https://www.cnblogs.com/lindaxin/p/8052043.htmlimport torchimport torch.nn as nnfrom torch.autograd import Variablef...

2019-03-13 21:29:56 2277

原创 leetcode 136只出现一次的数字

给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。说明:你的算法应该具有线性时间复杂度。 你可以不使用额外空间来实现吗?示例 1:输入: [2,2,1]输出: 1示例2:输入: [4,1,2,1,2]输出: 4异或运算 ^:0 ^ 1 结果是1, 0^0 和 1^1 结果都是0 ;异或运算...

2019-03-05 21:03:31 111

原创 leetcode133 克隆图

给定无向连通图中一个节点的引用,返回该图的深拷贝(克隆)。图中的每个节点都包含它的值val(Int) 和其邻居的列表(list[Node])。示例:输入:{"$id":"1","neighbors":[{"$id":"2","neighbors":[{"$ref":"1"},{"$id":"3"

2019-03-05 20:13:14 274

原创 leetcode单词接龙 127

给定两个单词(beginWord 和 endWord)和一个字典,找到从 beginWord 到 endWord 的最短转换序列的长度。转换需遵循如下规则:每次转换只能改变一个字母。 转换过程中的中间单词必须是字典中的单词。说明:如果不存在这样的转换序列,返回 0。 所有单词具有相同的长度。 所有单词只由小写字母组成。 字典中不存在重复的单词。 你可以假设 beginWord ...

2019-02-27 15:45:04 239

原创 tensorflow estimator 实践

    本文以mnist数据集为例。estimator通常是和tf的dataset一起使用,故先制作tfrecord文件,在使用estimator进行测试。文章结构:1.文件目录2. 制作tfrecord文件3.使用estimator训练模型4.tf.estimator.Estimator()参数介绍:文件目录:         data目录下存放mnist数据集,...

2019-01-28 16:05:40 358

原创 制作 .tfrecord文件与numpy基础知识

 目录1.numpy.ndarray.tobytes 2.存数据:tf.train.Example tf协议缓冲区3. 用mnist数据集制作.tfrecord文件:4. 读数据:4中Iterator     4.1 Dataset 和 Iterator 的关系4.2 一次性水管,单次 Iterator4.3 可以定制的水管,可初始化的 Iterator4....

2018-08-26 21:22:19 1927

原创 nvidia driver install

1. 禁止 nouveaunouveau 是系统自带的一个显示驱动程序,需要先将其禁用.`cat /lib/modprobe.d/dist-blacklist.conf注释掉#blacklist nvidiafb在# blacklist nvidiafb下面加上blacklist nouveauoptions nouveau modeset=0reboot重启2. 重建镜像m...

2019-12-06 16:14:03 793

原创 tensorflow的4中迭代器

1. dataset.make_one_shot_iterator()import tensorflow as tfdataset = tf.data.Dataset.range(10)# 也可以是.repeat(-1)dataset = dataset.map(lambda x:x+2).repeat(3).batch(4)iterator = dataset.make_one_s...

2019-07-08 23:00:14 1409

原创 pandas 常用

import pandas as pda = [['abc', 'def', 'ghij'], ['klm', 'nop', 'qrs'], ['tuv', 'wxy', 'zzz']]df = pd.DataFrame(a)print(df)df.to_csv(path_or_buf='temp.csv', sep=',', header=False, index=False)# ...

2019-05-29 21:34:12 271

原创 docker永久修改容器编码

由于最近需要使用百度的paddlepaddle框架,所以想搞个容器, pycharm远程连接docker里面的python解释器。1. 修改容器编码在网上拉了个ufoym/deepo镜像,这个镜像比较大,包含了当前比较流行的DL框架,创建容器之后,发现容器并不能显示中文,容器的编码是这样的:永久修改容器编码:在原有容器的基础上使用Dockerfile构建新的镜像。Fr...

2019-05-19 11:13:13 3405

原创 逻辑回归中的连续特征为什么要离散化处理?

LR面试题:特征处理LR并行化特征处理1.知乎上的一个问题:https://www.zhihu.com/question/31989952连续特征的离散化:在什么情况下将连续的特征离散化之后可以获得更好的效果?题主机器学习大白一个。。最近刚接触CTR预估,发现CTR预估一般都是用LR,而且特征都是离散的。为什么一定要用离散特征呢?这样做的好处在哪里?求大拿们解答~...

2019-05-08 20:08:20 7107 2

转载 python的模块,包,变量作用域等

转自:https://mp.weixin.qq.com/s?__biz=MzUyOTk2MTcwNg==&mid=2247484016&idx=1&sn=285da9f937cfe1d8d7e581bee06d3569&scene=21#wechat_redirect1、你的名字我们先来审视一下模块。这是一个合适的尺度,由此展开,可以顺利地连接起函数与...

2019-05-04 22:52:46 445

原创 linux

之前一直不会更改linux中默认的python解释器,查了下资料,如下汇总: linux中的环境变量分类 一、按照生命周期来分,Linux环境变量可以分为两类:1、永久的:需要用户修改相关的配置文件,变量永久生效。2、临时的:用户利用export命令,在当前终端下声明环境变量,关闭Shell终端失效。 二、按照作用域来分,Linux环境变量可以分为:1、系...

2019-04-10 13:47:00 94

原创 python for...else...语法

def f(): for i in range(10): if i>5: print("aaa") return else: print("ccc")a = f()结果:aaadef f(): for i in range(10): if i>15: print("aaa") retu...

2019-04-05 13:45:22 131

原创 python的__getitem__(),__setitem__(), __len__()

看ONMT代码,发现有处直接使用iter(obj),直接蒙了,直接将内置的iter函数作用于对象。后来发现这个对象里实现了__getitem__()方法。 先看示例:class Test: def __init__(self): self.l = [4,5,6,7] def __getitem__(self, item): return self....

2019-03-17 09:45:17 173

原创 if __name__ == "__main__"的理解

两个py文件a.pyfrom b import PIdef calc_round_area(radius): return PI * (radius ** 2)def main(): print("round area: ", calc_round_area(2))print(__name__)main()b.pyPI = 3.14def ma...

2019-03-13 17:06:05 108

原创 152. 乘积最大子序列

给定一个整数数组nums,找出一个序列中乘积最大的连续子序列(该序列至少包含一个数)。示例 1:输入: [2,3,-2,4,-5,1]输出: 300解释:所有数字相乘。示例 2:输入: [-2,0,-1]输出: 0解释:结果不能为 2, 因为 [-2,-1] 不是子数组。解释: 最大连乘积的子串必定以某个数字为结尾, 我们只需要 求出 以数组中每个数字结尾...

2019-03-07 13:04:44 331

原创 leetcode 117

"""# Definition for a Node.class Node: def __init__(self, val, left, right, next): self.val = val self.left = left self.right = right self.next = next"""clas...

2019-02-22 14:30:49 159

原创 95. 不同的二叉搜索树 II

 给定一个整数 n,生成所有由 1 ... n 为节点所组成的二叉搜索树。示例:输入: 3输出:[  [1,null,3,2],  [3,2,null,1],  [3,1,null,null,2],  [2,1,3],  [1,null,2,null,3]]解释:以上的输出对应以下 5 种不同结构的二叉搜索树: 1 3 3 ...

2019-02-18 20:10:34 83

原创 leetcode最大矩形84

给定 n 个非负整数,用来表示柱状图中各个柱子的高度。每个柱子彼此相邻,且宽度为 1 。求在该柱状图中,能够勾勒出来的矩形的最大面积。 以上是柱状图的示例,其中每个柱子的宽度为 1,给定的高度为 [2,1,5,6,2,3]。 图中阴影部分为所能勾勒出的最大矩形面积,其面积为 10 个单位。 示例:输入: heights = [2,1,5,6,2,3]输出...

2019-02-16 15:30:45 668 2

原创 leetcode 77 组合

这种题与              Leetcode 46:全排列(最详细的解法!!!)          Leetcode 47:全排列 II(最详细的解法!!!)类似利用递归:class Solution: def combine(self, n, k): """ :type n: int :type k: int ...

2019-02-15 13:27:29 122

原创 leetcode46 全排序

第一种思路:  回溯法class Solution: def permute(self, nums): """ :type nums: List[int] :rtype: List[List[int]] """ r = [] self.tt(0, nums, r) ret...

2019-01-22 12:52:26 83

转载 tensorflow中的静态维度和动态维度

参考:1. TensorFlow: Shapes and dynamic dimensions一文中,对张量的静态和动态维度做了描述。使用tf.get_shape()获取静态维度 使用tf.shape获取动态维度 如果你的placeholder输入的维度都是固定的情况下,使用get_shape()。但是很多情况下,我们希望想训练得到的网络可以用于任意大小的图像,这时你的placehol...

2019-01-17 16:22:39 1372

原创 leetcode 31 下一个排列

描述:实现获取下一个排列的函数,算法需要将给定数字序列重新排列成字典序中下一个更大的排列。如果不存在下一个更大的排列,则将数字重新排列成最小的排列(即升序排列)。必须原地修改,只允许使用额外常数空间。以下是一些例子,输入位于左侧列,其相应输出位于右侧列。1,2,3 → 1,3,23,2,1 → 1,2,31,1,5 → 1,5,1 这种题是一个个测试用例试出来的,找个时间好...

2019-01-15 16:11:55 102 1

原创 bert代码参考资料

unicodedata :         1. unicode字符的标准化:                 https://python3-cookbook.readthedocs.io/zh_CN/latest/c02/p09_normalize_unicode_text_to_regexp.html         2.unicode字符的CJK的含义:            ...

2019-01-14 20:35:32 423

原创 leetcode17 电话号码的字母组合

给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。示例:输入:"23"输出:["ad", "ae", "af", "bd", "be", "bf", "cd", "ce", "cf"].第一次理解: 输

2019-01-12 15:08:52 179

转载 leetcode 3数之和

转载地址:https://leetcode-cn.com/problems/3sum/这道题让我们求三数之和,比之前那道Two Sum要复杂一些,博主考虑过先fix一个数,然后另外两个数使用Two Sum那种HashMap的解法,但是会有重复结果出现,就算使用set来去除重复也不行,会TLE,看来此题并不是考我们Two Sum的解法。那么我们来分析一下这道题的特点,要我们找出三个数且和为0...

2019-01-11 22:03:59 78

原创 layer-normal实现

def layer_norm_compute_python(x, epsilon, scale, bias): mean = tf.reduce_mean(x, axis=[-1], keep_dims=True) variance = tf.reduce_mean(tf.square(x - mean), axis=[-1], keep_dims=True) norm_...

2019-01-04 10:45:11 2420

原创 WordPiece

选自https://github.com/google-research/bert中的tokenization.py代码 class WordpieceTokenizer(object): """Runs WordPiece tokenziation.""" def __init__(self, vocab, unk_token="[UNK]", max_input_chars_p...

2018-12-22 15:18:31 1753 2

原创 平安金融壹帐通面试总结

   主要聊机器阅读相关的领域:                               1. QANet中多头attention的作用,与RNN的区别。        2.ELMO, GPT, BERT之间的区别。        3. Hightway network的作用        4. 反馈: 看论文要有深度,多做ablation实验。        5. 多动手...

2018-12-21 09:51:16 5824

转载 tf.scope

1. tf.Variable与tf.get_variabletensorflow提供了通过变量名称来创建或者获取一个变量的机制。通过这个机制,在不同的函数中可以直接通过变量的名字来使用变量,而不需要将变量通过参数的形式到处传递。 TensorFlow中通过变量名获取变量的机制主要是通过tf.get_variable和tf.variable_scope实现的。 当然,变量也可以通...

2018-10-24 16:41:34 715

原创 tf.nn.bidirectional_dynamic_rnn 使用方法及其验证:

目录 1.使用方法2.未指定sequence_length2.1 tensorflow LSTM_cell原理2.2 tensorflow中LSTM的前向传播2.3 用numpy来验证tensorflow中  tf.nn.rnn_cell.LSTMCell的前向传播3. 指定sequence_length时4. 动态双向rnn 1.使用方法参考:http...

2018-10-19 16:10:44 2865 1

转载 机器学习实战(知乎)

天池大数据竞赛历次资料集锦(持续更新中)金陵书生厚积薄发​关注他140 人赞了该文章作为天池老选手,一直想着要把收集的天池平台上举办的历次大数据竞赛的决赛答辩资料以及开源的代码等收集起来作为集锦,贡献给各位大数据竞赛特别是天池平台的选手和爱好者。怎奈一直琐事烦身,未能及时整理出来。今天又有选手问我之前比赛的资料,遂决定先开一个头,能先整理多少就先公开多少,一方面督促自己尽快完成此事,另一方面也可以...

2018-10-08 10:26:33 1706

转载 机器学习-魔镜杯

决赛答辩第4,获得铜奖代码地址:https://github.com/wepe/PPD_RiskControlCompetition

2018-10-08 10:08:08 269

原创 SSH免密码登录原理

    假设A机器需要免密码的登录到B级器:             1、在A机器上打开终端,执行ssh-keygen,该命令会默认在~/.ssh/目录下创建id_rsa、id_rsa.pub两个文件,分别为A的公钥和私钥。 2、将公钥id_rsa.pub文件拷贝到B端的~/.ssh/authorized_keys文件 免密码的登录原理:参考:https://www.c...

2018-10-01 18:36:12 571

原创 gensim中文词向量训练实战

ubuntu16.04 Python 3.6 Anaconda gensim : word2vec模型训练 jieba : 中文分词 hanziconv : 繁体转简体转换程序目录如下所示:data目录下stop_words.json是停用词列表zhwiki是中文wiki预料处理语料:去标签,分词# 把一些警告的讯息暂时关掉import warningswa...

2018-09-29 16:23:10 5515

原创 二分类的最大熵模型 逻辑斯谛回归模型 引导

以下内容有选自       知乎:https://www.zhihu.com/question/24094554       CSDN : https://blog.csdn.net/foryoundsc/article/details/71374893    当选择合适的特征函数时:最大熵模型就是逻辑斯谛回归模型:...

2018-09-24 16:42:15 394

原创 hadoop配置

目录1.搭建hadoop要求:2.创建虚拟机3. 免用户名登录 4. 免用户名登录 5. 配置hadoop6. 参看文章:7. 关于hadoop各个文件配置的详解: 1.搭建hadoop要求:VirtualBox ubuntu16.04 jdk1.8 hadoop2.7.42.创建虚拟机    note:            共创建3个虚拟...

2018-09-24 14:39:00 336

原创 tensorflow常见错误

a = tf.placeholder(dtype=tf.int32, shape=[2])print(a)a = tf.reduce_max(a)print(a)with tf.Session() as sess: print(sess.run(a, feed_dict={a:[5,10]}))out:Tensor("Placeholder:0", shape=(2,), ...

2018-09-21 16:24:20 327

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除