4 qq_27717921

尚未进行身份认证

暂无相关简介

等级
TA的排名 1w+

GPT : Improving Language Understanding by Generative Pre-Training

参考论文:ImprovingLanguageUnderstandingbyGenerativePre-Training论文链接:https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf这篇论文是基于文...

2019-08-16 11:37:33

Layer Normalization

在学习LayerNormalization之前建议大家先自行学习BatchNormalization.鉴于BN存在一些问题,LayerNormalzation才得以提出,并且LayerNormalization可以直接应用于recurrentneuralnetworks,并且也解决了BN当batchsize=1不能进行在线学习,在线预测的问题。layernormalizatio...

2019-08-01 10:59:30

Elasticsearch(五)

在文档在加入倒排索引之前,会对数据进行一系列的分析。基本分为以下几个步骤。概述*字符过滤---使用字符过滤器转变字符。*文本切分为分词---将文本切分为单个或多个分词。*分词过滤---使用分词过滤器转变每个分词。*分词索引---将这些分词存储到索引中。以上几个步骤可以参考下图:字符过滤器可以将特定的的字符序列转变为其他的字符序列,比如将Iloveu2转换为I...

2019-07-30 17:41:18

离京

北京从来没有属于过我,而我也将不再属于北京。这种感受夹杂着莫名的难过,我不明白这种心塞塞的感受到底是从何而来,但我知道我真的要走了,得走了。生活就是这样,我们没有顺理成章的勇气去离开一个貌似熟悉的城市,因为那座城市里面有我们熟悉的朋友,熟悉的美食,熟悉的生活节奏,离开对我们来说,意味开始新的everything,restartlife.18.1.25我拖着两大行李箱来到北京,那时候...

2019-07-08 15:23:04

Elasticsearch(四) 安全性

待续参考链接https://blog.51cto.com/chenhao6/2113873

2019-06-03 19:03:26

Elasticsearch(三) 查询与过滤

这里使用的场景是在子文档中匹配object字段spu_info.spu_name,brand_info.brand_name,过滤子文档的is_hidden和state的字段,并且在父文档也过滤is_hidden和state字段。search_obj={"query":{"filtered":{"query...

2019-06-01 16:14:32

Elasticsearch(二) 文档关系分析

关系型数据库中往往存在关系,包括1对1,1对多,多对多,通过连接,可以进行多表查询。elasticsearch作为数据存储,搜索,分析的框架,在存储上采用文档式的存储方式,因此再把关系型数据库比如mysql的数据导入elasticsearch时,需要根据数据关系设计索引映射。数据关系,数据特点以及在性能上需求都会影响着我们如何设计索引映射。对象类型(最擅长处理一对一关系)将对象作为文档的一...

2019-05-17 16:48:35

Elasticsearch(一) 安装与配置--Centos7

Elasticsearch作为最受欢迎的开源搜索框架之一,能够满足数据存储,数据搜索和数据分析的功能,在最近的几个月里我会慢慢地深入了解和学习elasticsearch。Elasticsearch参考链接https://www.cnblogs.com/shifu204/p/6370682.html安装下载并安装ES的yum公钥rpm--importhttps://p...

2019-05-12 14:35:30

未来想做的几件事

最近想的有点多,多到可怕,想做的事情太多,担心现在的自己会像是在高速公路行驶的车辆一样,可能找不到下高速的出口会一直漫无目的的跑下去,所以心情变得很烦躁。1.把驾照学学下来,应该能在1~2个月搞定。(7-8月)2.考雅思,为以后出国读博士做准备,即便是不读博士,英语好点也是不错的。(12月份)3.报一个绘画班开始学习,开始发展自己的第二事业,争取把兴趣培养成职业(日常)。4....

2019-05-05 14:49:46

Universal Language Model Fine-tuning for Text Classification

参考论文:UniversalLanguageModelFine-tuningforTextClassification迁移学习最早是应用于机器视觉方向的,迁移学习是从general到specific的过程,在general过程中在大型语料库中进行预训练(pre-training),在specific过程中在specifictask领域中进行微调(fine-tunn...

2019-04-14 18:58:11

C++ string实现,vector扩容

C++stringstring的C++代码实现classstring{//构造函数string(char*data){if(m_data==null||strlen(data)==0){m_data=newchar[1];*m_data=‘\0’;}else{intlen=strlen(data);m_dat...

2019-04-06 21:50:59

Deep contextualized word representations

参考论文:Deepcontextualizedwordrepresentations参考链接:https://www.jianshu.com/p/d93912d5280e传统wordembeding在读这篇论文之前,首先我们要了解wordembeding存在的问题。通常wordembeding是通过大型语料库预训练得出的一个v*m的大表,v是词的个数,m是用维度为m的向量来...

2019-04-06 15:34:38

Batch Normation

之前花费了比较长的时间在论文阅读上,导致最近的博客都没有产出~~参考论文:BatchNormalization:AcceleratingDeepNetworkTrainingbyReducingInternalCovariateShift可以理解为对深层神经网络每个隐层神经元的激活值做简化版本的白化操作为什么要提出BatchNormation1.深度网络的训...

2019-04-06 11:52:15

git 将多个commit id 打包成一个或者是多个commit id

我们有时候会出现频繁提交代码的问题,可能多个commitid实际上一个作用,为了让gitlog看起来更清晰,我们会将多个commitid合并成若干个commitid.这就涉及到gitrebase-i.通过这条命令,我们可以修改git提交的顺序,或者是删除某个commit,修改某个commit信息,下面就详细介绍gitrebase-i。gitlog//假...

2018-10-26 16:16:09

Git diff 忽略某些文件

我们在使用gitdiff时总是希望忽略一些文件,比如一些非代码的改动我们希望看到的是nodiff的。下面将简单介绍下如果配置某些文件在gitdiff时被忽略。自定义gitdiffdriver.在项目的根目录下运行:gitconfigdiff.nodiff.command/usr/bin/true这里需要注意的是,在/usr/bin/目录下创建文件名为true...

2018-10-26 15:49:32

C++ 智能指针(unique_ptr, shared_ptr)的源码分析

在博文https://blog.csdn.net/qq_27717921/article/details/82940519已经介绍了unique_ptr和shared_ptr的使用,但是这两类的智能指针是如何做到管理指针的呢?shared_ptr头文件template<typenameT>classSharedPointer{public: SharedPo...

2018-10-14 13:36:25

RDD分区理解

RDD分区的作用一个HDFS文件的RDD将文件的每个文件块表示为一个分区,并且知道每个文件块的位置信息。这些对应着数据块的分区分布到集群的节点中,因此,分区的多少涉及对这个RDD进行并行计算的粒度。首先,分区是一个逻辑概念,变换前后的新旧分区在物理上可能是同一块内存或者是存储。需要注意的是,如果没有指定分区数将使用默认值,而默认值是该程序所分配到CPU核数,如果是从HDFS文件创建,默认...

2018-10-05 21:39:16

C++ 动态内存

在c++的内存上我碰到很多很多坑~,特此来记一笔。什么是动态内存程序中所使用的对象都有着严格的生存期,全局对象在程序启动时分配,在程序结束时销毁;局部对象在进入其定义所在的程序块时被创建,在离开块时销毁。局部的static对象只在第一次使用前进行分配,在程序结束时销毁。但是除了自动和static对象之外,C++还支持动态分配对象。比较特殊的是,动态分配的对象的生存期与它在哪里创建是无关...

2018-10-05 17:35:55

PageRank算法和HITS算法

楼楼刚才想了一个特别骚情的标题,叫PageRank算法和HITS算法的“前世今生”,特别像之前写头条号的套路,然后就想起来去年6月份自己有在经营一个技术型的头条号,后来因为做不到一天一篇的更新频率被我弃坑了,现在手机号换了,登陆不了,去主页看了看之前写的文章,竟然被一直这么努力的自己感动到了。:)PageRank算法和HITS算法都属于比较著名的链接链接分析方法,作为经典方法,由此也衍生出一些...

2018-10-02 22:30:37

YARN的两种运行模式

YARN是一种资源管理机制,可以基于这种资源管理机制运行多种计算框架,比如mapreduce和storm,任何框架与YARN的结合,都必须遵循YARN的开发模式,下图为YARN框架的基本原理。其中,ResourceManager和NodeManagers是整个计算框架的核心部分,ResourceManager负责资源的分配,将集群的资源分配给各个应用使用,而资源分配和调度的基本单位是Con...

2018-10-02 19:58:55

查看更多

勋章 我的勋章
  • 新人勋章
    新人勋章
    用户发布第一条Blink获赞超过3个即可获得
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。