自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(456)
  • 收藏
  • 关注

转载 NLP 的巨人肩膀(下):从 CoVe 到 BERT

转载文章,感谢机器之心作者,帮作者引流。戈多会来吗?在前文深度长文:NLP的巨人肩膀(上)中,我们介绍了好几种获取句子表征的方法,然而值得注意的是,我们并不是只对如何获取更好的句子表征感兴趣。其实更有趣的是,这些方法在评估他们各自模型性能的时候所采取的方法,回过头去进行梳理,我们发现,无论是稍早些的InferSent,还是 2018 年提出的Quick-thoughts和Multi-task Learning获取通用句子表征的方法,他们无一例外都使用了同一种思路:将得到的句子...

2020-08-18 15:44:31 1555

转载 MCMC(三)MCMC采样和M-H采样

    MCMC(一)蒙特卡罗方法    MCMC(二)马尔科夫链    MCMC(三)MCMC采样和M-H采样    MCMC(四)Gibbs采样    在MCMC(二)马尔科夫链中我们讲到给定一个概率平稳分布ππ, 很难直接找到对应的马尔科夫链状态转移矩阵PP。而只要解决这个问题,我们就可以找到一种通用的概率分布采样方法,进而用于蒙特卡罗模拟。本篇我们就讨论解决这个问题的...

2019-09-02 10:44:06 547

转载 NLP点滴——文本相似度

目录前言 字面距离 common lang库 相同字符数 莱文斯坦距离(编辑距离) 定义 实现方式 Jaro距离 定义 实现方式 应用 SimHash 定义 基本流程 相似性度量 存储索引 实现 应用 语义相似性 背景知识 统计语言模型 n-gram模型 词向量 ...

2019-08-25 14:44:13 982

转载 深度学习解决NLP问题:语义相似度计算——DSSM

导语在NLP领域,语义相似度的计算一直是个难题:搜索场景下query和Doc的语义相似度、feeds场景下Doc和Doc的语义相似度、机器翻译场景下A句子和B句子的语义相似度等等。本文通过介绍DSSM、CNN-DSSM、LSTM-DSSM等深度学习模型在计算语义相似度上的应用,希望给读者带来帮助。0. 提纲1. 背景2. DSSM3. CNN-DSSM4. LSTM-DSSM...

2019-08-25 14:37:24 736

转载 推荐系统---深度兴趣网络DIN&DIEN

转载:找到两篇文章,按照时间最早的源头作为原作者进行转载了。深度学习在推荐系统、CTR预估领域已经有了广泛应用,如wide&deep、deepFM模型等,今天介绍一下由阿里算法团队提出的深度兴趣网络DIN和DIEN两种模型paperDIN:https://arxiv.org/abs/1706.06978DIEN:https://arxiv.org/abs/1809.03672...

2019-08-24 18:10:18 407

原创 使用异或交换变量

# -*- coding: utf-8 -*-# @Time : 2019/5/8 15:41# @Author : RIO# @desc: 交换变量x = 1y = 2def swap(a, b): a = a ^ b b = a ^ b a = a ^ b return a, bprint(swap(x, y))...

2019-05-20 11:48:15 331

原创 约瑟环问题(丢手绢)

题目:n个人围成一圈,起始编号为0-n-1。从0开始依次报数,报到m则离开圆圈。问最后离开的人的编号多少?分析:以每个人离开作为一个周期,下一次假设所有人编号变化(其实是映射到)新的编号0-n-2。这里的映射关系可以通过取模获得:每次离开一个人,离开前总人数N,m-1的人离开,那么下次编号和上次编号映射关系是:(x-m)%n因此,可以形成动态规划序列。答案:``...

2019-05-09 22:02:02 804

原创 python并行编程实现

# -*- coding: utf-8 -*-# @Time : 2019/4/9 17:16# @Author : RIO# @desc: threading并发编程import threadingfrom time import ctime, sleepfrom algorithm.basic_algorithm import quanpailieloops = [...

2019-04-10 12:01:58 1203

原创 n个数中寻找m个数,使得和最接近值sum

题目表述:从n个数中找到m个数,使得其和最接近一个值sum。# -*- coding: utf-8 -*-# @Time : 2019/4/3 10:54# @Author : RIO# @desc: TODO:DESCa = [8, 7, 3, 2, 6, 1, 5, 9, 4, 10]# 总共多少个数字total = 10# 选出多少个数字_len = 4# 最...

2019-04-03 21:21:59 2867 1

转载 比较好的A*算法

英文原文链接:http://theory.stanford.edu/~amitp/GameProgramming/ 英文原文参考:http://www-cs-students.stanford.edu/%7Eamitp/gameprog.html#Paths 翻译参考链接:http://blog.csdn.net/b2b160/article/details/4057781...

2019-03-29 09:31:48 723

转载 rocketMq - tag不一致造成的假象

文章很不错,转载!概述 这篇文章是以同事在实际工作中遇到的问题作为分析的切入点,加深自己对mq的掌握,践行“干中学”的团队理念。 当自己差不多把基本概念都掌握的差不多的时候,必须需要实际的案例或者实践来提深自己的深度,这个时候just do it 变得很重要,所以我喜欢不停的被人挑战,截止目前帮人解答的问题包括:client端消息堆积问题、批量消息拉取问题中遇到的神奇的数字...

2019-03-26 17:05:55 596

原创 机器学习之LDA

1.LDA是主题生成模型,由三层贝叶斯模型构成。三层贝叶斯包括:文档-主题、主题-词、前两者的联合分布。2.对每篇文章(或者每个topic)而言,文章-主题属于多项式分布。而多篇文章组成的多项式分布并不属于同一个多项式分布(参数不同)。由于主题是属于具体的每篇文章的,所以不能使用类似NB的策略。多项式分布和Dirichlet分布属于共轭分布。因此多篇文档的分布可以构成一个分布:di...

2019-03-07 00:30:58 723

原创 python服务搭建

python服务搭建1.背景介绍现状:  单位绝大部分服务语言为Java,使用的是过去很长一段时间非常流行的SSM框架:spring+springmvc/springboot+mybatis。众所周知,这些框架经过了无数次、高强度的验证,证实具有高稳定性、高规范性、高敏捷性。也正因此,现在非常多的公司都在采用这一技术架构。局限性:  虽然SSM框架有着如此多的优点,在特定场景下,其还是存...

2019-02-28 13:23:05 818

原创 机器学习算法学习札记

机器学习算法学习札记第一部分:概论一、概论1. 分类、聚类分类和聚类是对于结果的类别是否预先设定。Input有标签的为分类的情形,反之为聚类。2.线性模型、树模型根据特征使用方式分为线性模型和树模型。将多个特征综合考虑,得到一个标签为线性模型。而将多个特征单独考虑,每次按照一个特征分为几类,为树模型。3.分类、回归根据输出值是否连续,分为分类和回归。输出为连续的为回归模型,...

2019-01-31 14:01:23 696

转载 转载:你的同龄人正在抛弃你

美团收购摩拜单车的新闻,刷遍了朋友圈。  许多网友都调侃,以后,可以骑着单车送外卖了。但我更关注的,是另一个80后的美女。  她是,摩拜单车的创始人胡玮炜。  ⒈  仅仅三年,她就把企业,做成了当红的创业公司。这次收购,她可能从中套现15亿以上。  当初,胡玮炜拎着一个行李箱就来到了北京。毕业之后,她做了10年小记者。  十年月薪从四位数到五位数,却用一年把摩拜从0做到10亿美元。  根据《新京...

2018-04-07 11:54:46 4865 5

原创 关于spring学习的杂文

POM:project Objectt Model举例:银行的POMgroupId:代表银行的id,比如工行、招行等artifactId:代表项目的id,比如银行有很多项目:贷款、存款等version:代表当前是工程的哪个版本。所有的POM文件都继承自父POM文件。mvn help:effective-pom命令执行后,打印的是父pom+当前项目的配置。可以在文件中显示指定父pom。也可以这样&l...

2018-04-02 08:53:04 350

原创 jad.exe source not found

解决了一个问题:添加了反编译还是报错source not found!原因是虽然制定了jadclipse,但是在查看class或者jar文件的时候,还是使用的class file viewer!而没有使用我们的jdclipse,我们应该设置jdclipse为default。就解决问题了。...

2018-03-30 01:02:02 424

原创 亚马逊AWSome DAY

今天参加了亚马逊的AWSome DAY,早上8点30-晚上6:00,现在大概总结一下:其实之前云计算的概念听过很多,但是从来没有仔细思考过什么是云计算,也对里面的概念非常陌生,虽然我不做这个,但是之后可能会用一些云产品,总体还是有些收获的。先说些云相关概念:EC2,S3,EBL。区域、可用区。区域是比较大范围的概念,中国目前有北京和宁夏两个区域。每个区域中至少有两个可用区存在。多可用区存在的意义是...

2018-03-29 23:01:53 1830

原创 K8S

容器化:https://www.kubernetes.org.cn/k8s一、基本概念理解一个Pod(豌豆荚)可以承载一个或多个相关的容器。同一个pod上的容器可以部署在一台机器上,方便共享资源。pod通过URI做唯一标志:对象类型(比如pod)、对象名字、对象命名空间。borg是谷歌的内部项目,由于twitter研发出了mesos,为了竞争,google就把borg剔除隐私,更名为kuberne...

2018-03-28 18:53:16 746

原创 入职后的首篇博客

好久没来csdn,竟然都改版这么多了。还是挺好看的。工作了,忙而且很多东西都不好发csdn,挑些无关紧要的东西吧。beelog,golang的日志。outputs,用户定义输出块,内部可以有spliter和filter。spliter可以有formatid来定义输出日志格式。filter定义日志级别。exceptions块里有很多exception,为特定的函数名或文件名定义日志。seenlog可...

2018-03-19 16:45:45 303

转载 elasticsearch及head插件安装

本文为博主原创文章,地址:http://blog.csdn.net/napoay,转载请留言.一、下载安装包下载Elasticsearch 5.1.1下载地址:https://www.elastic.co/downloads/elasticsearchzip和tar格式是各种系统都通用的,解压之后启动Elasticsearch即可。下载elasticse

2017-06-16 12:37:25 805

原创 git好文

http://www.cnblogs.com/springbarley/archive/2012/11/03/2752984.html

2017-06-09 14:57:12 345

转载 mysql源码安装及主从配置

MySQL5.7 的编译安装 2016-01-12 17:24 来自于分类 笔记 服务器 Linux一直嫌弃 MySQL 的编译安装,原因很简单,依赖复杂、容易出错,总之就是麻烦。但这些天由于需要必须编译安装,被迫阅读相关文档,发现现在的 MySQL 安装变得十分简单和容易。直接开始吧。一切从必要依赖开始。yum install -y gcc gcc-c++ ncurses-d

2017-03-31 16:43:02 371

转载 d3.js学习

学习d3js有没有一个系统的学习方法,请前辈或者过来的长辈赐教?(复制自知乎,就不做编辑了)添加评论 分享 默认排序按时间排序7 个回答15赞同反对,不会显示你的姓名ciga201115 人赞同恰好刚看了两天D3,有点感想,供参考。d3的学习曲线确实比较陡,因为它的思想和我们通常绘图的方式不大一样:1、它是声明式的,不是命令式的d3的第一个核心是

2017-01-10 14:44:22 1579

原创 maven learn

1.几个概念本地仓库、中央仓库、远程仓库2.如何将自制的jar包添加进入本地仓库供其他maven项目使用。本例使用的是kaptcha(验证码)文件,可以从网上下到,下载后将其中的jar包保存至本地比如:f:/kaptcha/kaptcha-2.3.2.jar使用如下命令将其添加进入本地仓库: mvn install:install-file -Dfile=f:/kaptcha/ka

2017-01-10 14:40:55 473

原创 d3.js检索mysql数据

搞了几天终于实现了使用d3.js读取mysql数据库,并将结果以树形结构显示在html中。大概说下思路:1.网站入口index.html,通过检索文本框搜索某内容,html内容如下: 2.从1看到网页跳转到check.php页面。该php页面包括四部分:第一部分是php读取mysql数据库的逻辑部分,并将1中检索内容的子孙节点以JSON形式

2017-01-10 00:09:34 1581

原创 php d3js

最近进度比较差,之前刚解决的问题现在又忘了怎么解决的了。1.树形结构由于canvas高度固定,导致当树过宽时,相互之间太挤而字体变型。答:当时可能想的是根据实际读取情况进行判读canvas的高度。2.php如何保存从数据库读取的数据,并将树形结构保存为json结构。答:这有篇文章可能会解决问题,回头再看吧,睡觉了。

2017-01-08 00:17:49 543

转载 服务器定时器

前言前几天在朋友圈看到一个俄罗斯工程师为了给他老婆实时报到情况写了一个自动化脚本,通过定时任务来触发。比如晚上9点了,他的服务器上还有正在运行的SSH进程,就给他老婆发一条短信,“今晚加班晚点回家”,多么温馨的故事啊。碰巧我正在学习swoole扩展,特此记录一下。定时器一般的定时器是怎么实现的呢?我总结如下:1.使用Crontab工具,写一个shell脚本,在脚

2017-01-06 12:26:05 1850

原创 maven学习

1.几个概念本地仓库、中央仓库、远程仓库2.如何将自制的jar包添加进入本地仓库供其他maven项目使用。本例使用的是kaptcha(验证码)文件,可以从网上下到,下载后将其中的jar包保存至本地比如:f:/kaptcha/kaptcha-2.3.2.jar使用如下命令将其添加进入本地仓库: mvn install:install-file -Dfile=f:/kaptcha/ka

2017-01-02 01:42:01 429

原创 packet_write_wait: Connection to 192.30.253.112: Broken pipe

往github push文件时出现packet_write_wait: Connection to 192.30.253.112: Broken pipe这个问题是因为传输过程被打断,而导致传输失败。解决办法有两种:1.电脑不做其他用途,专门用来push2.将ServerAliveInteval时间加长,就是在打断时间不算太长的情况下保持传输。方法如下:Host *Serve

2017-01-01 23:31:43 13854

原创 maven为什么总是m2

之所以是M2,其实是maven 2,从第二个版本继承下来的。

2017-01-01 22:40:16 1820

原创 d3.js update enter exit

D3的应用非常广泛,现在成为了主流数据可视化工具之一。大家在刚接触使用d3.js的时候,感到最吃力的地方是data(), enter(), exit()这几个操作。在我接触一段时间,有了一些了解之后,简单说说我的理解。data()先看一个例子:?12345执行代码:

2016-12-29 00:54:26 432

原创 CSDN BUG

CSDN之前登录出现错误,从一个账号登录进入了另一个账号,都已经转到了开源中国了,又发现可以使用了,希望以后别再出现类似问题了。

2016-12-21 00:02:56 537

原创 solr新手入门

这两天学习了下solr,大概说下心得。1.系统背景:jdk8+solr6.3.0+windows2.下载首先下载文件,官网下载,地址为:http://www.apache.org/dyn/closer.lua/lucene/solr/6.3.0。官网的quickstart文件:http://lucene.apache.org/solr/quickstart.html3.解压

2016-12-17 17:11:43 434 1

翻译 solr

环境:CentOS 6.5, JRE 1.7, Solr 5.0.0, ZooKeeper 3.6一、启动、停止操作1. 启动、重启./bin/solr start [options]./bin/solr start -help./bin/solr restart [options]./bin/solr restart -help

2016-12-17 15:13:59 2378

原创 嵌套网站demo

自己做的一个iframe DEMO,很简单。IIS7<!--body { color:#000000; background-color:#B3B3B3; margin:0;}#container { margin-left:auto; margin-right:auto; text-align:center; }a img { border:none;

2016-12-13 11:12:27 877

原创 网页嵌套

网上看到个嵌套的例子:http://www.ruanyuan.net/portal.php?mod=topic&topicid=9查到的方法有1.iframe 2.JSjs的例子: new_file document.getElementById

2016-12-13 11:01:31 876

原创 discuz数据字典

http://faq.comsenz.com/library/database/x3/x3_index.htm

2016-12-13 00:22:31 494

原创 pc上三个网站说明

1.IIS7欢迎网站服务器:IIS无数据库位置:c:\inetpub\wwwroot2.qddxjz.com网站服务器:IIS数据库:access位置:E:\webroot\3.opensns网站服务器:Apache数据库:mysql位置:E:\webrootIIS启动方式:iisresetapache使用phpstudy控制。配置文件都

2016-12-12 18:54:41 394

原创 IIS安装配置

1.配置IIS环境2.打开IIS工作环境3.浏览默认目录(新建目录)其他:1.网站绑定很容易出现问题,目前阶段不需要绑定。2.更改网站目录地址:首先更改路径为everyone共享属性。取消绑定。OK!

2016-12-10 10:06:00 335

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除