5 coder_oyang

尚未进行身份认证

我要认证

墓志铭

等级
TA的排名 3w+

检索-推荐

1.Annoy(Approximate Nearest Neighbors Oh Yeah)算法是应用于稠密矩阵的最近邻查找算法,Annoy的目标是建立一个数据结构,使得查询一个最近邻的时间是线性的。Annoy通过对输入矩阵建树来获取O(log n)的检索速度建库:平面内随机取一个点作为种子节点,随机取200个节点判断每个点和哪个种子距离更近,取上述点的中心为最终的中心点,优缺点:树形检索快;...

2020-02-26 17:31:56

Linux sendmail 报警邮件

参考 https://blog.csdn.net/qq_35326134/article/details/90312932参考 https://www.runoob.com/w3cnote/centos-mail-command-sendmail.html

2020-01-02 14:25:42

python 多线程-demo

import threadingdef thread_num(ss, num): total = len(ss) split_data = [ss[i: i + int(total/num)] for i in range(0, len(ss), int(total/num))] for d in split_data: t = threading.T...

2019-12-26 17:15:28

git从入门到精通

教程1:git详解 教程2:图解git

2019-10-08 17:15:29

github readme markdown- readme格式在线工具

基本格式 在线工具

2019-09-02 15:46:41

推荐系统--论文

1. Deep Neural Networks for YouTube Recommendations 对应中文解读 重读Youtube深度学习推荐系统论文,字字珠玑,惊为神文2. https://github.com/wzhe06/Reco-papers 推荐系统论文列表...

2019-07-12 16:47:58

tar 打包压缩-解压文件

背景常需要将本地工具上传集群,并在集群解压,涉及到解压后的路径问题,故整理压缩解压tar.gz指令压缩压缩分成两个步骤:打包;压缩1. 打包成tar文件,打包路径,影响解压路径1. tar -cf YOUFILE.tar bin/## 将bin文件夹打包进YOUFILE.tar文件夹2. tar -rf YOUFILE.tar conf/## 将conf文件新增进YOU...

2019-07-01 15:26:53

python - 技巧

1. 安装过多第三方包,通过 python -c "import mxnet; print mxnet.__file__"输出安装包路径

2019-06-27 20:50:49

dict-get用法

2019-05-10 12:35:22

paper list

Chris Dyer Neural architectures for named entity recognition

2019-05-09 17:15:22

vim 纵向编辑技巧

一. 插入ctrl + v 进入 VISUAL BLOCK 纵向编辑模式 通过方向键选定列 I 选中列首插入;A选中列尾插入 插入内容 esc二. 删除ctrl + v 方向键选中 d参考 https://www.ibm.com/developerworks/cn/linux/l-cn-vimcolumn/三, 命令行光标移动ctrl+a : 跳到行首 ctrl...

2019-05-09 16:42:08

远程获取文件

1. wget2. scp3. python -m SimpleHTTPServer 8003 启动http服务 wget 机器/文件路径 获取文件, 文件路径取决于该服务启动的路径,可通过 机器名:8003在浏览器中查看文件目录...

2019-04-30 16:27:16

hadoop streaming bistreaming ustreaming

1. 问题1close failed in file object destructor:sys.excepthook is missinglost sys.stderr

2019-04-24 11:28:23

vim insert VISUAL模式

vim中使用鼠标右键粘贴,失败。vim的模式:网上解法:1.普通模式下输入“:setmouse-=a”,有效2..vimrc中添加:ifhas('mouse')setmouse-=aendif失效查资料发现:vi的三种模式,命令模式,插入模式,可视模式。鼠标可以启动于各种模式中:Themousecanbeenabledfordi...

2019-04-08 17:01:54

SQL

date nums tag 2019-3-11 1 A 2019-3-11 2 B 2019-3-12 4 A 2019-3-12 5 B select nu-nums,F.tagfrom( select * from pandora_fea_num where {t [...

2019-03-12 17:48:05

知识图谱二 -- DeepDive

https://blog.csdn.net/alitech2017/article/details/80134104https://blog.csdn.net/xgjianstart/article/details/70214852知识图谱特征学习http://baijiahao.baidu.com/s?id=1602210213239784098&wfr=spider&amp...

2019-03-10 16:22:58

知识图谱一 -- 知识图谱架构、DeepDive中文抽取示例

一.DeepDiveDeepDive(http://deepdive.stanford.edu/)是斯坦福大学开发的信息抽取系统,能处理文本、表格、图表、图片等多种格式的无结构数据,从中抽取结构化的信息。系统集成了文件分析、信息提取、信息整合、概率预测等功能。Deepdive的主要应用是特定领域的信息抽取,系统构建至今,已在交通、考古、地理、医疗等多个领域的项目实践中取得了良好的效果;在...

2019-03-10 15:10:25

设置secureCRT不掉线的方法

Options—>Global Options—>General—>Default Session—>Edit Default Settings—>Terminal—>Anti-idle选中Send protocol NO-OP every 120 seconds

2019-03-08 11:34:38

HQL - HiveQL

use namespace dba_ns; #选定数据库set user_write_ugi:hdfs://nmg01-xxxx-hdfs.dmop.xxxxx.com:54310/app/ecom/fcr/bigdata_dump/user_feature/=xx,xxxxxxx; #赋值:用户名,密码insert overwrite directory 'hdfs://nmg01-xxxx...

2019-02-23 13:31:05

linux tmp自动清理

1. 背景线上机器总是报内存不足,df -h 发现存储空间占满,df -i ,发现是tmp中临时文件占满,可以修改系统定时清除tmp文件的时间间隔tips1 : 指定目录下,列出文件大小du -h --max-depth=1tips2: will delete all files and folders older than 100 days find /tmp/pu* -c...

2019-01-22 15:27:13

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!