4 coder_oyang

尚未进行身份认证

墓志铭

等级
TA的排名 3w+

git从入门到精通

教程1:git详解 教程2:图解git

2019-10-08 17:15:29

github readme markdown- readme格式在线工具

基本格式在线工具

2019-09-02 15:46:41

推荐系统--论文

1.DeepNeuralNetworksforYouTubeRecommendations对应中文解读重读Youtube深度学习推荐系统论文,字字珠玑,惊为神文2.https://github.com/wzhe06/Reco-papers推荐系统论文列表...

2019-07-12 16:47:58

tar 打包压缩-解压文件

背景常需要将本地工具上传集群,并在集群解压,涉及到解压后的路径问题,故整理压缩解压tar.gz指令压缩压缩分成两个步骤:打包;压缩1.打包成tar文件,打包路径,影响解压路径1.tar-cfYOUFILE.tarbin/##将bin文件夹打包进YOUFILE.tar文件夹2.tar-rfYOUFILE.tarconf/##将conf文件新增进YOU...

2019-07-01 15:26:53

python - 技巧

1.安装过多第三方包,通过python-c"importmxnet;printmxnet.__file__"输出安装包路径

2019-06-27 20:50:49

dict-get用法

2019-05-10 12:35:22

paper list

ChrisDyerNeuralarchitecturesfornamedentityrecognition

2019-05-09 17:15:22

vim 纵向编辑技巧

一.插入ctrl+v进入VISUALBLOCK纵向编辑模式 通过方向键选定列 I选中列首插入;A选中列尾插入 插入内容 esc二.删除ctrl+v 方向键选中 d参考https://www.ibm.com/developerworks/cn/linux/l-cn-vimcolumn/三,命令行光标移动ctrl+a:跳到行首 ctrl...

2019-05-09 16:42:08

远程获取文件

1.wget2.scp3.python-mSimpleHTTPServer8003启动http服务wget机器/文件路径获取文件,文件路径取决于该服务启动的路径,可通过机器名:8003在浏览器中查看文件目录...

2019-04-30 16:27:16

hadoop streaming bistreaming ustreaming

1.问题1closefailedinfileobjectdestructor:sys.excepthookismissinglostsys.stderr

2019-04-24 11:28:23

vim insert VISUAL模式

vim中使用鼠标右键粘贴,失败。vim的模式:网上解法:1.普通模式下输入“:setmouse-=a”,有效2..vimrc中添加:ifhas('mouse')setmouse-=aendif失效查资料发现:vi的三种模式,命令模式,插入模式,可视模式。鼠标可以启动于各种模式中:Themousecanbeenabledfordi...

2019-04-08 17:01:54

SQL

date nums tag 2019-3-11 1 A 2019-3-11 2 B 2019-3-12 4 A 2019-3-12 5 B selectnu-nums,F.tagfrom(select*frompandora_fea_numwhere{t[...

2019-03-12 17:48:05

知识图谱二 -- DeepDive

https://blog.csdn.net/alitech2017/article/details/80134104https://blog.csdn.net/xgjianstart/article/details/70214852知识图谱特征学习http://baijiahao.baidu.com/s?id=1602210213239784098&wfr=spider&amp...

2019-03-10 16:22:58

知识图谱一 -- 知识图谱架构、DeepDive中文抽取示例

一.DeepDiveDeepDive(http://deepdive.stanford.edu/)是斯坦福大学开发的信息抽取系统,能处理文本、表格、图表、图片等多种格式的无结构数据,从中抽取结构化的信息。系统集成了文件分析、信息提取、信息整合、概率预测等功能。Deepdive的主要应用是特定领域的信息抽取,系统构建至今,已在交通、考古、地理、医疗等多个领域的项目实践中取得了良好的效果;在...

2019-03-10 15:10:25

设置secureCRT不掉线的方法

Options—>GlobalOptions—>General—>DefaultSession—>EditDefaultSettings—>Terminal—>Anti-idle选中SendprotocolNO-OPevery120seconds

2019-03-08 11:34:38

HQL - HiveQL

usenamespacedba_ns;#选定数据库setuser_write_ugi:hdfs://nmg01-xxxx-hdfs.dmop.xxxxx.com:54310/app/ecom/fcr/bigdata_dump/user_feature/=xx,xxxxxxx;#赋值:用户名,密码insertoverwritedirectory'hdfs://nmg01-xxxx...

2019-02-23 13:31:05

linux tmp自动清理

1.背景线上机器总是报内存不足,df-h发现存储空间占满,df-i,发现是tmp中临时文件占满,可以修改系统定时清除tmp文件的时间间隔tips1:指定目录下,列出文件大小du-h--max-depth=1tips2:willdeleteallfilesandfoldersolderthan100daysfind/tmp/pu*-c...

2019-01-22 15:27:13

流式计算引擎

批量计算:收集数据-存入DB-取出分析,先将数据存进去,再处理区别:1.与批量计算累积数据不同,流式计算将大数据平摊到各个结点上,连续进行小批量的传输,流动,计算完后抛弃2.批量计算维护一张表,对表进行各种逻辑操作,流式计算相反,须先定义好计算逻辑,提交到流式计算系统,计算逻辑在整个运行期间不可更改3.计算结果上,批量计算是对全部数据计算后传输结果,流式计算是每次小批量计算后...

2019-01-11 20:25:50

数据展示

reviewhtmlcase,起serverhtml测试页面https://www.w3school.com.cn/tiy/t.asp?f=html_table_test将文件放在html文件夹下,在html存放目录下,运行nohuppython-mCGIHTTPServer8888&#端口号自定义#coding:utf-8importsys#...

2018-12-17 16:13:57

screen - nohup

通常情况下我们都是为每一个任务开一个远程终端窗口,因为他们执行的时间太长了。必须等待它执行完毕,在此期间可不能关掉窗口或者断开连接,否则这个任务就会被杀掉,一切半途而废了1.为什么关掉窗口/断开连接会使得正在运行的程序死掉进程组(processgroup):一个或多个进程的集合,每一个进程组有唯一一个进程组ID,即进程组长进程的ID。 会话期(session):一个或多个进程组的集合...

2018-12-04 14:39:45

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!