15 pennyliang

尚未进行身份认证

我要认证

of the people, by the people, for the people--abraham lincoln

等级
TA的排名 744

识别渣男大测试

大家好,即上次识别富人题目之后,结合今天的男研究生求复合招据,捅死女友的新闻,很是感慨。决定命制一套识别渣男题目,供广大女生朋友能够早期识别渣男。首先定义下渣男,我的定义就是心智不成熟,很难有什么作为,也难扛起家庭的责任,对家庭关系缺乏理解,过度考虑自己感受,比较极端,未来的相处比较困难的这一类人。当然万一如果不幸是这一类人也不要紧,要积极改变,努力战斗,改掉内心深处的bug。...

2019-04-26 17:15:13

运营汇编2 两个文件如何去重

假定文件Axxxyyyzzz假定文件Byyyzzzkkk如何去重得到文件Cxxxyyyzzzkkk推荐解法:          cat A B | sort | uniq       如何得到他们的交集D ?  yyy  zzz方法1:       sort A > A.sort

2016-09-29 13:37:48

【运营汇编1】如何确保数据传到远程服务器上

#!/bin/bash7za a log.7z log              #将文件log压缩成log.7z7za t log.7z                      #检验文件log.7z是否可解压。rsync -avP log.7z root@192.168.1.1:/data/   #将log.7z传送到192.168.1.1 服务器上。整个

2016-09-29 13:18:17

内网机器做数据备份机,外网主机直接rsync的实现

今天在美团云主机购买了一台1TB的内网主机,用作日志备份,不含公网IP。这样能便宜一点。内网IP为:10.128.134.X(主机A)另有一台日志主机,有外网IP,但硬盘较小,IP为:104.238.131.Y(主机B)第一步: 在主机A上执行:ssh -NfR 10000:localhost:22 root@104.238.131.Y  并输入主机B的root密码

2015-04-07 14:58:35

crontab中执行其他账号运行的程序 免密码

我有一个crontab但是执行的脚本中包含这么一句,如下:/usr/bin/sudo -u pennyliang bash -c ' echo xxx '这时这个echo xxx总是执行不了,后来发现是因为root的 crontab的脚本如果切换到其他账号是需要账号密码的,找到一个文章,解决了这个问题,并记录下来 http://blog.csdn.net/wangxia

2015-01-29 09:47:43

linode的网卡丢失问题解决了(终极解法)

这次的惊魂让我提高很多,先说提高,再说故事经过。文章可能有点乱,大家包涵。1)linode还有一种可以ssh上去的方式       第一步 ssh pennyliang@lish-tokyo.linode.com   然后在提示中输入密码(其中pennyliang是linode的用户名,lish-tokyo.linode.com表示东京机房)其他几个机房依次是: lish-tokyo.li

2014-12-26 11:47:22

mmap ENOMEM(errno 12) 错误

今天触发了一个大坑,发现mmap在映射大量文件的时候,会失败,返回ENOMEM错误。找了一圈,有的说是swap不够,增加了swap也没用,可见不是这个问题。后来看了美军一个文章(http://www.enchantedage.com/node/235),加一个配置即可:echo 1000000 > /proc/sys/vm/max_map_count

2014-12-02 14:58:40

PRank的学习和理解

PRank是一个pointwise的监督学习排序的方法,一般被用作baseline。我看了下论文,然后动手写了个小实验,进行了理解。        其基本需求是:对于每个对象,会有不同角度的打分,现在需要一种方法融合这些打分来给他们一个排序。例如,给体操打分,会有不同的项目,空中姿态分,落地分,技术难度分等等,单向打分一般比较容易,规则是死的,落地没站住就扣0.2。。但是这

2013-12-15 13:35:29

一类监督学习问题

假定我们有一组object n个O1,O2,...On,每个Object有m个特征,f1,f2,...fm 。我们已知的数据如下1)我们知道每个object的特征取值例如 f1(Obj1) = 0.5 f2(Obj1) = 0.2 ... fm(Obj1) = 0.12)我们知道每个Object的两两比较结果,Pij表示objecti > objectj 或者说前者好于

2013-12-10 15:38:30

文件夹超过1万个压缩文件时,Argument list too long问题的解决

最开始的命令如下ls *.tar.gz | xargs -n1 tar xzvf系统报错:Argument list too long原因是ls* 不能list这么多的文件。改为 find ./ -type f -name '*.tar.gz' -exec zcat {} \;就可以了。zcat后面空格{},再空格\,再加一个分号

2013-04-05 17:11:15

LDA实现的两种方法

今天看到美帝一个实现LDA的法子,实现了一把,结果也对,参加方法2。可以对比方法1,计算量是降低了很多。      但无论如何,有一个显著的开销是很大的,这就是每个Wm,n 都需要记录一个类标签,也就是代码中doc那个三维矩阵,x表示文档编号{0-15},y表示term编号{0-4},z表示label{0-1}     假定文档有10M个(一千万),每篇文章1000个词,词典空间10K个,

2013-03-31 21:36:16

浅谈gibbs sampling(LDA实验)

先把问题描述一下:如果我们已知了topic内的每个词的词频,比如下图中topic1 中money 2 次,loan 3次...那么任意给一个文档我们可以对里面每一个词算一个产生这个词的概率即 P(w=wi|t=tj)如下图,doc1 中的money 百分之百的来自于topic1 。doc2 中的词用topic1 无法全部解释,必须借助topic2 。但现在问题是,如果我们只有一堆文档,

2013-03-22 10:39:35

浅析Likehood MAP MLE

举个例子说明Likehood MAP MLE假定有犯罪团伙A和犯罪团伙B。假定我们的概念有h{h1: 所抓得人是团伙A的h2: 所抓得人是团伙B的....}如果我们抓到了一票人是a1,a2,...an,那么这伙人是团伙A还是团伙B?即求解P( h|D={a1,a2,...an} )?假定从案底显示,团伙A有10个人,团伙B有20个人,团伙A被抓到的概

2013-03-20 10:50:49

关于编译器的一个问题

今天看了下@leekayak 提到的一个问题 http://weibo.com/1465082730/znOSZzU4v       我试图用一个简单的例子来解释下,首先看一段更简单的代码。       #include "stdio.h"#include "stdlib.h"#include int f = 0;int x= 0;void* t1(void*){

2013-03-17 13:32:14

firefox 17.0 编包记(fedora 17)

前不久某神秘老板,找我聊天,说他们有个大计划,最后苦恼在做一个浏览器上,我说如果你们需求不复杂,编译个开源的,不就完了,他表示他们的研发队伍还没有建立,so,需要一个做demo的炮灰。找一些外包吧,价钱也贵,看我执行力这么好,so,让我来执行~~~。        我在江湖上的炮灰形象太高大了吧,我断然拒绝了他,但我想我确实也没编译过浏览器,自己编一个玩玩,没想到这事档了我1天时间,我把整个过

2013-02-02 13:39:01

ssh-keygen+ssh-copy-id 在linux下实现ssh无密码登录访问

ssh到163机器上,需要密码,这样对一些脚本工作不方便,因为需要密码,也就是需要人工干预。此前用的方法是拷贝authorized_keys里面(记不清了,以前搞过),最近发现一个命令ssh-copy-id很方便,try了一下,果然好用,记录下来:在192.168.42.142机器上1)运行:ssh-keygen -t rsa2)然后拍两下回车(均选择默认)3)运行: ss

2013-01-30 16:13:54

tar.gz 文件坏了,崩溃了,有恢复办法的

1)首先需要安装 gzrt   例如;    yum list | grep gzrt   yum install gzrt.x86_64    2)运行cpio 看是否安装了,如果没装也要装,最新版本的linux一般都安装了,比如我的就安装了3)按照下面的例子做恢复$ ls *.gzmy-corrupted-backup.tar.gz$ gzrecover

2013-01-17 16:31:45

硬盘空间不够用了,怎么办,还有更绝的

今天,发现硬盘空间不够了,怎么办。1)首先这个分区是LVM的,因此看看是否前人还给留了空间      输入lvm,进入lvm的提示符2)输入pvscan,天啦,前人还给留了1.78TB啊,是不是真的?  lvm> pvscan  PV /dev/sdg1   VG VolGroup   lvm2 [1.82 TiB / 1.78 TiB free]   3)lv

2013-01-17 10:48:55

今天try了下folly的small lock 很好

#include #include #include #include #include #include namespace detail { class Sleeper { static const uint32_t kMaxActiveSpin = 4000; uint32_t spinCount; public: Sleepe

2012-12-11 11:11:57

昨天,我发布了微博寻人二代系统-微博寻人链

昨晚在新浪博客发了个博文,分享了些开发思考:http://blog.sina.com.cn/s/blog_593af2a701017jxn.html       这里就技术性问题,做一个分享,谈谈开发过程中最困难的问题。       微博寻人链,简单来说,就是你有一个话题,你想知道,什么人是讨论这个话题,最积极的人。你如“小米”,这个概念,谁是最爱讨论的人。就解决这个问题。

2012-09-16 10:33:43

查看更多

勋章 我的勋章
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。