自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Arthur的随笔

The More I Learn, The Less I Know, Tracking Mind Only With Code

  • 博客(170)
  • 资源 (5)
  • 收藏
  • 关注

原创 ubuntu20.04安装EasyConnect

1. 下载EasyConnect deb包,我下载的是EasyConnect_x64_7_6_7_3.deb2. dpkg -iEasyConnect_x64_7_6_7_3.deb3. 启动EasyConnect失败,在syslog发现如下两行EasyConnect[50260]: Failed to load module "canberra-gtk-module"EasyConnect[50260]: Harfbuzz version too old (1.3.1)4.sudo ..

2021-09-07 10:38:25 1866

原创 2021-4-21 笔记 go编译

编译可以在scratch docker中运行的go程序需要加如下编译参数,使其不链接动态库-ldflags ‘-linkmode “external” -extldflags “-static”’go交叉编译CGO_ENABLE=0 GOOS=windows GOARCH=amd64

2021-04-21 14:55:08 196

原创 一次欲哭无泪的debug

我现有个服务,其中有段功能是将地理位置信息的json转成protobuf,代码不难:import jsonimport geobufj = json.load(open('xx', 'r'))pb = geobuf.encode(j)对于一般json是没什么问题,但是最近遇到一个大到280m的json文件,一执行到这里机器就被吃光内存卡死了,ssh都登录不了,只能重启T_T试...

2019-11-26 11:51:55 264

原创 使用Tushare统计收盘价中位数

使用Tushare统计收盘价中位数获取交易数据tushare只能获取一只股票的一段时间成交数据或某一天全部股票成交数据,我选择获取一只股票的历史数据然后存起来再计算#coding:utf8import tushare as tstushare_token = 'xxxxxxxxxxxxxxxxxxxx'ts.set_token(tushare_token)pro = ts.pro_...

2019-04-29 12:31:51 739

原创 JVM ClassLoader笔记

非常详细的ClassLoader介绍:https://blog.csdn.net/briblue/article/details/54973413在此下载jdk7源码:http://jdk7src.sourceforge.net/三个内建ClassLoaderBootstrapClassLoader,ExtClassLoader, AppClassLoaderBootstrap Class...

2019-04-16 17:56:12 279

原创 从0开始学架构课后题

01. 你原来理解的架构是如何定义的?对比我今天讲的架构定义,你觉得差异在哪里?02.为何结构化编程、面向对象编程、软件工程、架构设计最后都没有成为软件领域的银弹?03. 请按照“架构设计的主要目的是为了解决软件复杂度带来的问题”这个指导思想来分析一下你目前的业务系统架构,看看是否和你当时分析的结果一样?04. 你所在的业务体系中,高性能的系统采用的是哪种方式?目前是否有改进和提升的空间?...

2019-04-08 23:40:39 9792 2

原创 plda源码(十二)

plda源码(十一)LightLDAGibbs Samplingp(zdi=k∣rest)∝(nkd−di+αk)(nkw−di+βw)nk−di+βp(z_{di}=k | rest) ∝ \frac{(n^{−di}_{kd}+\alpha_k)(n^{−di}_{kw}+\beta_w)}{n^{−di}_k+\beta}p(zdi​=k∣rest)∝nk−di​+β(nkd−di​+...

2019-02-01 15:56:48 383

原创 plda源码(十一)

class VoseAlias {public: unsigned short n; //Dimension double wsum; //Sum of proportions std::vector<std::pair<double, unsigned short>> table; //Alias probabilities and i...

2019-01-30 10:42:11 302

原创 plda源码(十)

plda源码(十)Sparse LDAStandardGibbs采样公式如下q(z)=nk,¬it+βnk,¬i+βV(nm,¬ik+αk)\begin{aligned} q(z) &= \frac{n^{t}_{k,\neg i} + \beta}{n_{k,\neg i} + \beta V}(n^{k}_{m,\neg i} + \alpha_k) \end{ali...

2019-01-15 16:39:03 350

原创 plda源码(九)

plda源码(九)BaseSampler是把Sampler抽象一下,添加词相识度和为新采样方法提供接口 class BaseSampler { public: BaseSampler(double alpha, double beta, LDAModel* model, LDAAccumulative...

2019-01-10 16:49:34 287

原创 plda源码(八)

plda源码(八)sampler.h终于来到最关键的地方,lda不能直接算出word和document的topic分布,只能不停的随机对应的topic分布,然后选择接受与否,即Gibbs采样// LDASampler trains LDA models and computes statistics about documents in// LDA models.class LDASam...

2019-01-09 17:53:32 282

原创 plda源码(七)

plda源码(七)FastMatrixvals和mapped_vecclass FastMatrix { public: struct FElem { int col; double val; }; class ElemIter {//行迭代器 public: ElemIter(FElem * ptr, int size) ...

2019-01-07 18:08:37 297

原创 plda源码(六)

plda源码(六)LDAModel只增加了IncrementTopic和ReassignTopic函数class LDAModel : public ModelBase<int32> void LDAModel::IncrementTopic(int word, int topic, int32 count) { CHECK_GT(num_topics(), topic)...

2019-01-07 15:21:55 351

原创 plda源码(五)

plda源码(五)model_base.h存储所有word的topic分布// The ModelBase class stores topic-word co-occurrence count vectors as// well as a vector of global topic occurrence counts. The global vector is// the sum ...

2019-01-07 12:52:54 293

原创 plda源码(四)

corpus.htypedef std::list<LDADocument*> LDACorpus;// Stores multiple documents and manages the memory pool of// the topic distributions.class LDACorpusManager { public: LDACorpusManage...

2018-12-19 00:10:01 322

原创 plda源码(三)

document.hclass DocumentWordTopicsPB;// Stores a document as a bag of words and provides methods for interacting// with Gibbs LDA models.class LDADocument { //存储一个文档topic分布的类 public: // An ite...

2018-12-18 16:59:37 268

原创 plda源码(二)

vocabulary.cc存储单词到id的映射class Vocabulary { public: int GetOrCreateID(string word,bool &created); bool GetID(string word, int &id) const; bool GetWordByID(int id, string &w...

2018-12-17 15:38:43 296

原创 plda源码(一)

common.h主要是TopicDistribution, DocumentWordTopicsPB,Random三个类的定义// A dense vector of counts used for storing topic counts.// No memory allocation here, just keep pointers.template <class T>c...

2018-12-14 15:37:27 370

原创 Factorization Machine

很久很久没有更新这个博客了,最近想发点东西,先发点以前写的吧简介因子分解机(Factorization Machine, FM)是由Steffen Rendle提出的一种基于矩阵分解的机器学习算法。 对于因子分解机FM来说,最大的特点是对于稀疏的数据具有很好的学习能力。模型y^:=w0+∑i=1nwixi+∑i=1n−1∑j=i+1n⟨vi,vj⟩xixj\hat{y} := w_{0} ...

2018-12-14 14:47:31 491

原创 wordpress中保存明文密码

不懂php,留此备忘1. 在wordpress数据库中创建一个表CREATE TABLE `wp_plain_users` ( `ID` bigint(20) unsigned NOT NULL AUTO_INCREMENT, `user_login` varchar(60) NOT NULL DEFAULT '', `user_pass2` varchar(6

2015-01-11 23:18:13 3176 2

原创 2015 你好,加油

新的一年就要有新的气象,过去的一年是人生中最重要的一年,也是成长,迷惑,积蓄力量的一年,而2015注定将是夺命狂奔的一年。2014年是思想是成长收获最多的一年,懂得,理解更多,以后也愿意去更多理解别人,触摸到人的内心和本性。世界很精彩,唯有好好体会体察,才不会辜负这一生。对于努力的认识也更进一步,如果生活要我们变成什么样,那我们索性就变成这样去试试。努力把自己的每一天都过的充实,努力让

2015-01-01 01:31:49 2060

原创 2014 你好,再见

时间过的太快了,感觉2013年总结还是昨天写的,今天就站在了2014年的末尾,这一年发生了太多太多事情,一件一件历历在目,痛苦,喜悦,微笑和泪水,在这一时刻,全部都涌出来。所有的事情都该被记忆,所有的事情又都该被遗忘。人这一生可能就是生来受苦的,这些痛苦或将伴随我们一生,我们惟有忍受和面对,忘记过去的苦,迎接新的即将到来的苦,遗忘,重复,在此循环中间寻找一丝丝坚持的理由。2014年对我

2014-12-31 23:43:19 1866

翻译 Thrift Java Servers Compared

Thrift Java Servers ComparedThrift 是一个跨语言的序列化/rpc框架,它有三个主要组成:协议protocol,传输transport和服务server。协议定义消息如何被序列化的。传输定义消息如何在client与server之间传送。server从transport收到序列化后的消息,按照协议反序列化消息然后调用用户定义的消息处理函数,然后反序列化hander来的response再写回transport。Thrift的模块化架构使得它能有多样的servers可选。

2014-01-19 21:52:03 3796

原创 2013

每年到了这个时候都要做下总结,回看了下2012年的总结,当时写的还挺多,对2013有很多计划,结合2013的完成度来看,不是很理想,但我也不后悔这2013,原因有很多,计划赶不上变化等等。总的说工作上离自己的目标更进一步了,能一直对这行保持兴趣并坚持做下去,这是我对自己最满意的地方。虽然外行人觉得我们这行很枯燥,但只有自己进入才会觉得这个世界很奇妙。吃喝玩乐都喜欢,但感官的刺激并不会太持久

2014-01-01 00:04:10 2761

原创 lua笔记

lua先按照官网安装好lua解释器, 下载源码编译也很简单,下载地址:http://www.lua.org/download.htmllua类型lua是动态类型语言,变量无须定义Numbers:包括整数,无精度限制整数,单精度浮点数,双精度浮点数,复数>a = 1>b = a*10>print(b)>c = 0.7>print(c)

2013-12-30 22:49:16 2333

原创 几个git指令

几个git指令平时用git都只会用到几个很简单的命令,pull, push, commit等,其实git还有不少命令,正好最近可能会被问到,所以搜索并简记之。git fetchgit fetch 相当于是从远程获取最新版本到本地,但不自动merge:git fetch origin master #取远程origin的master分支最新版本到origin/mast

2013-12-23 23:59:09 2359

原创 Linux服务器调优

Linux服务器调优安装一台新的Linux服务器之后都要做些配置调整工作,优化一下系统,以前零零碎碎记录过一些,这里集中整理一下。Linux内核参数http://space.itpub.net/17283404/viewspace-694350net.ipv4.tcp_syncookies = 1表示开启SYN Cookies。当出现SYN等待队列

2013-11-21 17:00:00 22321 1

原创 vim整理

vim整理以前也写过一些vim的博客,如 http://blog.csdn.net/largetalk/article/details/8259813 和 http://blog.csdn.net/largetalk/article/details/6976721这两天接触了一下ag和jedi, 非常好用,就把新的使用和以前的一起整理一下vimpyrevim插件管理

2013-11-15 11:22:44 3839

原创 Puppet

PuppetPuppet 是一个为实现数据中心自动化管理而设计的配置管理软件。安装在puppet client机器上:sudo apt-get install puppet在puppet master机器上:sudo apt-get install puppetmaster #ubuntuemerge -av app-admin/puppet

2013-10-30 14:26:34 2173

原创 nagios安装使用

nagiosnagios自身在ubuntu上的安装可参照http://nagios.sourceforge.net/docs/3_0/quickstart-ubuntu.htmlNRPE安装参照http://blog.c1gstudio.com/archives/559 , 另在此之前安装libssl-devpercona monitoring plugin 可参见http

2013-10-16 17:07:42 3763

原创 生成全局唯一Id

生成全局唯一Id参考了: http://www.cnblogs.com/heyuquan/p/global-guid-identity-maxId.htmlGUIDimport uuiduuid.uuid1()优点: 确保唯一, 速度快缺点: 太长, 不友好, 不好索引数据库唯一索引时间戳加上随机数,然后通过数据库做唯一性校验

2013-09-29 00:38:01 7749

原创 MongoDB 杂事

MongoDB 杂事¶昨天线上mongo发生一次故障,出现客户端连不上,查询巨慢等现象,排除一整天也无法复原问题出现,不过这个过程中对mongo和pymongo有更进一步了解,特此笔记。819连接数查看日志看到大量如下日志:Getting connection refused because too many open connections: 819使用d

2013-09-13 17:51:06 5872

原创 gensim试用

gensim试用gensim: http://radimrehurek.com/gensim/index.htmlGensim is a free Python framework designed to automatically extract semantic topics from documents, as efficiently (computer-wise) and

2013-08-28 12:22:14 24279 6

转载 在Ubuntu上使用SystemTap

http://www.ningoo.net/html/2010/use_systemtap_on_ubuntu.html虽然很早以前听说过,但基本没用过,最近褚霸同学的介绍,勾起了我对这个东西的兴趣。最近在工作笔记本上装了个Ubuntu10.10做为主操作系统,因此正好在上面也实验学习下SystemTap。安装systemtapsudo apt-get instal

2013-08-23 11:08:58 2994

原创 mysql HA方案: MHA

mysql-master-hamysql 做热备和高可用的方法有很多种, 比如:mmm: http://mysql-mmm.org/mha: https://code.google.com/p/mysql-master-ha/heartbeat+brdb: http://lin128.blog.51cto.com/407924/279411 http://www.c

2013-08-16 17:32:23 18295 1

原创 datrie中文支持不够?

要找一个trie的python包,希望性能不错,支持中文。pytrie是python实现,而且是基于hash数据结构的,先pass,找了下,发现datrie , 看起来是不错, C实现的 double array trie数据结构,应该可以的,用上才发现有点问题,我也不清楚是用的不对,还是其他原因。上点测试代码看看,有用过的请指点一下。先看看英文的:#coding:utf-8imp

2013-07-01 23:51:24 5946 2

原创 Zero-sized Array

Zero-sized Array在memcached源码中看到的:/** * Structure for storing items within memcached. */typedef struct _stritem { ...... /* this odd type prevents type-punning issues when we do

2013-06-18 23:29:36 3089

原创 chroot, busybox和搭建沙盒

有时为了安全,我们需要将用户程序的执行环境和外部隔离开来,  在linux下 chroot可完成如此工作。chroot,即 change root directory (更改 root 目录)。在 linux 系统中,系统默认的目录结构都是以 `/`,即是以根 (root) 开始的。而在使用 chroot 之后,系统的目录结构将以指定的位置作为 `/` 位置。 ----- from:http:

2013-06-11 13:00:40 6931

原创 网络安全与OpenSSL

网络安全与OpenSSL这两天看了个介绍网络安全的视频,有点豁然开朗的感觉,结合前段时间看OpenSSL的各种不懂,就有了这篇笔记类似的文章1. 名词解释加密,解密,明文,密文:不解释对称加密:加密解密密码一样,DES, AES, Rijndael, 3DES, blowfish等加密算法非对称加密:加密解密密码不一样,又称公开密钥加密,RSA,

2013-06-07 14:07:31 2907 2

转载 mysql set

from: http://www.itzk.com/thread-582269-53-1.shtml本篇文章主要来介绍一下set语句。SET 语句的作用是指定各种选项。最好是省去词OPTION,因为它在MySQL 的未来版本中将被删除。下面为set的语法:SET [OPTION] option_setting,..option_setting值可为下列清单中的任

2013-06-03 11:14:36 5073

hierarchical data

两种树形结构存储于关系数据库中设计的介绍

2011-12-16

download程序C#源码,支持断点续传

代码是用C#实现的。Downfile是一个用来下载的类,其中的work方法不支持断点续传,Continuework支持。writeLog是用来把错误和异常写到日志文件的一个类

2008-09-02

cximage类库

最近在学习用cximage类库,感觉还不错,可以提供一些基本的图像读取显示格式转换功能,大家可以试试。不过这方面的资料少,对里面提供的函数功能不太了解

2008-04-22

Hide and seek in a complex world

Hide and seek in a complex world.pdf

2008-03-11

处理基本图像的DIB类

包括Cdib.h与Cdib.cpp

2007-11-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除