自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 资源 (20)
  • 收藏
  • 关注

翻译 DoubleArray词典管理

49 class PosWeightDict 50 { 51 public: 52     ~PosWeightDict(); 53     bool GetWeightInfo(std::string literal,WeightInfo* wei); 54  55 private: 56     uint8_t *m_map_ptr; 57     size_t m_map_s...

2018-08-29 18:18:37 181

翻译 Bsearch 词典管理

 #include <assert.h>#include <sys/time.h>#include <openssl/md5.h>#include <algorithm>#include <stdint.h>#include <math.h>#include "include/share/darts.h"

2018-08-29 18:15:10 174

转载 Paper List

A Bag of Features for Short Text Classification Intent Based Relevance Estimation from Click Logs A Large Scale Prediction Engine for App Install Clicks and Conversions DeepRank: A New D...

2018-08-11 22:09:42 265

翻译 SynonymFilter

import tensorflow as tfimport numpy as npimport scipy.io as ioimport sysimport os# Define the flags useable from the command line.tf.app.flags.DEFINE_string('train', None,                           'F...

2018-03-06 21:46:20 400

原创 POS_IDF

#! /usr/bin/pythonimport osimport sysfrom math import *Delta = 0.1npos_freq = {}npos_file = open("./npos_freq.dat")C = 0for line in npos_file:    line = line.strip()    if not line:        continue   ...

2018-03-06 15:27:03 141

翻译 pscp pssh Code

 3 rm -rf ../collect_synom  4 mkdir -p ../collect_synom  5   6 handle_result () {  7     if [ $1 -ne 0 ]; then  8         echo "Job Failed; $2"  9         echo "Job Failed; $2" | mail -s "lsi follow f...

2018-03-05 18:27:42 320

原创 特征重要性分析

  1 from sklearn.tree import DecisionTreeRegressor  2 from sklearn.ensemble import RandomForestRegressor  3 import numpy as np  4   5 from sklearn.externals.joblib import Memory  6 from sklearn.datase...

2018-03-02 11:43:45 7691

翻译 ConvertProtoToArray

427 template 428 void MRFModel::ConvertProtoToArray(429         const google::protobuf::Message* message, std::vector* feature_array, std::string& ori) {430     feature_array->clear();431     ori = ""

2018-01-18 18:15:15 145

翻译 hadoop streaming 使用自己的 python 版本

1 #!/usr/bin/env python3 15 hadoop jar hadoop-streaming.jar \ 16 -Dmapred.fairscheduler.pool=build \ 17 -Dmapred.reduce.tasks=500 \ 18 -Dmapred.job.priority=VERY_HIGH \ 19 -Dmapred.job.nam

2018-01-05 19:13:47 2551

翻译 SVD MPI 实现

run_lsi.sh                                                                                                                                                                  1 ROOT_PATH=/da1/search/hpc_...

2018-01-03 16:23:42 288

翻译 TextRank Local

#! -*- coding:utf-8 -*-import numpy as np  import jieba  import jieba.posseg as pseg    class TextRank(object):            def __init__(self, sentence, window, alpha, iternum):   

2017-12-28 11:39:23 210

翻译 Web_parser

# -*- coding:utf-8 _*-import sysimport osimport mathimport threadingimport urllibimport urllib2import reimport threadingimport socketimport codecsimport timefrom mu

2017-12-14 17:13:10 214

原创 TextRank Spark 实现

#! -*- coding:utf-8 -*-import osimport sysimport mathfrom pyspark import SparkContextfrom pyspark import StorageLevelfrom pyspark.conf import SparkConf #os.environ['PYSPARK_PYTHON']

2017-11-23 10:47:09 1066

翻译 darts_builder

#include <stdlib.h>#include <sys/mman.h>#include <stdio.h>#include <vector>#include <unistd.h>#include <stdint.h>using namespace std;#pragma pack(1)struct PhraseGro...

2017-11-08 11:21:00 224

翻译 Tensorflow Code 示例

1.张量乘法def f1(X,w):    c = tf.einsum('ijl,lk->ijk', X, w)     print c.shape    return cdef output(self, x):    batch_size = tf.shape(x)[0]    x = tf.reshape(x, [-1, self._shape[0]])

2017-10-23 15:45:40 460

翻译 python Code 示例

1.  numpy load data  def extract_data(filename):        out = np.loadtxt(filename, dtype=np.str,delimiter=" ",comments=None);        # Arrays to hold the labels and feature vectors.      labels = out[...

2017-10-21 17:57:08 568

翻译 scikit-learn SVM

import osimport pickle import sklearnfrom sklearn import cross_validation, grid_searchfrom sklearn.metrics import confusion_matrix, classification_reportfrom sklearn.svm import SVCfrom skl

2017-10-20 15:15:26 310

翻译 Scala 常用命令

1.   def fabs(n: Double): Double = {          if (n > 0) n else -n      }2.   def Cosin(vecA: Array[Float], vecB: Array[Float]): Double = {          val product = vecA.view.zip(vecB.view).map

2017-10-18 16:47:17 1874

翻译 shell 常用命令

1. svn st | awk '{if ( $1 == "C") { print $2}}' | xargs svn resolve --accept working2. hadoop fs -ls /home/| grep "log" | tail -60 | awk -F"/" '{if(NF>=3){printf("%s ",\$NF)}}3. 0 8 * * * cd /

2017-10-18 11:57:19 149

翻译 python 多线程计算特征

#! /usr/bin/env python# -*- coding:utf-8 -*-import sysimport osfrom multiprocessing import Process, Lock, Queue, Managerfrom multiprocessing.managers import BaseManagerimport argpa

2017-10-17 11:57:36 428

翻译 文本对齐

#!/usr/bin/env python# -*- coding: utf-8  -*-def reverse(ans):        res = []        for i in range(len(ans),0,-1):                res.append(ans[i-1])        return resdef

2017-10-13 12:10:41 337

翻译 汉字处理的工具

#!/usr/bin/env python# -*- coding:utf-8 -*-"""汉字处理的工具:判断unicode是否是汉字,数字,英文,或者其他字符。全角符号转半角符号。"""def is_chinese(uchar):    """判断一个unicode是否是汉字"""    if uchar >= u'\u4e00' and uchar

2017-10-13 10:24:01 375

Python 核心编程 第二版

《Python核心编程(第二版)》,原名《Core Python Programming (2nd Edition) 本书是经典的Python[1] 指导书,在第一版的基础上进行了全面升级。全书分为两个部分:第1部分占据了大约三分之二的篇幅,阐释这门语言的“核心”内容,包括基本的概念和语句、语法和风格、Python对象、数字类型、序列类型、映射和集合类型、条件和循环、文件和输入/输出、错误和异常、函数和函数式编程、模块、面向对象编程、执行环境等内容:第2部分则提供了各种高级主题来展示可以使用Python做些什么,包括正则表达式、网络编程、网络客户端编程、多线程编程、图形用户界面编程、Web编程、数据库编程、扩展Python 和一些其他材料。

2015-04-30

Python科学计算

Python科学计算 张若愚 本书介绍如何用Python开发科学计算的应用程序,除了介绍数值计算之外,还着重介绍如何制作交互式的2D、3D图像,如何设计精巧的程序界面,如何与C语言编写的高速计算程序结合,如何编写声音、图像处理算法等内容。

2015-04-30

vim用户手册中文版

中文的VIM技术简介手册,帮助你更见熟练的掌握VIM使用。 高手牛人必备。 中文的VIM技术简介手册,帮助你更见熟练的掌握VIM使用。 高手牛人必备。

2015-04-30

Google word2vec算法 数学原理

文档是 word2vec 算法 数学原理详解。 word2vec是google的一个开源工具,能够仅仅根据输入的词的集合计算出词与词直接的距离,既然距离知道了自然也就能聚类了,而且这个工具本身就自带了聚类功能,很是强大。

2014-09-29

Nonlinear programming 非线性规划

Nonlinear programming Bertsekas D. (2ed., Athena 学习优化理论与算法的经典教材,深入学习优化算法必备图书。

2012-11-29

Convex Optimization 凸优化

剑桥大学Boyd的经典权威的凸优化分析教材。中科院指定教材。 计算机机器学习方向必读经典。

2012-11-29

数据挖掘概念与技术

韩佳炜先生倾力之作,数据挖掘必备教程,不可多得的中文版教材

2012-03-29

矩阵分析(华章数学译丛)

华章数学译丛中矩阵分析,国外翻译版中文教材,学习矩阵论的绝佳参考资料

2012-03-29

统计学习理论

Vapnik本人巨著,学习统计学习理论的必备资料。系统介绍了统计学习理论的理论与方法,必读之作

2012-03-29

数据挖掘导论答案

经典教材数据挖掘导论的课后习题答案。原书是国内外流行的数据挖掘教材,本答案正是次数的完整版答案

2012-03-29

统计学习理论本质

统计学习理论必读中文版翻译教材。学习统计学习理论的入门教材。 统计学习理论研究人员必读。

2012-03-29

模式分析的核方法

学习核方法的必备教程,少有的中文版翻译教材。搞机器学习或核方法的同志必读

2012-03-29

统计学习基础,推理与预测

数据挖掘经典教材,鲜有的中文版翻译教材。学习数据挖掘的必备资料

2012-03-29

模式识别与机器学习

模式识别与机器学习的必读经典书目,内容全面,讲解透彻,导师推荐

2011-10-29

网络基础研究报告

美国国家科学院专家组对网络基础领域研究的基础性报告

2011-10-06

最优化理论与算法

国内最新,最全面,最优化教材。清华大学陈宝林教授著作。 学最优化首选教材

2011-10-06

具体数学(Kunth著作)

Kunth的经典著作。本书介绍支持高级计算机程序设计和算法分析的数学。它的主要目的是给计算机科学的学生和专业人士提供一个坚实和和合适的基础。

2008-11-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除