自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (3)
  • 收藏
  • 关注

转载 nlp数据博客

https://github.com/hankcs/pyhanlp/wiki/%E6%89%8B%E5%8A%A8%E9%85%8D%E7%BD%AE

2018-05-31 00:08:51 238

原创 运营笔记

一项围绕着某项业务,借由通过各类互联网手段来建立与用户间的联系,最终实现用户增长、用户活跃度提升或是获得收入等各种特定目的的职能。目的、渠道&工具、手段&工作方法。我建议3岁以内的运营同学最好都关注“我现在能够掌握些什么手段”,以及“我现在到底能对什么样的产出或结果负责”。一个运营从业者在3年往上以后再需要考虑的,基本就是“如何根据业务特征和目的来组合渠道、工具和具体运营手段”的问...

2018-05-24 23:57:30 1009

转载 基于 Gensim 的 Word2Vec 实践

Word2Vec基于 Gensim 的 Word2Vec 实践,从属于笔者的程序猿的数据科学与机器学习实战手册,代码参考gensim.ipynb。推荐前置阅读Python语法速览与机器学习开发环境搭建,Scikit-Learn 备忘录。Word2Vec TutorialGetting Started with Word2Vec and GloVe in Python模型创建Gensim中 Word...

2018-05-05 22:59:27 696

转载 [转载]word2vec在工业界的应用场景

这篇文章主要讲应用,不讲原理。通俗的说,word2vec是一种将『词』变成向量的工具,在nlp的场景中『词』是显而易见的,但是在有些时候,什么可以看做『词』和『文档』就不那么容易了。文章目录 [展开]在社交网络中的推荐前东家工作的时候,有一个个性化推荐的场景,给当前用户推荐他可能关注的『大V』。对一个新用户,此题基本无解,如果在已知用户关注了几个『大V』之后,相当于知道了当前用户的一些关注偏好,根...

2018-05-05 22:57:14 431

原创 NeuralTalk2模型笔记

模型地址:https://github.com/karpathy/neuraltalk2遇到的坑:1.torch安装过程中,文件尺寸不符解决办法:分析缺失哪些包,手动下载2.cudnn版本不对本机环境 ubuntu17.10+cuda8cudnn 一开始下的是6.0版本,后来降级为5.1版本5.1下载地址链接:http://pan.baidu.com/s/1c984eq 密码:wai9安装http...

2018-03-27 09:55:47 1477 3

原创 ubuntu安装torch遇到“文件尺寸不符”的解决办法

 根据官方文档安装torch,http://torch.ch/docs/getting-started.htmlgit clone https://github.com/torch/distro.git ~/torch --recursivecd ~/torch; bash install-deps;./install.sh执行bash install-deps;时产生如下错误:度娘了好久好久...

2018-03-20 23:16:14 2261

转载 error trying to exec 'cc1plus': execvp: No such file or directory

问题描述:       安装CUDA,配置好环境变量后,python程序中import theano出错:g++: error trying to exec 'cc1plus': execvp: No such file or directory112       这个错误最初出现在编译基于theano的python程序,后来发现在交互模式下import theano时就报错。按照theano官方...

2018-03-13 08:50:58 6167

转载 ubuntu系统下Bazel的安装

原文链接:https://www.cnblogs.com/jackchen-Net/p/7156763.html1. Install JDK 82. 添加Bazel分发URI作为包源(一次设置)3. 安装和更新 Bazel官方Doc:https://docs.bazel.build/versions/master/install-ubuntu.html使用Bazel定制的APT存储库 (recom...

2018-03-07 23:09:10 2902

原创 bazel安装

1.安装chocolatey搜索cmd,用管理员权限打开https://chocolatey.org/install"%SystemRoot%\System32\WindowsPowerShell\v1.0\powershell.exe" -NoProfile -InputFormat None -ExecutionPolicy Bypass -Command "iex ((New-Object ...

2018-03-07 21:40:17 3157

原创 样本标注工具的使用笔记

labelImghttps://github.com/tzutalin/labelImgDownload and setup Python 2.6 or later, PyQt4 and install lxml.PyQt4查看python版本我的是2.7.8 32位下载32位的PyQt4http://www.jb51.net/softs/548192.htmlPyQt4 for python2....

2018-03-06 08:29:25 900

转载 linux deb文件安装

dpkg 是Debian Package的简写,是为Debian 专门开发的套件管理系统,方便软件的安装、更新及移除。所有源自Debian的Linux发行版都使用dpkg,例如Ubuntu、Knoppix 等。以下是一些 Dpkg 的普通用法:1、dpkg -i <package.deb>安装一个 Debian 软件包,如你手动下载的文件。2、dpkg -c <packa...

2018-03-03 08:47:11 126130 4

原创 Ubuntu 17.10 + CUDA8.0+cudnn 在GT610 电脑上配置深度学习环境

一、本机环境配置win7+ubuntu17.10双系统,自己配置的杂牌电脑二、安装cuda前的环境检查1.首先查看自己的显卡型号和类型,我的是NVIDIA,GT610(cuda目前只支持NVIDIA的驱动,如果不是,就不要费力了)lspci | grep -i nvidia2.确认自己的显卡是否在支持列表https://developer.nvidia.com/cuda-gpus3.查看自己装的系...

2018-02-25 13:14:37 2421 1

转载 Ubuntu17.10下cuda8.0.run文件下载

wget https://developer.nvidia.com/compute/cuda/8.0/Prod2/local_installers/cuda_8.0.61_375.26_linux-run

2018-02-08 19:21:02 508

转载 win7系统怎么利用ubuntu17.10安装双系统,亲测成功

原文链接:http://www.win7zhijia.cn/jiaocheng/win7_13526.html正文入下:win7系统用户想自己装双系统,但是不了解具体哪种安装方法比较安全快捷,其实我们可以利用ubuntu来安装,那么win7系统电脑怎么利用ubuntu安装双系统?且看以下的设置步骤。推荐:win7 32位系统下载  一、软件准备  1、下载 Ubuntu 系统镜像:http://w...

2018-02-06 14:05:41 266

转载 使用 timeit 模块

关于 Python 代码优化你需要知道的最重要问题是,决不要自己编写计时函数。为一个很短的代码计时都很复杂。处理器有多少时间用于运行这个代码?有什么在后台运行吗?每个现代计算机都在后台运行持续或者间歇的程序。小小的疏忽可能破坏你的百年大计,后台服务偶尔被 “唤醒” 在最后千分之一秒做一些像查收信件,连接计时通信服务器,检查应用程序更新,扫描病毒,查看是否有磁盘被插入光驱之类很有意义的事

2015-10-11 15:23:49 446

原创 《机器学习》学习笔记-第一周

机器学习使用方法及场景:贝叶斯分类器——流失分析:可以把流失用户作为一个样本,里面包含单次使用时长、花费、活跃互动等情况,进行流失预警;贝叶斯分类器+文本挖掘——垃圾邮件过滤,网页文本分类,评论自动分析(好、中、差评):首先准备样本,分词,做TF-IDF矩阵,然后用贝叶斯分类算法计算应该属于哪一类小波分析——OCR,图像识别,语音识别决策树——电脑博弈(有局面标准化,局面评估打分函

2015-09-20 11:54:54 552

转载 gensim文档-相似性查询

原文链接http://cloga.info/python/2014/01/28/Gensim_Similarity_Queries/28 January 2014如果你想要查看logging事件不要忘记设置。import logginglogging.basicConfig(format='%(asctime)s : %(levelname)s : %(mes

2015-09-19 11:36:26 2690

转载 lsi计算文档相似度

原文链接http://datum.readthedocs.org/en/latest/201308/gensim.html#lsi先准备数据,我爬了约2w篇豆瓣日记作为这次试验的数据,数据和代码可以在这里https://github.com/largetalk/yaseg 找到。主要代码如下:import jiebafrom gensim import cor

2015-09-19 11:34:42 3820

转载 gensim的LSI模型来计算文档的相似度

[python] view plaincopyfrom gensim import corpora,models,similarities  dictionary=corpora.Dictionary.load('/tmp/deerwester.dict')  corpus=corpora.MmCorpus('/tmp/deerwester.mm')  

2015-09-19 11:31:57 1419

转载 信息检索领域的准确率(accuracy),精确率(Precision),召回率(Recall)

准确率(accuracy),精确率(Precision),召回率(Recall)编辑准确率(accuracy),精确率(Precision)和召回率(Recall)[2]  是信息检索,人工智能,和搜索引擎的设计中很重要的几个概念和指标。中文中这几个评价指标翻译各有不同,所以一般情况下推荐使用英文。概念介绍先假定一个具体场景作为例子。假如某个班级有男生80人

2015-09-10 11:54:12 4427

Gensim计算两个文档相似度(python)

Gensim计算文档相似度的方法讲解,python代码实现

2015-09-19

numpy-1.8.0-win32(适用2.7.832位)

python下的矩阵处理工具,适用于win7下面的python32程序

2015-08-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除