8 Wordsky

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 7w+

OpenCV 3.0 入门之图片的读写与显示

再一次回到了图像处理,OpenCV 已经如此的强大了。慢慢学习,然后从入门到放弃… Life is short, show me the code… 读取图像文件 imread,图像显示 imshow,写图像文件imwrite 如此统一简洁的函数,好用好记。#include<opencv2\highgui.hpp>#include<opencv2\core.hpp&g...

2018-06-07 21:28:02

怎样使用已有的工具训练Tesseract 3.03–3.05来识别新的语言

本文是Tesseract训练教程的翻译,有不妥的地方请大家指出,欢迎讨论原教程页面 Tesseract简介Tesseract 3.0x 是一个具备识别新的语言能力的软件,这种能力完全可以通过训练的方式 获得。本教程描述了整个训练过程,提供了一些适用于各种语言的指导原则,以及最后可以取得的 结果。在你开始训练的工作前,请在traineddata 上确认是否3.04 版本已经提供了你所需要的语言的数

2017-12-16 10:52:56

OCR 开源软件 Tesseract 的下载和入门使用

资源下载tesseract-ocr-setup-3.05.01.exe 注: 安装的时候选好要识别的语言tesseract-4.0-with-LSTM#400-alpha-for-windowsWindows中运行tesseract1.tesseract 是一个命令行OCR程序,打开一个终端(组合键Win +R),输入:tesseract imagename outputbase [-l lang

2017-12-09 18:30:04

大小端 程序验证

原理大小端来自 Big Endian 和 Little Endian的直译,他们描述计算机是怎么来存储字节的。 由于计算机中存在着大于1个字节的数据类型,例如整型在C++中一般用4字节的空间来 表示,这就存在着这4个字节在空间上怎么按字节存放一个整数的问题。 方案有以下两种,如图1所示: 1. 大端存放情况下,对于数据0XABCD,先存放高位字节AB,再存放低位字节CD。由于 数

2017-12-02 17:44:38

python 面向对象编程

类的声明与使用#声明class colleague(object): pass#创建对象lisi = colleague()构造函数与类方法class colleague(object): def __init__(self,name,age,sex): ''' self 永远是第一个参数,也是必须的 self 表示实例本身,调用时不需要传入 _

2017-07-31 22:51:51

python 函数式编程

1.高阶函数 Higher-order function 能将函数作为自己参数的函数 成为高阶函数2.map/reduce将func作用在 iterables 中每一个元素上,将结果用一个Iterator返回.map(func, *iterables) --> map object格式化姓名,第一个字母大写,后面的都小写def normalize(name): if len(nam

2017-07-31 22:44:31

去掉Sublime text 3中的框框

出现了下面这种框框一般是在ST3 中安装了Pylinter这种代码检查插件 去掉框框只需要隐藏这个插件即可:ctrl+shift+p —>pcd—->Package Control:Disable Package—->Pylinter 这样就能取消代码检查的功能,重启ST3,保存代码框框就不会有了。

2017-07-24 21:01:23

在Win7 32位系统中 将Sublime Text3配置成Python3.x 编辑器

1.下载Python3.5 注意下载windows版本2.下载Sublime Text 3 注意windows版本3. 配置过程3.1 为安装插件做准备 1. 打开控制台 viwe -->Show console 2. 打开https://packagecontrol.io/installation#st3 将其中的配置代码复制到控制台中,然后回车,即可安装插件管理平台,如下图: 3.2

2017-07-13 20:15:42

文档特征提取

只是想说,nltk 提供的分类器也能使用数值型的特征权重,可以参考书245

2017-04-30 23:41:46

写给自己

我不知道自己能走多远,是否能到达,只是不敢想象目的地到底有多美。 为此,我选择坚持,慢慢地成长, 或许路边的一朵小红花足以让我开心好久,一路的风景也是收获啊!听到的,我会忘记; 看得到, 我会记住; 只有我做到了,我才会真正理解。

2017-04-23 22:04:30

python 合并两个字典

合并字典sentiment_dict 和 pos_dict 为 all_dict 方法一:最 pythonic 的方法all_dict = {**sentiment_dict ,** pos_dict}方法二:all_dict = {k: v for d in [sentiment_dict , pos_dict] for k, v in d.items()}方法三:最基础的方法all_dict

2017-04-10 16:53:35

情感分析资源收集

代词 http://xh.5156edu.com/page/z2190m2907j18579.html 语气词 http://baike.baidu.com/item/语气词?fr=aladdin 连词 http://xh.5156edu.com/page/z7501m8716j18595.html 能愿动词 http://baike.baidu.com/link?url=ijNr

2017-04-01 15:43:17

win64 安装 python + NLTK(附 python MemoryError 解决方法)

如果使用scikit模块进行自然语言处理的话,python最好安装32位的,这可以跟后面使用的 模块配套。 更为重要的是,一旦你的数据量比较大的时候,可能出现系统内存不够MemoryError 的情况,这个时候你就 需要使用64位系统,就像我现在做的工作一样。类似的问题:Python MemoryError when doing fitting with Scikit-learn1. pip

2017-03-20 21:09:29

No module named 'scipy'问题 与 python中 scipy模块的安装

安装环境win32+python3.5安装过程先要安装numpy模块才能安装scipy,这个你在pipinstallscipy的时候,会提示你的,于是先安装numpy:pipinstallnumpy然后在官网上下载scipy安装包(注意windows版本)目前这个软件(.exe)是scipy-0.16.1版本的,支持python3.4版本,如果你的python版本不是3.

2017-03-15 16:41:42

python 处理movie-review-data遇到的UnicodeDecodeError 编码问题

问题描述:下载了Bo Pang的主客观数据集,在使用py3 读取quote文件时,产生了错误,如下:UnicodeDecodeError: 'gbk' codec can't decode byte 0x96 in position 4990: illegal multibyte sequence问题分析:显然是解码的问题,也就是使用 gbk 编码无法解码该文本位置为4990处的 字节内容。那就是

2017-03-13 21:21:36

leetcode 第28题 实现函数strStr

leetcode 第28题 实现函数strStr 在主串中查找子串首次出现的位置我的 思路 是从主串第一个位置开始与子串匹配,如果当前字母不匹配,那么 主串 从 上次开始匹配的下一个位置 开始与子串的第一个字符开始匹配(这种方法存在回溯,也就是没有利用上次匹配的结果导致下次还是从头开始匹配。还有一种无回溯的字符串模式匹配KMP算法,效率会比这个高很多 ,时间复杂度为O(n+m),下次给出代码)

2016-08-10 16:37:39

leetcode 第14题 最长前缀

14 最长前缀 我的 思路 是 先从前面两个串中找到一个待修正的共同前缀,然后再剩余的串中来调整该前缀,这样的时间复杂度为o(n)class Solution {public: string longestCommonPrefix(vector<string>& strs) { if(strs.size() == 0) return string(""); if(s

2016-08-09 21:50:44

valid parentheses leetcode 第20题

valid parentheses leetcode 第20题 我的思路是用栈来检查括号的匹配。class Solution {public: bool isValid(string str) { int len = str.length(); if( len < 2) return false; if(str[0] == '}' || str[

2016-08-09 17:25:14

Markdown 语法入门

Markdown 语法详解

2016-08-08 22:15:27

Win7 VC++6.0打开文件崩溃 FileTool.dll

每次装VC++6.0都会各种奇怪的问题,这次一定要把遇到的问题都记下来,希望下次能一次性全部搞定,也希望不要再用VC++6.0了(有的时候这不是由自己能控制的,有的是培训用,有的是公司的项目之前用的是VC开发的,等等这些情况还是要用到VC++6.0)。关于打开文件崩溃的文章已经很多了,例如很好的:Win7下VC++6.0打开文件报错导致其崩溃的解决办法,这里只是强调一下下载的文件要放到自己安装

2016-07-13 15:32:52

查看更多

勋章 我的勋章
    暂无奖章