自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(59)
  • 资源 (1)
  • 收藏
  • 关注

原创 Jupyter notebook 500 : Internal Server Error 解决办法

Jupyter notebook 500 : Internal Server Error 解决办法

2023-02-03 16:54:46 892 1

翻译 Deep Learning, NLP, and Representations翻译学习

基本信息原文作者:Chris Olah原文地址:Deep Learning, NLP, and Representations阅读时间:2018年04月21日主要内容《深度学习,自然语言处理和表征方法》keywords:neural networks, deep learning, representations, NLP, recursive neural netwo...

2018-04-23 13:08:17 946

原创 github博客主页搭建结果

花了一个周末,折腾了一下Github Pages。我的github博客主页博客地址:https://churximi.github.io/搭建时间:2018年04月22日主题:nexT更新新添加背景图片实现内容在右上角添加fork me on github链接标记添加RSS修改文章底部的那个带#号的标签添加头像侧边栏增加分类、标签、关于和搜索项...

2018-04-22 22:48:00 565

原创 python读取word文件【docx格式】

python读取word【docx格式】方法相关安装库:python-docx【pip install python-docx】代码#!/usr/bin/env python# -*- coding: utf-8 -*-"""功能:word(docx格式)文本读取与操作时间:2018年03月23日22:12:38"""import docxdef ...

2018-03-23 22:32:48 6868

原创 吴恩达《deeplearning深度学习》课程学习笔记【3】(精简总结)

相关课程内容二、改善深层神经网络第一周 深度学习的实用层面知识点总结1. 训练集与测试集分布不匹配问题训练集(train)验证集(dev)测试集(test):test和dev分布相同 2. 偏差(Bias)与方差(Variance)(1)高偏差与高方差 (2)降低偏差/方差的方法 现在可以在降低偏差/方差的同时几乎不影响另一个数值的变化。 ...

2018-03-17 16:00:35 877

原创 吴恩达《deeplearning深度学习》课程学习笔记【2】(精简总结)

毕业以后就没再写过博客,又想起来了。Ps:本文只是个人笔记总结,没有大段的详细讲解,仅仅是将自己不熟悉和认为重要的东西总结下来,算是一个大纲,用的时候方便回忆和查找。 Ps2:部分笔记内容见图片。相关课程内容一、神经网络和深度学习第三周 浅层神经网络第四周 深层网络结构知识点总结第三周 浅层神经网络1. 向量化m个实例 正向传播: 反...

2018-03-13 17:48:50 1190

原创 吴恩达《deeplearning深度学习》课程学习笔记【1】(精简总结)

毕业以后就没再写过博客,又想起来了。Ps:本文只是个人笔记总结,没有大段的详细讲解,仅仅是将自己不熟悉和认为重要的东西总结下来,算是一个大纲,用的时候方便回忆和查找。 Ps2:部分笔记内容见图片。相关课程内容一、神经网络和深度学习第一周 深度学习概论第二周 神经网络基础知识点总结1. 神经网络神经元:neuron2. 房屋价格预测若干输入特征→...

2018-03-09 17:49:04 7824 2

原创 Mac python IDLE不支持中文输入解决方法

Mac python IDLE不支持中文输入解决方法问题:Mac安装Python 3.6,64位,发现自带的IDLE不支持中文输入。解决:更新Tcl/Tk详见:https://www.python.org/download/mac/tcltk/注意:根据上述链接中的描述(MacOS版本、python版本)选择更新正确的Tcl/Tk版本。本文选择的是8.5.18.0版本。Tcl/Tk下载:https:

2017-06-24 10:06:36 9712 5

原创 sklearn数据集随机切分(train_test_split)

sklearn学习给定数据集X和类别标签y,将数据集按一定比例随机切分为训练集和测试集。代码#!/usr/bin/env python# -*- coding: utf-8 -*-"""功能:数据集按比例切分为训练集和测试集时间:2017年3月11日 12:48:57"""from sklearn.cross_validation import train_test_split# 生成200

2017-03-11 12:52:29 33445 3

原创 Keras + LSTM + 词向量 情感分类/情感分析实验

背景简介本人是深度学习入门的菜菜菜鸟一枚… 利用LSTM + word2vec词向量进行文本情感分类/情感分析实验,吸收了网上的资源和代码并尝试转化为自己的东西~实验环境win7 64位系统Anaconda 4.3.0 , Python 2.7 versionPycharm开发环境python包:keras,gensim,numpy等实验数据本文的实验数据是来自网上的中文标注语料,涉及书

2017-03-10 23:26:40 58121 6

原创 【Python】利用tkFileDialog打开文件对话框

Python打开文件对话框模块:tkFileDialog功能:获取文件路径、目录路径通过文件对话窗口,选择本地的某个文件,获取该文件的路径。具体代码:#!/usr/bin/env python# -*- coding: utf-8 -*-"""功能:通过打开一个文件对话窗口来选择文件,获得文件路径(包含文件名和后缀)时间:2017年3月10日 15:40:06"""import osimp

2017-03-10 15:51:17 26135

原创 Python PyV8安装测试(Win7)

PyV8下载地址https://code.google.com/archive/p/pyv8/downloads测试代码import PyV8ctxt = PyV8.JSContext()ctxt.enter()func = ctxt.eval(""" (function(){ function hello(){ return "Hello wor

2016-12-27 14:19:35 6364

原创 Excel学习笔记(3)——函数

《EXCEL 2010从入门到精通》Excel函数:预定义的公式 【公式】——【函数库】函数类型审核计算公式 【公式】——【公式审核】(1)显示公式 (2)错误检查 (3)公式求值 (4)追踪引用单元格 (5)追踪从属单元格追踪公式 如果单元格B1中的公式包含对A1的引用,单元格C1中的公式包含对B1的引用,那么: (1)A1称为B1的引用单元格 (2)B1称为C

2016-10-10 13:08:32 1009

原创 Excel学习笔记(2)——公式,运算符,引用方式,名称

《EXCEL 2010从入门到精通》六、数据计算分析1、公式 等号、运算符、单元格引用、值或常量、括号、工作表函数及其参数(1)算术运算符 加(+)、减(-)、乘(*)、除(/)、负号(-)、百分号(%)、幂乘(^)(2)比较运算符 等号(=)、大于(>)、小于(<)、大于等于(>=)、小于等于(<=)、不等于(<>)(3)连接运算符:&,连接文本字符 (4)引用运算符:

2016-10-06 21:29:52 2730

原创 Excel学习笔记(1)——数据类型,自动填充,数据有效性,美化

《EXCEL 2010从入门到精通》一、数据类型1、文本 输入数值型的文本数据,在前面先加一个单引号’ 例如:’12345678902、数字(数值) 输入分数:0 1/3(先输入0 + 空格,再输入分数)3、日期、时间 / 或 - 连接日期数字 : 连接时分秒 例如:2016-10-5 17:36:454、符号 插入——符号5、公式、函数二、自动填充自动填充

2016-10-06 13:52:41 4332

原创 python enumerate用法总结

enumerate()说明enumerate()是python的内置函数enumerate在字典上是枚举、列举的意思对于一个可迭代的(iterable)/可遍历的对象(如列表、字符串),enumerate将其组成一个索引序列,利用它可以同时获得索引和值enumerate多用于在for循环中得到计数例如对于一个seq,得到:(0, seq[0]), (1, seq[1]), (2, seq[

2016-06-12 19:06:09 436557 30

原创 theano学习笔记(1)—代数

theano教程:http://deeplearning.net/software/theano/tutorial/adding.html两个标量相加#!/usr/bin/env python# -*- coding: utf-8 -*-from theano import functionimport theano.tensor as T# 第1步:定义两个变量及其类型x = T.dscal

2016-06-10 21:25:16 992

原创 【python深度学习】theano环境搭建/安装

关键词:theano安装,搭建theano环境, python, 深度学习 因为需要安装theano,结果发现这又是一个难以安装的python包…虽然网上教程不少,然而鱼龙混杂,试验了各种方法流程,最后总算是弄好了,现在把我的过程总结如下:安装环境64位win7系统,显卡:GT 730M,笔记本电脑;已安装Visual Studio 2013 (都说VS2015太新不推荐);借助Anacon

2016-06-10 16:56:35 45000 4

原创 SQL必知必会(第3版)学习笔记【16-22章】

第16章 更新和删除数据更新数据UPDATE语句 更新表中特定行更新表中所有行UPDATE Customers SET cust_email = '[email protected]' WHERE cust_id = '1000000005';更新多个列UPDATE Customers SET cust_contact = 'Sam Roberts', cust_em

2016-06-07 20:34:34 932

原创 SQL必知必会(第3版)学习笔记【11-15章】

第11章 使用子查询子查询子查询(subquery):嵌套在其他查询中的查询利用子查询进行过滤可以把一条SELECT语句返回的结果用于另一条SELECT语句的WHERE子句也可以使用子查询来把3个查询组合成一条语句SELECT cust_id FROM Orders WHERE order_num IN (SELECT order_num FR

2016-06-04 23:45:06 1008

原创 SQL必知必会(第3版)学习笔记【6-10章】

第6章 用通配符进行过滤LIKE操作符通配符:wildcard,用来匹配值的一部分的特殊字符通配符搜索只能用于文本字段(串)百分号(%)通配符%,表示任何字符出现任意次数(包括0次)SELECT prod_id, prod_name FROM Products WHERE prod_name LIKE 'Fish%';下划线(_)通配符(_)只匹配单个字符SELECT prod_

2016-06-03 01:01:57 1004

原创 SQL必知必会(第3版)学习笔记【1-5章】

SQL必知必会(第3版)Ben Forta 著钟鸣, 刘晓霞等 译第1章 了解SQL基础:数据库、数据库技术数据库区别于数据库软件(数据库管理系统,DBMS)表(table)某种特定类型(类别)数据的结构化清单模式(shhema):关于数据库和表的布局及特性的信息。列和数据类型列(colomn):表中的一个字段每个列都有相应的数据类型(datatype) 数值、日期、文本、注释等行

2016-06-02 20:53:43 888

原创 python中re模块(正则表达式模块)的使用学习

re.match在字符串的开始位置匹配,如果匹配成功将返回MatchObject(值为True),否则返回None(值为False)。函数原型def match(pattern, string, flags=0)参数说明 pattern:正则表达式string:要匹配的字符串flags:控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等re.search检测整个字符串,找到第

2016-06-01 19:52:29 4342

原创 Weka 3.8 无法打开package manager解决方法

原来系统里装有weka 3.7,后来安装Weka 3.8 版本后,发现无法打开package manager,然后发现官网有如下提示: Note for users upgrading from Weka 3.7 to Weka 3.8 or later: if the Weka 3.8 package manager does not start up, please delete the f

2016-05-28 20:28:02 9301

原创 Weka中文乱码解决方法

测试环境64位Win732位Weka3.8不过中文乱码解决方法应该跟上述环境无关。乱码原因weka默认的字符集编码是Cp1252,如果导入的数据中有中文字符,就会显示为乱码。解决方法打开weka安装目录下的RunWeka.ini文件,找到【fileEncoding=】这一行,将Cp1252编码改为需要的字符集编码,比如utf-8,cp936(简体中文),cp950(繁体中文);**重新打开

2016-05-28 19:32:44 7435

原创 【python gensim使用】word2vec词向量处理中文语料

word2vec介绍word2vec官网:https://code.google.com/p/word2vec/word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。word2vec计算的是余弦值,距离范围为0-1之间,值越大代

2016-05-21 20:57:21 75097 28

原创 【python gensim使用】word2vec词向量处理英文语料

word2vec介绍word2vec官网:https://code.google.com/p/word2vec/word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。word2vec计算的是余弦值,距离范围为0-1之间,值越大代

2016-05-21 20:36:51 28027 4

原创 结巴中文分词使用学习(python)

中文分词工具:结巴分词 github地址:https://github.com/fxsjy/jieba一、分词功能精确模式(默认):试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来,但是不能解决歧义;搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,该方法适合用于搜索引擎构建倒排索引的分词,粒度比较细。注意:jieba.cut以及jieba.c

2016-05-21 17:15:12 13280

原创 Markdown语法入门练习

Markdown语法学习Markdown 是一种标记语言,通常为程序员群体所用。它是一个非常简单、非常容易学习的语法。这个语法简单到每个人都可以在5分钟以内学会。Markdown 的好处纯文本,兼容性强,可以用所有文本编辑器打开;Markdown转HTML非常方便;让你专注于文字而不是排版;Markdown 的标记语法有极好的可读性。************ 下面是练习 *********

2016-05-15 14:43:18 1168

原创 GitHub入门学习

1.官方简易教程√        网址:https://guides.github.com/activities/hello-world/        (1)创建和使用repository        (2)开始和管理一个新的branch        (3)更改文件并提交        (4)打开和合并一个pull request未完待续....

2016-05-10 21:05:18 654

原创 python开发之anaconda【以及win7下安装gensim】

一、推荐安装Anaconda        官方介绍:Anaconda is a completely free Python distribution (including for commercial use and redistribution). It includes more than400 of the most popular Python packages for sci

2016-05-10 17:19:34 14532

原创 【java】使用Stanford CoreNLP处理英文(词性标注/词形还原/解析等)

本文旨在学习使用Stanford CoreNLP进行自然语言处理。编程环境:64位win7系统,NetBeans,java要求1.8+CoreNLP版本:3.6.0,下载地址:http://stanfordnlp.github.io/CoreNLP/,获取stanford-corenlp-full-2015-12-09.zip压缩包。Stanford CoreNLP功能

2016-04-22 14:04:30 18916 1

原创 哈工大LTP和中科院NLPIR中文分词比较

个人实验总结,仅供参考。1.LTP有自动分句功能,NLPIR没有分句功能;LTP的分句是根据中文标点里的句号、问号、感叹号、分号、省略号。2.NLPIR分词有两种方式,分词结果完全一致。(1)利用分词函数NLPIR_ParagraphProcess;(2)利用NLPIR_FileProcess对整个文本进行分词。其中第(2)种有时候会出现bug,分词进行到文

2016-04-17 18:00:35 20656 1

原创 哈工大语言云(LTP)本地安装使用及Python调用

备注:本文实验环境为64位win7系统,32位python2.7.11哈工大LTP官方主页:http://ltp.readthedocs.org/zh_CN/latest/index.html1.LTP下载(1)LTP项目文件ltp-3.3.1-win-x86.zip(2)LTP模型文件3.3.1(2016年4月13日前)下载地址参考:http://ltp.read

2016-04-17 17:51:13 42452 19

原创 Python调用哈工大语言云(LTP)API进行自然语言处理

哈工大语言云(语言技术平台云)是以哈工大社会计算与信息检索研究中心研发的“语言技术平台(LTP)” 为基础,提供高效精准的中文自然语言处理云服务。         官网:http://www.ltp-cloud.com/        使用python调用API实验,参考文档:http://www.ltp-cloud.com/document/1.注册:免费注册一个帐号

2016-04-17 17:17:07 12099 2

转载 win7(64位)系统安装64位ODBC驱动的方法

参考文献:http://my.oschina.net/Rayn/blog/129113PS:64位win7系统,32位office软件。由于office是32位,在正常情况下,从微软下载的AccessDatabaseEngine_X64.exe(64位ODBC驱动)无法安装。解决方法:(1)用压缩软件把AccessDatabaseEngine_X64.exe接压缩,里面会有一个Ac

2016-04-07 14:01:23 17997

原创 python库/模块之pygraphviz 1.3.1安装

pygraphviz安装查看了网上很多资料,试验了很久,终于安装成功了。PS:windows系统,64位Win7,64位python2.7.11参考资料:http://www.cnblogs.com/AimeeKing/p/5021675.html一、下载相关1、pygraphviz 1.3.1(zip),网址:https://pypi.python.org/pypi/py

2016-04-04 23:24:43 6304 2

原创 Python跳出多重循环的方法

方法1:自定义异常# -*- coding:utf-8 -*-"""功能:python跳出循环"""# 方法1:自定义异常class Getoutofloop(Exception): passtry: for i in range(5): for j in range(5): if i == j == 2:

2016-04-02 14:00:15 113883 6

转载 Sublime Text 2安装及汉化

本文转自:将Sublime Text 2搭建成一个好用的IDESublime Text是一款代码编辑器,但是它有丰富的扩展插件,足以让我们把它变成好用的IDE。1.下载/安装/汉化:下载地址:http://www.sublimetext.com/2,选择合适的版本。汉化包:http://files.cnblogs.com/dolphin0520/sublime%

2016-03-24 14:05:53 1574

原创 Win7系统CMD进入文件夹目录的命令

Win7 系统下用CMD命令进入文件夹目录Win7下的CMD有些奇怪,打开CMD后显示:C:\Users\lenovo>此时进入C盘下的文件夹目录可以直接用命令:cd C:\Program Files\Java\jdk1.8.0_45但是如果想要进入其他盘的某个文件夹,如果直接输入:    ——命令(1)cd D:\Python 2.7.9\Lib此时CMD仍然显示

2016-03-23 20:06:36 8160 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除