竹聿Simon-CSDN博客

原创 Jupyter notebook 500 : Internal Server Error 解决办法

Jupyter notebook 500 : Internal Server Error 解决办法

2023-02-03 16:54:46 892 1

翻译 Deep Learning, NLP, and Representations翻译学习

基本信息原文作者：Chris Olah原文地址：Deep Learning, NLP, and Representations阅读时间：2018年04月21日主要内容《深度学习，自然语言处理和表征方法》keywords：neural networks, deep learning, representations, NLP, recursive neural netwo...

2018-04-23 13:08:17 946

原创 github博客主页搭建结果

花了一个周末，折腾了一下Github Pages。我的github博客主页博客地址：https://churximi.github.io/搭建时间：2018年04月22日主题：nexT更新新添加背景图片实现内容在右上角添加fork me on github链接标记添加RSS修改文章底部的那个带#号的标签添加头像侧边栏增加分类、标签、关于和搜索项...

2018-04-22 22:48:00 565

原创 python读取word文件【docx格式】

python读取word【docx格式】方法相关安装库：python-docx【pip install python-docx】代码#!/usr/bin/env python# -*- coding: utf-8 -*-"""功能：word（docx格式）文本读取与操作时间：2018年03月23日22:12:38"""import docxdef ...

2018-03-23 22:32:48 6868

原创吴恩达《deeplearning深度学习》课程学习笔记【3】（精简总结）

相关课程内容二、改善深层神经网络第一周深度学习的实用层面知识点总结1. 训练集与测试集分布不匹配问题训练集（train）验证集（dev）测试集（test）：test和dev分布相同 2. 偏差（Bias）与方差（Variance）（1）高偏差与高方差 (2)降低偏差/方差的方法现在可以在降低偏差/方差的同时几乎不影响另一个数值的变化。 ...

2018-03-17 16:00:35 877

原创吴恩达《deeplearning深度学习》课程学习笔记【2】（精简总结）

毕业以后就没再写过博客，又想起来了。Ps：本文只是个人笔记总结，没有大段的详细讲解，仅仅是将自己不熟悉和认为重要的东西总结下来，算是一个大纲，用的时候方便回忆和查找。 Ps2：部分笔记内容见图片。相关课程内容一、神经网络和深度学习第三周浅层神经网络第四周深层网络结构知识点总结第三周浅层神经网络1. 向量化m个实例正向传播：反...

2018-03-13 17:48:50 1190

原创吴恩达《deeplearning深度学习》课程学习笔记【1】（精简总结）

毕业以后就没再写过博客，又想起来了。Ps：本文只是个人笔记总结，没有大段的详细讲解，仅仅是将自己不熟悉和认为重要的东西总结下来，算是一个大纲，用的时候方便回忆和查找。 Ps2：部分笔记内容见图片。相关课程内容一、神经网络和深度学习第一周深度学习概论第二周神经网络基础知识点总结1. 神经网络神经元：neuron2. 房屋价格预测若干输入特征→...

2018-03-09 17:49:04 7824 2

Mac python IDLE不支持中文输入解决方法问题：Mac安装Python 3.6，64位，发现自带的IDLE不支持中文输入。解决：更新Tcl/Tk详见：https://www.python.org/download/mac/tcltk/注意：根据上述链接中的描述（MacOS版本、python版本）选择更新正确的Tcl/Tk版本。本文选择的是8.5.18.0版本。Tcl/Tk下载：https:

2017-06-24 10:06:36 9712 5

原创 sklearn数据集随机切分（train_test_split）

sklearn学习给定数据集X和类别标签y，将数据集按一定比例随机切分为训练集和测试集。代码#!/usr/bin/env python# -*- coding: utf-8 -*-"""功能：数据集按比例切分为训练集和测试集时间：2017年3月11日 12:48:57"""from sklearn.cross_validation import train_test_split# 生成200

2017-03-11 12:52:29 33445 3

原创 Keras + LSTM + 词向量情感分类/情感分析实验

背景简介本人是深度学习入门的菜菜菜鸟一枚… 利用LSTM + word2vec词向量进行文本情感分类/情感分析实验，吸收了网上的资源和代码并尝试转化为自己的东西~实验环境win7 64位系统Anaconda 4.3.0 , Python 2.7 versionPycharm开发环境python包：keras，gensim，numpy等实验数据本文的实验数据是来自网上的中文标注语料，涉及书

2017-03-10 23:26:40 58121 6

原创【Python】利用tkFileDialog打开文件对话框

Python打开文件对话框模块：tkFileDialog功能：获取文件路径、目录路径通过文件对话窗口，选择本地的某个文件，获取该文件的路径。具体代码：#!/usr/bin/env python# -*- coding: utf-8 -*-"""功能：通过打开一个文件对话窗口来选择文件，获得文件路径（包含文件名和后缀）时间：2017年3月10日 15:40:06"""import osimp

2017-03-10 15:51:17 26135

原创 Python PyV8安装测试（Win7）

PyV8下载地址https://code.google.com/archive/p/pyv8/downloads测试代码import PyV8ctxt = PyV8.JSContext()ctxt.enter()func = ctxt.eval(""" (function(){ function hello(){ return "Hello wor

2016-12-27 14:19:35 6364

原创 Excel学习笔记(3)——函数

《EXCEL 2010从入门到精通》Excel函数：预定义的公式【公式】——【函数库】函数类型审核计算公式【公式】——【公式审核】（1）显示公式（2）错误检查（3）公式求值（4）追踪引用单元格（5）追踪从属单元格追踪公式如果单元格B1中的公式包含对A1的引用，单元格C1中的公式包含对B1的引用，那么：（1）A1称为B1的引用单元格（2）B1称为C

2016-10-10 13:08:32 1009

原创 Excel学习笔记(2)——公式,运算符,引用方式,名称

《EXCEL 2010从入门到精通》六、数据计算分析1、公式等号、运算符、单元格引用、值或常量、括号、工作表函数及其参数（1）算术运算符加（+）、减（-）、乘（*）、除（/）、负号（-）、百分号（%）、幂乘（^）（2）比较运算符等号（=）、大于（＞）、小于（＜）、大于等于（>=）、小于等于（<=）、不等于（<>）（3）连接运算符：&，连接文本字符（4）引用运算符：

2016-10-06 21:29:52 2730

原创 Excel学习笔记(1)——数据类型,自动填充,数据有效性,美化

《EXCEL 2010从入门到精通》一、数据类型1、文本输入数值型的文本数据，在前面先加一个单引号’ 例如：’12345678902、数字（数值）输入分数：0 1/3（先输入0 + 空格，再输入分数）3、日期、时间 / 或 - 连接日期数字 : 连接时分秒例如：2016-10-5 17:36:454、符号插入——符号5、公式、函数二、自动填充自动填充

2016-10-06 13:52:41 4332

原创 python enumerate用法总结

enumerate()说明enumerate()是python的内置函数enumerate在字典上是枚举、列举的意思对于一个可迭代的（iterable）/可遍历的对象（如列表、字符串），enumerate将其组成一个索引序列，利用它可以同时获得索引和值enumerate多用于在for循环中得到计数例如对于一个seq，得到：(0, seq[0]), (1, seq[1]), (2, seq[

2016-06-12 19:06:09 436557 30

原创 theano学习笔记(1)—代数

theano教程：http://deeplearning.net/software/theano/tutorial/adding.html两个标量相加#!/usr/bin/env python# -*- coding: utf-8 -*-from theano import functionimport theano.tensor as T# 第1步：定义两个变量及其类型x = T.dscal

2016-06-10 21:25:16 992

原创【python深度学习】theano环境搭建/安装

关键词：theano安装，搭建theano环境, python, 深度学习因为需要安装theano，结果发现这又是一个难以安装的python包…虽然网上教程不少，然而鱼龙混杂，试验了各种方法流程，最后总算是弄好了，现在把我的过程总结如下：安装环境64位win7系统，显卡：GT 730M，笔记本电脑；已安装Visual Studio 2013 （都说VS2015太新不推荐）；借助Anacon

2016-06-10 16:56:35 45000 4

原创 SQL必知必会（第3版）学习笔记【16-22章】

第16章更新和删除数据更新数据UPDATE语句更新表中特定行更新表中所有行UPDATE Customers SET cust_email = '[email protected]' WHERE cust_id = '1000000005';更新多个列UPDATE Customers SET cust_contact = 'Sam Roberts', cust_em

2016-06-07 20:34:34 932

原创 SQL必知必会（第3版）学习笔记【11-15章】

第11章使用子查询子查询子查询（subquery）：嵌套在其他查询中的查询利用子查询进行过滤可以把一条SELECT语句返回的结果用于另一条SELECT语句的WHERE子句也可以使用子查询来把3个查询组合成一条语句SELECT cust_id FROM Orders WHERE order_num IN (SELECT order_num FR

2016-06-04 23:45:06 1008

原创 SQL必知必会（第3版）学习笔记【6-10章】

第6章用通配符进行过滤LIKE操作符通配符：wildcard，用来匹配值的一部分的特殊字符通配符搜索只能用于文本字段（串）百分号（%）通配符%，表示任何字符出现任意次数（包括0次）SELECT prod_id, prod_name FROM Products WHERE prod_name LIKE 'Fish%';下划线（_）通配符（_)只匹配单个字符SELECT prod_

2016-06-03 01:01:57 1004

原创 SQL必知必会（第3版）学习笔记【1-5章】

SQL必知必会（第3版）Ben Forta 著钟鸣, 刘晓霞等译第1章了解SQL基础：数据库、数据库技术数据库区别于数据库软件（数据库管理系统，DBMS）表（table）某种特定类型（类别）数据的结构化清单模式（shhema）：关于数据库和表的布局及特性的信息。列和数据类型列（colomn）：表中的一个字段每个列都有相应的数据类型（datatype）数值、日期、文本、注释等行

2016-06-02 20:53:43 888

原创 python中re模块（正则表达式模块）的使用学习

re.match在字符串的开始位置匹配，如果匹配成功将返回MatchObject（值为True），否则返回None（值为False）。函数原型def match(pattern, string, flags=0)参数说明 pattern：正则表达式string：要匹配的字符串flags：控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等re.search检测整个字符串，找到第

2016-06-01 19:52:29 4342

原创 Weka 3.8 无法打开package manager解决方法

原来系统里装有weka 3.7，后来安装Weka 3.8 版本后，发现无法打开package manager，然后发现官网有如下提示： Note for users upgrading from Weka 3.7 to Weka 3.8 or later: if the Weka 3.8 package manager does not start up, please delete the f

2016-05-28 20:28:02 9301

原创 Weka中文乱码解决方法

测试环境64位Win732位Weka3.8不过中文乱码解决方法应该跟上述环境无关。乱码原因weka默认的字符集编码是Cp1252，如果导入的数据中有中文字符，就会显示为乱码。解决方法打开weka安装目录下的RunWeka.ini文件，找到【fileEncoding=】这一行，将Cp1252编码改为需要的字符集编码，比如utf-8，cp936（简体中文），cp950（繁体中文）；**重新打开

2016-05-28 19:32:44 7435

原创【python gensim使用】word2vec词向量处理中文语料

word2vec介绍word2vec官网：https://code.google.com/p/word2vec/word2vec是google的一个开源工具，能够根据输入的词的集合计算出词与词之间的距离。它将term转换成向量形式，可以把对文本内容的处理简化为向量空间中的向量运算，计算出向量空间上的相似度，来表示文本语义上的相似度。word2vec计算的是余弦值，距离范围为0-1之间，值越大代

2016-05-21 20:57:21 75097 28

原创【python gensim使用】word2vec词向量处理英文语料

word2vec介绍word2vec官网：https://code.google.com/p/word2vec/word2vec是google的一个开源工具，能够根据输入的词的集合计算出词与词之间的距离。它将term转换成向量形式，可以把对文本内容的处理简化为向量空间中的向量运算，计算出向量空间上的相似度，来表示文本语义上的相似度。word2vec计算的是余弦值，距离范围为0-1之间，值越大代

2016-05-21 20:36:51 28027 4

原创结巴中文分词使用学习（python）

中文分词工具：结巴分词 github地址：https://github.com/fxsjy/jieba一、分词功能精确模式（默认）：试图将句子最精确地切开，适合文本分析；全模式，把句子中所有的可以成词的词语都扫描出来，但是不能解决歧义；搜索引擎模式，在精确模式的基础上，对长词再次切分，提高召回率，该方法适合用于搜索引擎构建倒排索引的分词，粒度比较细。注意：jieba.cut以及jieba.c

2016-05-21 17:15:12 13280

原创 Markdown语法入门练习

Markdown语法学习Markdown 是一种标记语言，通常为程序员群体所用。它是一个非常简单、非常容易学习的语法。这个语法简单到每个人都可以在5分钟以内学会。Markdown 的好处纯文本，兼容性强，可以用所有文本编辑器打开；Markdown转HTML非常方便；让你专注于文字而不是排版；Markdown 的标记语法有极好的可读性。************ 下面是练习 *********

2016-05-15 14:43:18 1168

原创 GitHub入门学习

1.官方简易教程√ 网址：https://guides.github.com/activities/hello-world/ （1）创建和使用repository （2）开始和管理一个新的branch （3）更改文件并提交（4）打开和合并一个pull request未完待续....

2016-05-10 21:05:18 654

原创 python开发之anaconda【以及win7下安装gensim】

一、推荐安装Anaconda 官方介绍：Anaconda is a completely free Python distribution (including for commercial use and redistribution). It includes more than400 of the most popular Python packages for sci

2016-05-10 17:19:34 14532

原创【java】使用Stanford CoreNLP处理英文（词性标注/词形还原/解析等）

本文旨在学习使用Stanford CoreNLP进行自然语言处理。编程环境：64位win7系统，NetBeans，java要求1.8+CoreNLP版本：3.6.0，下载地址：http://stanfordnlp.github.io/CoreNLP/，获取stanford-corenlp-full-2015-12-09.zip压缩包。Stanford CoreNLP功能

2016-04-22 14:04:30 18916 1

原创哈工大LTP和中科院NLPIR中文分词比较

个人实验总结，仅供参考。1.LTP有自动分句功能，NLPIR没有分句功能；LTP的分句是根据中文标点里的句号、问号、感叹号、分号、省略号。2.NLPIR分词有两种方式，分词结果完全一致。（1）利用分词函数NLPIR_ParagraphProcess；（2）利用NLPIR_FileProcess对整个文本进行分词。其中第（2）种有时候会出现bug，分词进行到文

2016-04-17 18:00:35 20656 1

原创哈工大语言云（LTP）本地安装使用及Python调用

备注：本文实验环境为64位win7系统，32位python2.7.11哈工大LTP官方主页：http://ltp.readthedocs.org/zh_CN/latest/index.html1.LTP下载（1）LTP项目文件ltp-3.3.1-win-x86.zip（2）LTP模型文件3.3.1（2016年4月13日前）下载地址参考：http://ltp.read

2016-04-17 17:51:13 42452 19

原创 Python调用哈工大语言云（LTP）API进行自然语言处理

哈工大语言云（语言技术平台云）是以哈工大社会计算与信息检索研究中心研发的“语言技术平台（LTP）” 为基础，提供高效精准的中文自然语言处理云服务。官网：http://www.ltp-cloud.com/ 使用python调用API实验，参考文档：http://www.ltp-cloud.com/document/1.注册：免费注册一个帐号

2016-04-17 17:17:07 12099 2

转载 win7(64位)系统安装64位ODBC驱动的方法

参考文献：http://my.oschina.net/Rayn/blog/129113PS：64位win7系统，32位office软件。由于office是32位，在正常情况下，从微软下载的AccessDatabaseEngine_X64.exe（64位ODBC驱动）无法安装。解决方法：（1）用压缩软件把AccessDatabaseEngine_X64.exe接压缩，里面会有一个Ac

2016-04-07 14:01:23 17997

原创 python库/模块之pygraphviz 1.3.1安装

pygraphviz安装查看了网上很多资料，试验了很久，终于安装成功了。PS：windows系统，64位Win7，64位python2.7.11参考资料：http://www.cnblogs.com/AimeeKing/p/5021675.html一、下载相关1、pygraphviz 1.3.1（zip），网址：https://pypi.python.org/pypi/py

2016-04-04 23:24:43 6304 2

原创 Python跳出多重循环的方法

方法1：自定义异常# -*- coding:utf-8 -*-"""功能：python跳出循环"""# 方法1：自定义异常class Getoutofloop(Exception): passtry: for i in range(5): for j in range(5): if i == j == 2:

2016-04-02 14:00:15 113883 6

转载 Sublime Text 2安装及汉化

本文转自：将Sublime Text 2搭建成一个好用的IDESublime Text是一款代码编辑器，但是它有丰富的扩展插件，足以让我们把它变成好用的IDE。1.下载/安装/汉化：下载地址：http://www.sublimetext.com/2，选择合适的版本。汉化包：http://files.cnblogs.com/dolphin0520/sublime%

2016-03-24 14:05:53 1574

原创 Win7系统CMD进入文件夹目录的命令

Win7 系统下用CMD命令进入文件夹目录Win7下的CMD有些奇怪，打开CMD后显示：C:\Users\lenovo>此时进入C盘下的文件夹目录可以直接用命令：cd C:\Program Files\Java\jdk1.8.0_45但是如果想要进入其他盘的某个文件夹，如果直接输入： ——命令（1）cd D:\Python 2.7.9\Lib此时CMD仍然显示

2016-03-23 20:06:36 8160 2

空空如也

空空如也