3 CycloneKid-blogs

尚未进行身份认证

北京邮电大学计算机技术研究生 自然语言处理方向

等级
TA的排名 2w+

NLP学习04--长短期记忆网络LSTM

一.长短期记忆网络LSTM简介LSTM是对RNN的改进和升级,在RNN模型中,对于长期依赖的问题可能产生梯度消失和梯度爆炸,而在RNN的基础上改进而来的LSTM则特别适合解决这类需要长时间依赖的问题。LSTM相对于RNN的不同使,LSTM将“记忆细胞”进行了改造,而不是像RNN那样只有一个简单的激活函数。在LSTM中,需要记录的信息会一直传递,不需要记录的信息会被截断掉如下图所示,部分输出和输...

2019-06-08 16:47:05

NLP学习03--递归神经网络RNN

一.递归神经网络RNN简介BP神经网络和CNN的输入输出都是互相独立的;但是实际应用中有些场景输出内容和之前的内容是有关联的。RNN引入“记忆”的概念;递归指其每一个元素都执行相同的任务,但是输出依赖于输入和“记忆”bp神经网络和卷积神经网络这两种结构有一个特点,就是假设输入是一个独立的没有上下文联系的单位。但是对于一些有明显的上下文特征的序列化输入,比如预测视频中下一帧的播放内容,那么很...

2019-06-08 14:51:20

NLP学习02--卷积神经网络CNN

一.卷积神经网络简介卷积神经网络(ConvolutionalNeuralNetwork,CNN)是深度学习技术中极具代表的网络结构之一。CNN在CV和NLP领域都有很广泛的应用,相较于传统的算法,CNN避免了复杂的前期预处理过程(提取人工特征等),可以直接输入原始数据。CNN能够实现上述独特功能的原因是它使用了局部连接(SparseConnectivity)和权值共享(SharedWe...

2019-06-07 20:19:40

NLP学习01--BP神经网络

一.神经元模型如下图是深度学习(deeplearning)中神经元的模型,神经元是进行计算的基本单元。其中x1、x2和x3为输入,+1为偏置神经元进行计算的数学公式可表示为:上式中,F、w、b分别为激活函数,权重,偏置;其中,激活函数F有多重,常用激活函数有sigmoid,Relu和tanh等二.BP神经网络2.1BP神经网络原理BP神经网络的工作原理图如下所示:最左...

2019-06-07 18:44:15

Boost.Python.ArgumentError: Python argument types in错误解决及Boost安装配置

报错信息运行Python程序时报错,报错信息如下图所示。先检查函数使用的是否正确,如果确定没有问题,那么很可能是boost的安装配置问题Boost库简介Boost库是为C++语言标准库提供扩展的一些C++程序库的总称。Boost库是一个可移植、提供源代码的C++库,作为标准库的后备,是C++标准化进程的开发引擎之一。可下载BoostC++Libraries安装boost库。大部分b...

2019-04-16 09:49:18

新浪网首页新闻资讯爬虫项目

一.项目简介该爬虫是使用Python框架Scrapy开发,用来爬取新浪网首页分类的爬虫项目,适合新手用来学习Scrapy框架的使用及开发流程。爬虫的目标网站地址:http://news.sina.com.cn/guide/项目一共要爬取三级内容,分别是大类,小类,小类中的资讯文章。如下图所示,新闻,体育是一个大类,新闻大类下有国内,国际,社会等几个小类在国际小类中,有很多资讯文章,该爬虫...

2019-04-01 18:15:32

Windows下安装hadoop2.7.1

1.安装前需要准备的文件需要先去官网下载hadoop,但下载完的hadoop是不能直接在Windows上运行的,需要替换bin和etc两个文件夹,替换成专门为Windows下运行而编译的对应版本的bin和etc文件夹,可以在csdn下载中下载:也可以去官网先下载hadoop,然后去GitHub下载hadooponwindows。hadoop官网,hadooponwindowsGitHub下载地...

2019-03-30 11:04:25

Python爬虫框架Scrapy报错:ModuleNotFoundError: No module named 'scrapy'

今天在使用Scrapy框架开发爬虫程序时换了一个Python版本,把原来的Python卸载了,换了一个新的版本的Python,打开PyCharm运行程序结果报如下错误:ModuleNotFoundError:Nomodulenamed'scrapy’我查了查资料,报这个错误的原因是Scrapy框架未正常安装。我更新了Python把原来的Scrapy库文件给删掉了,可以把Scrapy删除然...

2019-03-29 23:36:37

大型分布式Java项目--"宜立方商城"

一.项目简介宜立方商城是一个综合性的B2C平台,架构模仿京东商城、天猫商城,该平台主要提供两种服务:一,买家可以在商城浏览商品、下订单,以及参加各种活动。二,管理员,运营可以在平台后台管理系统中管理商品、订单、会员等宜立方商城项目使用Java的SSM框架处理后端业务,同时使用了Dubbo框架,是一个分布式支持高并发的商城项目。数据库选择MySQL集群,缓存使用Redis集群,使用Solr框架实...

2019-01-14 22:21:28

JavaWeb练习项目--"JEE商城"

一.项目简介本项目主要使用了JavaWeb技术,包括Jsp,Servlet,JDBC,适合刚学完JavaWeb的新手作为练习项目,巩固知识项目GitHub地址:https://github.com/JavaStudenttwo/JEEShop项目展示网址:http://47.106.99.83/JEEShop/jsp/index.jsp二.项目涉及的技术前端:使用了BootStrap...

2018-12-26 22:54:23

Hexo报错Usage: hexo <command>处理及图片显示问题

有一段时间没上GitHub的静态博客,今天上去看了一下发现图片都不能正常显示了,效果如下:我的图片都是放在牛客网上的,我查了一下是牛客网的测试域名不能用了,需要绑定自己的域名,而且之前上传的图片也全部作废,不能再访问,也不能下载。。。。于是我决定把图片都重新放回到GitHub静态博客上转移方法:在source文件夹下新建一个images文件夹来存放图片修改原来的图片地址,改为/imag...

2018-12-26 19:37:42

Scala基础-01-Scala环境安装及基础语法(变量,函数)

Scala简介Scala是一种多范式的编程语言,其设计的初衷是要集成面向对象编程和函数式编程的各种特性。Scala运行于Java平台(Java虚拟机),并兼容现有的Java程序。Scala是编写大数据框架Spark的语言,随着大数据的兴起,越来越多的人开始学习ScalaScala语言的优点优雅:这是框架设计师第一个要考虑的问题,框架的用户是应用开发程序员,API是否优雅直接影响用户...

2018-07-05 22:41:16

Python爬虫基础-02-提取数据

页面解析和数据提取在第一篇博客Python爬虫入门中曾分析过通用爬虫和聚焦爬虫,通用爬虫获取整个网页,而聚焦爬虫是针对部分数据进行获取,聚焦爬虫和通用爬虫一样会将整个网页下载下来,但下载下来之后还需要进行处理—将有用的信息提取出来网页内容根据结构类型可分为两类,非结构化的数据和结构化的数据,不同类型的数据,需要采用不同的方式处理非结构化数据一般有文本、电话号码、邮箱地址以及HTML文件...

2018-07-04 21:09:14

Scrapy框架入门

Scrapy简介Scrapy框架是使用Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试Scrapy不仅有单机版,开发者还可以使用其集群版Scrapy-redis开发分布式爬虫程序,分布式爬虫有更快的速度和更高的效率Scrapy用途非常广泛,用户只需要定制开发几个模块就可以...

2018-06-11 21:12:41

Hadoop入门

Hadoop生态圈Hadoop简介Hadoop是apache旗下的一套开源分布式计算框架。Hadoop的作用简单来说就是利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理。Hadoop的核心组件有三个,分别是:1.分布式文件系统HDFS,2.运算资源调度系统YARN,3.分布式运算编程框架MAPREDUCE我们平时说的Hadoop通常是指一个更广泛的概念——Ha...

2018-06-07 12:09:27

Python爬虫基础-01-带有请求参数的爬虫

在上一篇文章Python爬虫入门中,Python爬虫程序爬取了指定网页的信息,爬虫发出的请求是一个固定的URL和部分请求信息,并没有请求参数,但是爬虫工作过程中发出的请求一般都需要加上请求参数,以完成对指定内容的爬取HTTP请求分为POST请求和GET请求,这两种请求添加请求参数的方式不同GET请求POST请求...

2018-06-06 19:06:23

Log4j框架配置文件log4j.properties配置使用详解

log4j.properties配置文件详解Log4j支持两种配置文件格式,一种是XML格式的文件,一种是properties(key=value)文件,其中properties格式的配置文件最为常用,其有一个固定的文件名log4j.properties,下面我们介绍使用properties文件做为配置文件的方法:1.配置rootLoggerrootLogger的配置方式:log4...

2018-06-05 19:12:19

Log4j入门

一.Log4j简介Log4j是Apache开发的一款日志框架,被非常广泛用于各种类型的java项目中,Log4j官网在应用程序中添加日志记录总的来说基于三个目的:监视代码中变量的变化情况,周期性的记录到文件中供其他应用进行统计分析工作跟踪代码运行时轨迹,作为日后审计的依据担当集成开发环境中的调试器的作用,向文件或控制台打印代码的调试信息在项目中添加日志记录最普通的做法...

2018-06-05 15:30:59

Linux常用命令

Linux命令非常多,很难全部记下来,但是大多数命令平时使用时根本用不到。这里我把我常用的一些Linux命令记下来,方便使用网络相关查看网络端口使用情况查看具体某一端口的使用情况,以下两命令均可netstat-ano|grep目标端口号netstat-an|grep目标端口号查看具体某一端口的使用情况,并显示占用该端口的程序的进程号netstat...

2018-06-04 14:53:28

IDEA使用技巧--在文件导航栏中屏蔽指定后缀名的文件

问题:IDEA中做比较大的项目时,由于文件比较多,在文件导航栏中找文件时需要不停地滚动滑轮上下翻。而且,文件导航栏中往往会出现很多不需要编辑和查看的文件,例如:下图中的log文件,程序编写过程中根本用不到这些文件解决方案:在File-&amp;gt;setting-&amp;gt;Editor-&amp;gt;FileType中下面红线圈出的一段指令,添加要屏蔽的文件的通配符OK退出,世界突...

2018-06-01 22:39:29

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。