8 Hearthougan

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 3k+

在Windows安装chromedriver

在Windows安装chromedriver(更新了mac版教程)一、安装selenium启动cmd命令行(同时按住windows键和R键,在对话框内输入cmd,然后回车)安装selenium,在弹出的窗口内输入 pip install selenium二、chromedrive1、下载chromedrive前往 chromedriver 下载页面(如果官...

2018-11-26 15:38:31

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

目录图像领域的预训练Word Embedding考古史从Word Embedding到ELMO从Word Embedding到GPTBert的诞生Bert最近很火,应该是最近最火爆的AI进展,网上的评价很高,那么Bert值得这么高的评价吗?我个人判断是值得。那为什么会有这么高的评价呢?是因为它有重大的理论或者模型创新吗?其实并没有,从模型创新角度看一般,创新不算大。但是架不...

2018-11-19 16:56:05

一文详解深度学习在命名实体识别(NER)中的应用

目录1、NER 简介2. 深度学习方法在NER中的应用2.2 IDCNN-CRF3. 实战应用3.1 语料准备3.2 数据增强3.3 实例4. 总结近几年来,基于神经网络的深度学习方法在计算机视觉、语音识别等领域取得了巨大成功,另外在自然语言处理领域也取得了不少进展。在NLP的关键性基础任务—命名实体识别(Named Entity Recognition,NER...

2018-11-07 09:58:38

tf.strided_slice()

# -*- coding: utf-8 -*-"""Created on Tue Nov 6 10:46:32 2018@author: Abner_hg"""import numpy as npimport tensorflow as tfdata = [[[1, 1, 1], [2, 2, 2]], [[3, 3, 3], [4, 4, 4]]...

2018-11-06 11:53:42

深度学习中的注意力机制(Attention Model)

注意力模型最近几年在深度学习各个领域被广泛使用,无论是图像处理、语音识别还是自然语言处理的各种不同类型的任务中,都很容易遇到注意力模型的身影。所以,了解注意力机制的工作原理对于关注深度学习技术发展的技术人员来说有很大的必要。

2018-11-05 16:51:54

python 从TXT中解析json格式

txt中的json格式:with open(r'Zhan.txt','r', encoding = 'utf-8') as file_open: data = json.load(file_open) for line in data: print(line['title']) print(line['content'])但是提示错误:...

2018-10-24 14:19:10

卷积神经网络的一些细节思考(卷积、池化层的作用)

卷积神经网络由卷积核来提取特征,通过池化层对显著特征进行提取,经过多次的堆叠,得到比较高级的特征,最后可以用分类器来分类。这是CNN的一个大概流程,其具体实现的结构是丰富多样的,但总的思想是统一的。CNN整个的计算过程,最重要的有两点:组合性和局部不变性(平移、旋转、尺度放缩)。组合性:每个卷积核可以看做某种特征的提取器。所谓组合性就是将卷积核提取的一些简单特征进行组合,得到更高级...

2018-10-20 10:47:53

error while loading shared libraries: libpython3.7m(2.7).so.1.0: cannot open shared object file: N

Python3问题:./out: error while loading shared libraries: libpython3.7m.so.1.0: cannot open shared object file: No such file or directory解决办法:1、cd /etc/ld.so.conf.d2、vim python3.conf3、添加 /ro...

2018-10-16 16:50:58

Linux下提示命令找不到:bash:command not found

Linux下输入某些命令时会提示:bash:command not found。情况一:首先,查看$PATH中是否包含了这些命令。$PATH:决定了shell到哪些目录中去寻找命令或程序,PATH值是一系列的目录。当运行程序时,linux到这些目录下搜索进行编译链接。格式:PATH = $PATH:<PATH1>:<PATH2>:<PATH3...

2018-10-13 16:18:31

CRF++在Windows下以及Linux下的安装及测试方法

Windows与Linux下CRF++有两种不同的版本,很多时候官网无法下载,你如果需要下载CRF++,你可以点击这里下载这两个版本。Windows首先说一下Windows的安装方法(其实无需安装),以及简单的使用方法。1、解压,进入crf++-0.58,你可以看到2、你需要把红色方框内的文件复制到example\chunking文件夹下。3、打开cmd,找到刚刚的...

2018-09-29 15:59:43

NPP++去除文本中的重复行

方法一:使用正则表达是的方式:^(.*?)$\s+?^(?=.*^\1$)如下图格式方法二:选择菜单TextFX   --    TextFX Tools:1、选择"TextFx"-"TextFx Tools"-"Sort outputs only UNIQUE(at column) lines"。2、 选中要去除重复行的数据。3、选择"TextFx"-"T...

2018-09-27 17:39:16

Understanding LSTM Networks

本文是转自 colah's blog的博客,是为了自己查看方便,是讲LSTM的结构和原理非常好的文章,这个也是大多数博客讲解LSTM的参考。文末附有文章出处。Recurrent Neural NetworksHumans don’t start their thinking from scratch every second. As you read this essay, you und...

2018-09-26 10:41:10

RNN二进制加法实例

本文是根据前两篇详细展示RNN的网络结构以及详细阐述基于时间的反向传播算法(Back-Propagation Through Time,BPTT)来找的一个RNN实例,本例子可以帮助对RNN的前向传播以及后向传播,以及RNN结构的理解。整个过程符合下图RNN结构描述:# -*- coding: utf-8 -*-"""Created on Mon Sep 24 17:02:41 2...

2018-09-25 15:04:35

Python 正则表达式

实例引入说了这么多,可能我们对它到底是个什么还是比较模糊,下面我们就用几个实例来感受一下正则表达式的用法。我们打开开源中国提供的正则表达式测试工具http://tool.oschina.net/regex/,打开之后我们可以输入待匹配的文本,然后选择常用的正则表达式,就可以从我们输入的文本中得出相应的匹配结果了。例如我们在这里输入待匹配的文本如下:Hello, my phone ...

2018-09-21 10:13:47

详细阐述基于时间的反向传播算法(Back-Propagation Through Time,BPTT)

上一节我们说了详细展示RNN的网络结构以及前向传播,在了解RNN的结构之后,如何训练RNN就是一个重要问题,训练模型就是更新模型的参数,也就是如何进行反向传播,也就意味着如何对参数进行求导。本篇内容就是详细介绍RNN的反向传播算法,即BPTT。首先让我们来用动图来表示RNN的损失是如何产生的,以及如何进行反向传播,如下图所示。上面两幅图片,已经很详细的展示了损失是如何产生的, 以及...

2018-09-20 00:55:59

数据挖掘面试笔试题(附答案)

一、单选题(共80题)1、( D )的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。A.数据清洗       B.数据集成C.数据变换       D.数据归约2、某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)   A. 关联规则发现       B. 聚类   C. 分类    ...

2018-09-18 09:40:35

详细展示RNN的网络结构

下面简单介绍一下RNN的结构,如果简略地去看,RNN结构很简单,根本没有CNN那么复杂,但是要具体实现,还是需要仔细思考一下,希望本篇博客能把RNN结构说的明白。循环神经网络(Recurrent Neural Network,RNN)DNN以及CNN在对样本提取特征的时候,样本与样本之间是独立的,而有些情况是无法把每个输入的样本都看作是独立的,比如NLP中的此行标注问题,ASR中每个音素都和前...

2018-09-17 20:27:54

图示Softmax及交叉熵损失函数

Softmax函数Softmax是将神经网络得到的多个值,进行归一化处理,使得到的值在之间,让结果变得可解释。即可以将结果看作是概率,某个类别概率越大,将样本归为该类别的可能性也就越高。Softmax就如下图(借鉴李宏毅老师的课件)SoftMax为了更加清晰的看清整个过程,我将其制作成gif,如下图所示:Softmax的工作过程交叉熵:假设和是关于样本集的两个分布,其...

2018-09-14 22:21:18

windows下pip install xx 遇到的 ConnectionResetError<10054>问题

用pip install 遇到如下的问题C:\Users\*******&amp;gt;pip install Python 3.XCollecting Python Retrying (Retry(total=4, connect=None, read=None, redirect=None)) after connection broken by 'ProxyError('Cannot...

2018-09-08 09:20:56

通俗理解LDA主题模型

转自:https://blog.csdn.net/v_july_v/article/details/412095150 前言    印象中,最开始听说“LDA”这个名词,是缘于rickjin在2013年3月写的一个LDA科普系列,叫LDA数学八卦,我当时一直想看来着,记得还打印过一次,但不知是因为这篇文档的前序铺垫太长(现在才意识到这些“铺垫”都是深刻理解LDA 的基础,但如果没有人帮助初...

2018-09-06 21:59:20

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 分享王者
    分享王者
    成功上传51个资源即可获取