2 杨丹的博客

尚未进行身份认证

业精于勤荒于嬉,形成于思毁于随。

等级
TA的排名 4w+

Bert在Win10启动server TypeError: cannot unpack non-iterable NoneType object

按照流程启动server,在串口输入bert-serving-start -model_dir E:\BERT\chinese_L-12_H-768_A-12 -num_worker=1后,开始看好像是顺利的,到后面就出现问题:Traceback (most recent call last):(指的是你的各种文件出错了)……(这些都可以省略,源头通常在最后)…………File “e:\a...

2019-11-28 15:20:58

BERT基础(三):BERT与Word2Vec、ELMO的比较与所做改进分析

参考文章:Bert浅析从Word Embedding到Bert模型——自然语言处理预训练技术发展史简单来说,词向量模型是一个工具,可以把文字(词语/字符)转换成向量,然后我们使用这些向量来完成各种 NLP 任务。因而某种意义上,NLP 任务分成两部分:预训练产生词向量,对词向量进行操作(下游具体 NLP 任务)。一、 Word2vecWord2Vec 模型训练出来的词向量之间具有...

2019-11-05 12:39:49

BERT基础(二):Transformer 详解

Transformer 中 self - attention 的详解参考:BERT基础(一):self_attention自注意力详解在 Transformer 之前,多数基于神经网络的机器翻译方法依赖于循环神经网络(RNN),后者利用循环(即每一步的输出馈入下一步)进行顺序操作(例如,逐词地翻译句子)。尽管 RNN 在建模序列方面非常强大,但其序列性意味着该网络在训练时非常缓慢,因为长...

2019-11-05 11:18:09

BERT基础(一):self_attention自注意力详解

BERT中的主要模型为Transformer,而Transformer的主要模块就是self-attention。为了更好理解bert,就从最基本的self-attention 开始。之后的博文则一步一步推进到bert。参考:李宏毅2019年新增课程 week 15 transformer 课程笔记视频及课件地址:https://www.bilibili.com/video/av65521...

2019-11-05 11:06:26

阿里云CentOS下安装anaconda并配置远程使用Jupyter lab

一、新建用户并登陆为什么要新建用户?因为root的权限太多,不方便多人多角色使用,用root用户登录进行操作比较敏感,所以添加一个用户。01. 新建用户1、创建一个新用户:danyang[root@localhost ~]# adduser danyang2. 为新用户创建初始化密码[root@localhost~]# passwd danyangChanging passwor...

2019-10-14 13:54:48

阿里云CentOS下用VIM编写python、c程序并运行

CentOS下用VIM编写python、c程序并运行参考:[VIM操作命令大全](https://www.cnblogs.com/uncle-qi/p/9356465.html)前言:vim是一个功能强大的全屏幕文本编辑器,是linux/unix上最常用的文本编辑器它的作用是建立、编辑、显示文本文件vim没有菜单,只有命令01. vim安装//Centos7最新版本默...

2019-10-14 09:53:10

CRF++只迭代一次停止,不生成model的问题解决

CRF++使用详情见 CRF++使用小结01 问题在应用CRF++训练模板时,由于数据规模较大,运行迭代了一次以后就停止,且不生成model,如下:02 解决办法:调整参数 -f NUM这个參数设置特征的cut-off threshold。CRF++使用训练数据中至少NUM次出现的特征。默认值为1。当使用CRF++到大规模数据时,仅仅出现一次的特征可能会有几百万,这个选项就会在这种情况...

2019-09-06 17:00:05

【java文本处理】正则表达之规定开始、结束字符且之间不含指定字符 --- 匹配字符串中的人物对话内容(修正版)

本文是基于上一篇博文【java文本处理】正则表达懒惰匹配 — 统计文档中对话段数,并匹配出人物对话内容写入新文档作的修正。01. 需解决的问题上一篇博文中的问题:匹配一段对话,< \“ >是指从出现的引号开始匹配,以<\,”>或<\。”>或 <\!”> 或 <\?”> 或 &a

2019-02-25 15:37:13

【java文本处理】正则表达懒惰匹配 --- 统计文档中对话段数,并匹配出人物对话内容写入新文档

一、目的此博文利用正则表达中的懒惰模式(非贪婪模式)匹配文档中的对话(:“ ”),并用自定义计数器累计出一篇文章中有多少段对话,可用之判断一篇文章的类型。二、正则表达 — 懒惰匹配 .*?正则表达式语法繁多复杂,在运用时若不能真正掌握其含义,很容易在使用时误入歧途!那此处的懒惰匹配究竟是什么?在此举例说明:例:一个字符串“aabab”懒惰匹配:regex=“a.*?d”; 贪婪...

2019-02-23 21:44:31

【java文本处理】实现txt文档中汉字频率排序及输出频率最高的前十个汉字

01. 目的java编程实现统计文档中汉字出现的频率,将汉字出现频率按高频到低频排序,并输出频率最高的前十个汉字。02. 主要实现方法(1) 首先按行读出txt文档中的内容:.readLine();​ 按行读出后取出每行中的字符: .charAt(i);(2) 构建了HashMap对象,用于存放文档中出现的汉字及其出现的频率。键对应字符,值对应字符出现的次数。HashMap&lt...

2019-01-31 14:31:01

【Java】Collections.sort() 方法 —— Comparable、Comparator接口

前言:在日常开发中,很多时候都需要对一些数据进行排序的操作。然而那些数据一般都是放在一个集合中如:Map ,Set ,List等集合中。他们都提共了一个排序方法sort(),要对数据排序直接使用这个方法就行,但是要保证集合中的对象是 可比较的。一、 Collections.sort() 方法1. 概述Collections类中的sort方法可以实现对List接口的集合进行排序。这个方...

2019-01-30 20:04:08

【java文本处理】实现文档中字母、数字、汉字、标点符号和总字符的个数计算

01. 目的累计文档中字母、数字、汉字、标点符号以及全部字符的数目。注:文档中的空格、英文标点符号归为:“其他字符”02. 主要方法(1)用InputStreamReader读入文本内容,以行读入str = buf.readLine()并判断一行中每个字符str.charAt(i);(2)判断字母:str.charAt(i))>='A' && (str.charAt...

2019-01-21 23:58:51

Java判断中文符号 — Character.UnicodeBlock中的cjk说明

01. Java判断中文符号private static final boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c); //获取此字符的UniCodeBlock if (ub == Character.UnicodeBlock.CJK_UNI...

2019-01-21 23:51:54

【java bug】java.lang.NullPointerExceptio(空指针异常)

此处有坑: java.lang.NullPointerExceptio针对上一篇博客【java】实现一个简单的小说文本阅读器(分页、翻页、页码跳转),在之后运行检验时发现一小bug —— java.lang.NullPointerExceptio。NullPointerException由RuntimeException派生出来,是一个运行级别的异常。就是说可能会在运行的时候才会被抛出,而且需要...

2019-01-09 22:22:02

【java文本处理】实现一个简单的小说文本阅读器(分页、翻页、页码跳转)

一、目的读出文本(.txt)内容显示至dos命令窗;按规定行数将文本进行分页;在dos下实现文本翻页、页码跳转等功能,形成简单小说阅读器。二、主要方法1. RandomAccessFile类详细用法参考上篇博文:RandomAccessFile简述RandomAccessFile是Java输入/输出流体系中功能最丰富的文件内容访问类,既可以读取文件内容,也可以向文件输出数据...

2018-12-05 15:48:10

【java】RandomAccessFile读取txt文档分页并获取页末指针

01 . 目的RandomAccessFile方式读取文件将文件按每页5行实现分页获取页末指针,为后续翻页准备02 . RandomAccessFile简述        RandomAccessFile是Java输入/输出流体系中功能最丰富的文件内容访问类,既可以读取文件

2018-11-26 00:55:05

【java文本处理】(续)删除txt文档中的包含(contains)指定字符串的行

01 . 目的        用java编程实现删除txt文档中的含指定关键字的行,代替手动删除,无需依次查找。将修改的内容存入新的文档。相关参考博文:java删除txt文档中的空白行02 . 主要方法Buf

2018-11-22 00:16:12

【java文本处理】删除txt文档中的空白行

01.目的       用java编程实现删除txt文档中的空白行,代替手动删除,减少不必要的工作。将修改的内容存入新的文档,在修改完成后自动打开,便于查看

2018-11-20 17:37:00

【java-Runtime类】通过键盘输入不同数字调用不同程序(如输入 1调用运行记事本程序,输入2调用运行画图程序等)

01. 学习目的完成一个 java application应用程序,通过键盘输入1、2、3等值,输入1则调用运行windows记事本程序,输入2则调用运行windows画图程序等等。02. 相关类——Runtime类在java.lang包当中定义了一个Runtime类。...

2018-11-09 22:38:02

【JAVA】通过键盘输入的文本动态加入Vector类对象

前言:此篇文章简单介绍vector类的常用方法,并编写程序实现通过键盘输入的文本动态加入Vector类对象。01. Vector类(1)概述java.util.vector提供了向量类(vector)以实现类似动态数组的功能。创建了一个向量类的对象后,可以往其中随意插入不同类的对象,即不需顾及类型也不需预先选定向量的容量,并可以方便地进行查找。对于预先不知或者不愿预先定义数组大小,...

2018-11-06 22:12:50

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。