自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

crz_blog

控制的精髓是“反馈”---凡事有交代,件件有着落,事事有回音。

  • 博客(36)
  • 收藏
  • 关注

原创 序列标注:2、NER资料

NLP四大任务:分类、生成、序列标注、句子对标注。NER:模型 Bi-LSTM-CRF、BERT-CRF可玩的地方:多特征:ner重底层/句法信息,特征越多越好,字/词/词性/句法/KG 特征等等。多任务:嵌入到更大的系统目标中,或者拆为chunk+分类任务。其他:先进的尝试资料:NER汇总:流水的NLP铁打的NER:命名实体识别实践与探索(综述)娄杰:NER词汇增强娄杰:NER数据增强娄杰:工业界NER的12个trick特征抽取器:张俊林:放弃幻想,全面拥抱transf

2021-02-15 22:23:02 165

转载 序列标注:1、HMM & CRF

说明:公式推导比较复杂,我也没看懂,权且简单记录粗略概念。转载自:结构学习:序列标注序列标注:输入一个序列,输出也是一个序列。如词性标注、分词、命名实体识别等。John(PN) saw(V) the(D) saw(N).需要理解整个句子含义才能标注正确----全局。隐马尔科夫模型 HMM首先基于语法产生一个词性序列,然后基于词典,产生一个基于词性语句的实际语句。HMM计算P(x,y)可拆解为以下两步:实际计算时的概率是在训练数据中得到的,P(t|s) = C(t,s) / C(s)

2021-02-09 13:28:23 359

原创 Top: 参考资料

主要网站:sklearn:官方网站码农场:机器学习、NLP、C++、算法等

2021-02-08 17:12:40 110

原创 文本匹配:1、基础算法

文本匹配:主要是求两个句子之间的相似度。

2021-01-31 17:06:53 754 3

原创 预训练:2、动态词向量ELMo/GPT/Bert

      word2vec、glove、fasttext是静态词向量,无法解决一词多义问题,elmo、GPT、Bert词向量是基于语言模型的动态词向量。elmo、GPT、bert三者之间有什么区别?特征提取器:elmo采用LSTM进行提取,GPT和bert则采用Transformer进行提取。很多任务表明Transformer特征提取能力强于LSTM,elmo采用1层静态向量+2层LSTM,多层提取能力有限,而GPT和bert中的Transformer可

2021-01-30 20:34:44 1857

原创 结构性思考

提示:与《金字塔原理》类似,多图预警。文章目录前言一、二、使用步骤1.引入库2.读入数据总结前言思考清晰&表达有力:透过结构看世界是一种生活习惯和态度。结构性思考三部曲: 理解、重构、呈现在这里插入图片描述提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、示例:pandas 是基于NumPy 的一种工具,该工具是为了

2020-12-04 20:35:31 359

原创 shell脚本

shell脚本基础欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mark

2020-07-08 10:43:11 126

翻译 读《平凡的世界》

第二部    孙少平去黄原    第11章    按说,要做一个安分守己的农民,眼下这社会正是创家立业的好时候。只要心头攒劲,哪怕纯粹在土地上刨挖,也能过好光景。更何况,象他们家现在还有能力办起一个烧窑砖,那前景不用说大有奔头。发家致富,这是所有农民现在的生活主题。只要有饭吃,有衣穿,有钱花,身体安康,儿女双全,人活一世再还要求什么呢?    谁让你读了那么些书,又知道了双水村以外还有个大...

2019-11-02 23:08:44 295

原创 文本分类:4、工程经验

数据决定上限,模型逼近上限。工程不是刷论文,看到效果先分析数据。建议:企业中的文本分类文本分类:给定一段文本,预测一个或多个标签分类示例:新闻分类(体育、政治等)、情感分类(高兴、伤心等)技术侧划分:文本长度:短句、段落、文章预测标签:一个、多个 (层级标签)标签数量:二分类、多类别分类 (根据问题,设计Loss)我主要处理的是「口语化短文本」(不超过15个字),因为是语音转文...

2019-10-20 19:45:40 210

原创 文本分类:3、新秀Bert文本分类

自从Bert刷新了几大经典NLP任务后,企业也逐渐采用Bert----效果拔群、性能感人。。本文主要记录下使用过程。

2019-10-20 12:43:21 241

原创 文本分类:2、经典Deep Learning方法

Fasttext、TextCNN、DPCNN、TextRNN、TextRCNN 、HAN、Transformer 等

2019-10-20 12:38:03 361

原创 文本分类:1、传统Machine Learning方法

数据清洗与预处理:分词、去除停用词 和 低频词特征工程 + 分类器:    特征工程:将文本转换成 固定纬度的向量    分类器:LR、SVM、GBDT 等...

2019-10-20 12:34:06 340 1

原创 Vim:2、vim命令

参考1_vim基础、参考2_vim命令大全

2019-10-17 09:40:07 377

原创 Vim:1、字体编码设置

在 shell 终端下执行:vim ~/.vimrc ,添加以下内容if has("autocmd") au BufReadPost * if line("'\"") > 1 && line("'\"") <= line("$") | exe "normal! g'\"" | endifendifset encoding=utf-8 fileencodi...

2019-10-16 21:53:23 132

原创 Linux基础:1、物理内存 和 虚拟内存

物理内存 vs 虚拟内存 参考

2019-10-16 12:18:10 95

原创 Linux命令:8、其他命令

ln、diff、date、cal、grep、wc、ps、watch、at、crontab1、ln [参数][源文件/目录][目标文件/目录] ---- link,为某个文件在不同的位置建立链接硬链接—一个文件可以有多个名称,在同一个文件系统中软链接—一个特殊文件,指向源文件位置,可跨越不同的文件系统ln -s ori_file dest_file 软链接,在选定位置上生成源文件的镜像,不占...

2019-10-16 12:14:08 222

原创 Linux命令:7、网络命令

ifconfig、route、ping、traceroute、netstat、ss、telnet、rcp、scp、rsync1、ifconfig[网络设备][参数] ---- 获取/修改 网络接口配置信息需要以root身份登陆,或使用sudoifconfig    第一行:eth0表示第一块网卡,UP表示网卡开启、广播、RUNNING网卡的网线被接上、MULTICAST支持组播,mtu...

2019-10-16 10:41:21 265

原创 Linux命令:6、性能监控和优化

top、free、vmstat、iostat、lsof1、top [参数] ---- 实时显示各进程的资源占用(cpu、内存等)top注:区分linux的用户、内核空间,物理、虚拟内存前5行是统计信息区:   第3行%Cpu占用 : us用户空间,sy内核空间,ni改变过优先级的进程,id空闲cpu的百分比,wa IO等待,hi硬中断,si软中断   第5行的Swap交换分区的use...

2019-10-15 12:49:34 131

原创 linux命令:5. 文件目录操作

磁盘存储相关 df、du 命令1、df [选项] [文件] ---- 检查磁盘占用,以1KB为单位显示df -h 方便阅读方式,显示磁盘占用2、du [选项] [文件] ---- 显示每个文件或目录的磁盘占用du -h file/dir # 如果无file/dir,则默认当前dirdu | sort -nr | more 按照空间大小排序du -h --max-depth=1 ...

2019-10-15 09:49:35 70

原创 Linux命令:4.文件打包上传和下载

tar 、 gzip1、tar [必要参数][选择参数][文件]tar -zcvf log.tar.gz log2012.log 打包后,以 gzip 压缩tar -zxvf /opt/soft/test/log.tar.gz 解压包2、gzip[参数][文件或者目录]压缩、解压文件gzip * 把目录下的每个文件压缩成.gz文件...

2019-10-05 15:27:58 178

原创 Linux命令:3. 文件和目录属性

Linux目录结构、文件类型和扩展名、文件属性 详细内容1、Linux目录结构可分享的不可分享的不变的/usr 软件放置处、 /opt 第三方软件/etc配置文件、/boot 开机与核心文档可变动的/var/email /var/spool/news/var/run /var/lock 程序相关2、Linux 文件类型和扩展名普通文件...

2019-10-05 14:02:03 75

原创 Linux命令:2. 文件查找命令

which、whereis、locate、find、find之exec、 find之xargs 、find命令参数详解1、which 查看可执行文件的位置。which 指令会在PATH变量指定的路径中,搜索某个系统命令的位置,并且返回第一个搜索结果。-V 显示版本信息which python 查看python路径2、whereis 查看文件的位置。whereis命令只搜索程序名(查数...

2019-10-05 13:31:12 110

翻译 《哈姆雷特》节选

    第一幕 第3场 波洛涅斯给他儿子雷欧提斯的临别箴言。    还在这儿,雷欧提斯!上船去,上船去,真好意思!风息在帆顶上,人家都在等着你哩。好,我为你祝福!还有几句教训,希望你铭刻在记忆之中:不要想到什么就说什么,凡事必须三思而行。 对人要和气,可是不要过分狎呢。 相知有素的朋友,应该用钢圈箍在你的灵魂上,可是不要对每一个泛泛的新知滥施你的交情。 留心避免和人家争吵;可是万一争端已起...

2019-10-05 11:45:29 723

翻译 《白鹿原》节选

    第一次读这本书,是大一上的一个假期吧,一口气看完。 那时候读完,觉得这本书怎么写成这样,大半的少儿不宜。。。 现在回头翻看,“家族兴衰” 清晰可见。...

2019-10-04 20:04:38 861

原创 linux命令:1. 文件目录操作

参考资料:linux命令大全在shell终端下,执行「command --help」即可查看命令使用说明。ls、cd、pwd、mkdir、rm、mv、cp、touch、cat、nl、more、less、head、tail。...

2019-09-30 10:01:34 228

翻译 金字塔原理

文档总是很乱很乱。。。

2019-09-25 10:09:34 509

翻译 高效人士的7个习惯

哭了一晚、失眠一夜,不要毁一天。。。

2019-09-25 08:45:11 155

原创 《学会提问》

“会哭的孩子有奶吃”,管它对不对,请你先开口讲话!!!

2019-09-25 08:02:56 137

翻译 《中秋月》

《中秋月》【宋】苏轼暮云收尽溢清寒,银汉无声转玉盘。此生此夜不长好,明月明年何处看。

2019-09-13 19:21:15 108

翻译 《在山的那边》

《在山的那边》---- 王家新一小时候,我常伏在窗口痴想——山那边是什么呢?妈妈给我说过:海哦,山那边是海吗?于是,怀着一种隐秘的想望有一天我终于爬上了那个山顶可是,我却几乎是哭着回来了——在山的那边,依然是山山那边的山啊,铁青着脸给我的幻想打了一个零分!妈妈,那个海呢?可能是要放假了吧,中秋节、国庆节,也就浮了起来,或许今年就一直在飘着。。。昨天周日,搜了一天的攻略,...

2019-09-04 08:43:09 227

翻译 《未选择的路》

没有勇气选择人烟稀少的那条。。。是不是,没有选择的都是最好的?《未选择的路》—— 弗罗斯特黄色的树林里分出两条路,可惜我不能同时去涉足,我在那路口久久伫立,我向着一条路极目望去,直到它消失在丛林深处。但我却选了另外一条路,它荒草萋萋,十分幽寂,显得更诱人、更美丽,虽然在这两条小路上,都很少留下旅人的足迹,虽然那天清晨落叶满地,两条路都未经脚印污染。呵,留下一条路等改日再...

2019-08-31 14:06:00 1090

原创 序列标注:1、LSTM-CRF

典型的NER模型。。。

2019-08-23 17:44:51 144

原创 预训练:1、词向量是什么--word2vec静态词向量

词向量的前世今生。。。

2019-08-23 17:43:34 1334

原创 小样本学习:1、基于model的

基于模型的方法

2019-08-23 17:38:54 557

原创 文本分类(一):fasttext

文本分类

2019-08-23 17:36:19 331

翻译 《热风》鲁迅

《热风》-------鲁迅愿中国青年都摆脱冷气,只是向上走,不必听自暴自弃者流的话。能做事的做事,能发声的发声。有一分热,发一分光,就令萤火一般,也可以在黑暗里发一点光,不必等候炬火。此后如竟没有炬火:我便是唯一的光。欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一...

2019-08-17 11:01:09 4614

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除