自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(181)
  • 资源 (12)
  • 收藏
  • 关注

原创 NLP 基础&应用研究方向简介

Tracking Progress in Natural Language Processinghttps://github.com/sebastianruder/NLP-progress

2019-07-05 17:25:16 4094 2

原创 linux下tmux使用简单入门

nohup挂后台可能会遇到各种问题,这时候就可以使用tmux。

2024-03-08 12:53:56 94 1

原创 【论文阅读随笔】RoPE/旋转编码:ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING

(这篇讲的很清楚了)

2024-03-07 21:48:59 810 1

原创 [FT]chatglm2微调

参见:https://github.com/THUDM/ChatGLM2-6B/blob/main/ptuning/ds_train_finetune.sh。参见:https://github.com/THUDM/ChatGLM2-6B/blob/main/ptuning/train.sh。参见:https://github.com/THUDM/ChatGLM2-6B/tree/main/ptuning。

2024-02-27 19:12:32 546

原创 [LLM][FT]大模型Fine-Tuning相关技术0

LLM,微调,大模型,加速,分布式训练

2024-02-27 18:05:01 341

原创 安装pandas遇到No module named ‘_bz2’ 的解决方案

安装pandas遇到No module named ‘_bz2’ 的解决方案

2023-04-11 15:17:25 2195 1

原创 ChatGPT翻译能力知多少?首篇评测论文由腾讯AI实验室提出?

ChatGPT翻译能力知多少?全球首篇评测论文已出

2023-02-10 15:08:32 1542

原创 chatGPT背后的技术之instructGPT简介

chatGPT背后的技术之instructGPT简介

2023-02-06 10:10:46 1169

原创 【Wu的课堂】《运筹学》单纯形法中文讲解笔记

《运筹学》单纯形法中文讲解笔记

2023-02-06 10:06:51 1259

原创 英语单词需大写的各种情况

NLP-英语语法

2023-01-04 11:28:11 139

翻译 [论文阅读]架构风格与基于网络的软件架构 第二章

[论文阅读]架构风格与基于网络的软件架构 第二章

2022-10-22 23:36:38 257

原创 conda虚拟环境迁移

conda虚拟环境迁移

2022-09-22 15:10:56 1586

原创 pyinstaller打包python/fastapi项目为exe

pyinstaller打包python、fastapi项目

2022-09-21 10:01:44 1899

原创 pytorch/torch安装简明教程

pytorch/torch安装简明教程

2022-09-09 17:37:13 2676

原创 python:字符串的base64转码与解码

字符串与base64互转,pandas json串与base64互转

2022-08-25 16:52:30 1276 1

原创 python logging封装一个简单的日志工具

logging封装日志文件

2022-08-10 11:49:16 358 2

原创 [论文分享/阅读]Normalization/正则化分享总结

Normalization/正则化综述与底层原理

2022-07-28 18:36:48 246 3

原创 [技术调研]数据不平衡解决方法调研

数据不平衡解决方法调研

2022-07-28 18:30:18 158

原创 [论文阅读]NeurIPS 2021论文预讲会总结

NeurIPS 2021论文预讲会总结

2022-07-28 18:26:11 264

原创 【技术调研】英语/中文的拼写/语法纠错调研

英语拼写纠错/语法纠错调研

2022-07-28 18:20:35 251

原创 使用编辑距离实现英语单词纠错-面向对象实现

使用编辑距离实现英语单词纠错,面向对象实现

2022-07-28 18:14:21 198

原创 使用编辑距离实现英语单词纠错-面向过程实现

面向过程,使用编辑距离完成单词纠错

2022-07-28 18:10:13 259

原创 linux下如何安装python以及一些注意事项

linux下如何安装python,以及一些注意事项

2022-07-22 17:33:02 1098

原创 linux下安装python虚拟环境的两种方法

linux下如何安装python:virtualenv和conda两者的优缺点

2022-07-22 17:10:17 2352

原创 ACL2022国内部分论文分享内容总结1

ACL 国内部分论文 主要内容总结

2022-06-30 09:43:08 823 2

原创 模型的可解析性&特征重要性调研

概念https://zhuanlan.zhihu.com/p/51506824概要https://christophm.github.io/interpretable-ml-book/index.htmlhttps://zhuanlan.zhihu.com/p/141013178决策树之类/NNimportancehttps://shimo.im/docs/25q5Mm4PK6iaExqD/ 《重要性分析调研》通用模型可解释性LIMEhttps://zhuanlan.zhihu.com/p/3

2022-06-03 16:43:05 128 2

原创 信息论相关知识-熵

1.交叉熵参见:https://zhuanlan.zhihu.com/p/56638625进一步说明:2.相对熵(也称之为:KL散度)3.互信息互信息越大,说明X越依赖于Y,Y透露出的信息越大ref:各种熵的介绍

2022-05-30 09:40:25 145

原创 多分类loss、softmax loss与交叉熵的关系

0、引子:多分类loss采用的是softmax loss,也可称之为softmax交叉熵loss,这个loss中的q就使用的是模型的softmax输出,它就是用来拟合真正的§编码长度的期望交叉熵越低,这个策略就越好,最低的交叉熵也就是使用了真实分布所计算出来的信息熵,因为此时 ,交叉熵 = 信息熵。这也是为什么在机器学习中的分类算法中,我们总是最小化交叉熵,因为交叉熵越低,就证明由算法所产生的策略最接近最优策略,也间接证明我们算法所算出的非真实分布越接近真实分布。参见:https://www.cnbl

2022-05-30 09:37:40 1528

原创 AutoML之自动超参调优

一、自动超参调优(炼丹自动化)简介: 超参自动调优NNI(重点)NNI文档:https://nni.readthedocs.io/zh/stable/Tutorial/QuickStart.htmlNNI代码:https://github.com/microsoft/nni/blob/master/README_zh_CN.md视频教程:https://www.bilibili.com/video/BV1SA411x7TB二、AUTOML(炼丹全流程自动化)1.简介其AutoML从特征工程

2022-05-28 19:30:53 454

原创 【conda问题】安装依赖遇到问题

1.参考网上的方案:https://zhuanlan.zhihu.com/p/3085690272.可能是你的环境不支持其他镜像,打开.condarc文件,清空里面的内容:vim /root/.condarc

2022-04-25 14:40:58 487

原创 词向量存pkl格式

import osimport numpy as npdef load_cn_wiki_wordvec(s_word_vec_path): n_vocab_num = 0 n_word_dim = 0 m_word_vec ={} m_word_id = {} with open(s_word_vec_path, "r", encoding="utf-8") as fp: for i, s_line in enumerate(fp):

2022-04-25 10:12:08 506

原创 IDEA导入maven项目极简教程

假如有一个现成的maven项目,如何正确导入?1.导入项目:2.设置maven版本和本地maven库路径3.设置jdk版本注意:jdk版本一定要对,jdk不支持向下兼容,所以一定要选好jdk版本(我这里设置的是1.8_64位)4.设置字符编码格式其他问题:1.如何导入本地jar包?A:可以直接IDEA导入外部依赖,也可以存储在本地maven库...

2022-04-19 11:20:43 165

原创 java正则

1.compile + matcherimport java.util.regex.Matcher;import java.util.regex.Pattern;String source = new String("");Pattern CHINESE_PATTERN = Pattern.compile("[\\u4E00-\\u9FA5]");source = underline_pattern.matcher(source).replaceAll("");2.replaceAll

2022-04-11 09:42:01 231

原创 预训练模型汇总:下载地址&综述

常见类似bert,albert,roberta, bart等预训练模型下载地址汇总

2022-02-28 16:24:55 2308

原创 模型格式转换

albert模型TensorFlow转pytorch格式代码见github

2022-02-28 16:16:31 590

原创 idea构建spring boot时报错解决

错误如下:Error:Internal error: (java.lang.IllegalAccessError) class com.intellij.util.io.FileChannelUtil (in unnamed module @0x4b168fa9) cannot access class sun.nio.ch.FileChannelImpl (in module java.base) because module java.base does not export sun.nio.ch t

2022-02-15 11:32:56 3735

原创 datetime/time的常用用法

import datetimeimport time# 天数的加减mytime = datetime.date.today()mytime = mytime - datetime.timedelta(days=1)# str转datetimet_day = '2020-03-12'datetime.datetime.strptime(t_day, "%Y-%m-%d")# datetime获取天级别的日期mydate.date()# 获取当前时间time_local =

2022-01-18 15:18:00 229

原创 Ubuntu 18.04 安装 NVIDIA 显卡驱动

Ubuntu 18.04 安装 NVIDIA 显卡驱动https://zhuanlan.zhihu.com/p/59618999注意点:新系统的签名要重新注册要禁用nouveau(新安装方法)其他:https://zhuanlan.zhihu.com/p/63584709

2022-01-12 10:42:59 344

原创 requirements.txt文档生成利器之pipreqs

pipreqs 的好处是:相比直接用 freeze 命令,能直接隔离其它项目的包生成pipreqspip install pipreqs pipreqs . --encoding=utf8 -force老办法:pip install freeze pip freeze >requirements.txt

2022-01-11 11:28:24 285

原创 python异常处理/try except

REF:https://www.runoob.com/python/python-exceptions.html1.直接跳过try: xxexcept: pass2.抛出错误try: xxexcept: print( {"msg": "input format error,detail is {}".format(traceback.format_exc()), "code": -1, "data": {}} )

2021-09-08 12:03:10 90

jdk1.8版本64位

jdk1.8 64位

2022-04-06

语音识别-自动化所-课件

语音识别-自动化所-ppt

2019-08-01

htkbook.pdf

语音识别 htk工具包

2019-07-31

boost_1_53_0_beta1.tar.gz

boost_1_53_0_beta1.tar.gz

2019-07-30

cmake_3.5.1.orig.tar.gz

编译工具 cmake 3.5.1

2019-07-30

bert v2.0.pdf

预训练在⾃然语⾔处理的发展:从Word Embedding到BERT模型

2019-07-29

计算机语言.rar

自然语言处理 计算语言学课件

2019-07-29

自然语言理解.rar

统计自然语言处理 课件 清华大学出版社 中文信心处理丛书

2019-07-29

词向量-开山之作2_Distributed Representations of Sentences and Documents.pdf

Many machine learning algorithms require the input to be represented as a fixed-length feature vector. When it comes to texts, one of the most common fixed-length features is bag-of-words. Despite their popularity, bag-of-words features have two major weaknesses: they lose the ordering of the words and they also ignore semantics of the words. For example, “powerful,” “strong” and “Paris” are equally distant. In this paper, we propose Paragraph Vector, an unsupervised algorithm that learns fixed-length feature representations from variable-length pieces of texts, such as sentences, paragraphs, and documents. Our algorithm represents each document by a dense vector which is trained to predict words in the document. Its construction gives our algorithm the potential to overcome the weaknesses of bag-ofwords models. Empirical results show that Paragraph Vectors outperform bag-of-words models as well as other techniques for text representations. Finally, we achieve new state-of-the-art results on several text classification and sentiment analysis tasks

2019-07-29

词向量-开山之作1-Efficient estimation of word representations in vector space.pdf

词向量开山之作第一篇,讲述作者第一次提出词向量。在自然语言处理任务中,首先需要考虑词如何在计算机中表示。通常,有两种表示方式:one-hot representation和distribution representation。

2019-07-29

词向量-word2vec中的数学原理详解.pdf

词向量-word2vec中的数学原理详解

2019-07-29

DbVisualizer 客户端安装、连接oracle服务器端等各种设置

DbVisualizer 客户端安装、连接oracle服务器端等各种设置

2015-09-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除