4 星空-点点

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 1w+

机器学习概述[Introduction of machine learning] 【ML hung-yi Lee】

1. define machine learningmachine learning ≈ 寻找一个函数 - step1 定义一个function 集合 -> 模型 - step2 评估function的好坏 -> 策略 - step3 选择最优的function -> 学习算法2. learning map![learning map](https://img-blog.csdnimg.cn/2020062915473970.png?x-oss-process=image/w

2020-06-29 19:59:34

Effective Approaches to Attention-based Neural Machine Translation_2015_Luong 【NMT】【Attention】

文章目录提出背景神经机器翻译NMT模型Global AttentionLocal attention论文链接:Effective Approaches to Attention-based Neural Machine TranslationBy Luong et al. 2015任务对齐(alignments between different modalities):对齐是指比如在翻译任务中,翻译每个词的时候,要找多需要重点关注的原句中的词,也就是将原文中的词和目标文中的词对应起来。对齐权

2020-07-10 15:17:37

Latex符号使用小结【持续更新…】【Latex】

文章目录字母上方加符号字母上方加符号加 ^ 号 \hat 或者 \widehat{}加 - 横线 \overline{}加 ~ 波浪线 \widetilde{}加单点号或者双点号 \dot{} 或者 \ddot{}

2020-07-09 10:50:53

python nktl语料库下载问题

在执行代码如下代码时报错:from nltk.corpus import stopwordsstops = set(stopwords.words("english"))报错提示需要先下载stopwordsimport nltknltk.download('stopwords')下载 corpora/stopwords.zip/stopwords参考链接:https://www.nltk.org/data.html于是执行两行命令,一直报错Urlopen error,后来直接执行nlt

2020-07-07 22:34:07

python spacy库使用总结【待完善】

spacy库的使用说明1.安装2.用法2.1 word tokenize(doc: token)2.2 英文断句(doc.sents: sent)2.3 词干化(doc: token, token_lemma_, token_lemma)2.4 词性标注(doc: token,token.pos_,token.pos)2.5 命名实体识别(doc.ents:ent, ent.label_, ent.label)2.6 名词短语提取(doc.noun_chunks)2.7 基于词向量计算两个单词的相似度 (d

2020-07-07 21:06:35

python spacy库安装问题

1.在 pip install -U spacy 安装 spacy 的时候出现SLL配置异常问题,如下图,查询说是服务器的问题,忽略异常,再次重新安装成功。2.下载英文模型数据的时候,出现没有spacy.en.download模块,原因是这个模块已经被弃用,...

2020-07-07 19:36:58

python字符串编码

python 字符串编码字符编码常见编码python 字符串encode()decode()len()字符编码字符串是一种数据类型,字符串比较特殊的一个问题是字符编码。常见编码ASCII编码:美国发明,最早只有127个字符被编码到计算机,只有英文、数字和一些符号;GB2312编码:中国发明,中文至少需要两个字节,这个编码把中文加了进去;这样的话日本把日文编码到Shift_JIS中,韩国把韩文编码到Eur-JIS中,在读取的时候就会产生乱码的现象,于是产生了Unicode编码。Unicode编码

2020-07-07 14:58:21

python 内置函数【持续记录中】

zip() 函数zip() 函数将可迭代的对象作为参数,将对象中的元素打包成一个个的元组,返回由这些元组构成的对象,这样做的好处是节约了不少的内存。可以用list()函数,将对象转换为列表,列表的元素是一个个元组。python 2 zip()函数直接返回的就是元组构成的列表,而python 3 返回的是zip对象,需要用list()函数转换为列表的格式。...

2020-07-07 10:29:15

统计学习方法课后习题【第十章】

HMM的代码实现 & exercise10_1,10_2,10_3运行结果目录HMMcodeexercise 10_1:后向算法HMMcodeimport numpy as npclass HMM: def __init__(self): self.alphas = None self.betas = None self.forward_p = None self.backend_p =...

2020-06-25 17:51:10

数学希腊字母符号

读都不会,还指望记住怎么用吗………特意记录一下,忘记就来看看1、 Α α alpha a:lf 阿尔法 角度;系数2 、Βbai β beta bet 贝塔du 磁通系数;角度;系数3、 Γ γ gamma ga:m 伽马 电导系数(小zhi写)dao4、 Δ δ delta delt 德尔塔 变动;密度;屈光度5、 Ε ε epsilon ep`silon 伊普西龙 对数之基数6、 Ζ ζ zeta zat 截塔 系数;方位角;阻抗;相对粘度;原子序数7、 Η η eta eit 艾塔 磁

2020-06-25 16:32:10

Sequence to Sequence Learning with Neural Networks_2014【machine translation】

论文:Sequence to Sequence Learning with Neural Networks作者:Ilya Sutskever,Oriol Vinyals,Quoc V. Le补习知识:RNN,LSTM,SGD,beam search

2020-06-18 22:33:07

K-Means聚类算法 【sklearn.cluster】

classsklearn.cluster.KMeans(n_clusters=8,*,init='kmeans++',n_init=10,max_iter=300,tol=0.0001, precompute_distances='deprecated',verbose=0,random_state=None,copy_x=True,n_jobs='deprecated',algorithm='auto')参数:1、 n_clusters: 聚类类别数量,也是初始聚类中心的...

2020-06-22 22:00:52

关于机器翻译,看这一篇就够了

机器翻译技术的发展一直与计算机技术、信息论、语言学等学科的发展紧密相随。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算机运算能力的提升和多语言信息资源的爆发式增长,机器翻译技术逐渐走出象牙塔,开始为普通用户提供实时便捷的翻译服务。本文将简单介绍机器翻译技术的发展,包含机器翻译的演进历史与基本思想、端到端的神经翻译网络内部细节、技术落地过程中的...

2020-04-17 12:02:43

Python操作数据库之insert、update

1、链接数据库import pymysqldb = pymysql.connect(host='localhost', user='root', password='123456', port=3306, db='spiders')cursor = db.cursor()sql = 'select * from students;'cursor.execute(sql)curso...

2020-01-18 15:27:17

jupyter notebook使用

1.启动命令行窗口输入:jupyter notebook2.打开新文档(1)界面介绍:notebook 界面的组成部分1)notebook 的名称2)主工具栏提供了保存、导出、重载 notebook,以及重启内核等选项3)快捷键4)notebook 编辑区最下面的哪个 In [ ]: 的框叫做单元格,你可以把你的代码分成一段段的单元格输入,然后可以逐个单元格地运...

2019-11-23 11:06:20

anaconda中安装tensorflow过程

1.安装anaconda本机已经安装python3.9,window64位,下载对应版本的anaconda,(自己python对应的版本网上很多,不安最新的python3.7对应版本,是防止它不稳定)清华镜像地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/,只有按照提示选择自己安装的路径,一路next就行,为防止用户权限...

2019-11-11 15:49:04

re正则表达式

2019-10-30 12:09:20

Word Embedding

讲解语言模型:专家语法规则模型(80年代):自然语言的语法规则。统计语言模型(00年代):计算一个句子出现的概率,概率越大,句子越合理。神经网络语言模型(至今):2003年Bengio提出词向量的概念,离散变量(高维)/连续变量(具有一定维度的实数向量,单词的分布式表示),可以看作使用神经网络编码的n-gram模型。https://www.cnblogs.com/dyl222/p/...

2019-10-12 16:58:46

Python网络爬虫与提取--网络爬虫之正则表达式[Re库]【嵩天】

正则表达式:一种通用的字符串表达框架编译:p = re.compile(regex),将符合正则表达式语法的字符串regex转换成正则表达式特征p3.1 正则表达式的语法(操作符)3.2 Re库importre3.2.1 正则表达式的表示类型re库采用rawstring类型(原生字符串类型)r'text'表示正则表达式,也可用字符串直接表示,但是含有转义字符时...

2019-09-13 22:07:11

Python网络爬虫与提取--网络爬虫之提取[BeautifulSoup库]【嵩天】

目录2.1BeautifulSoup库的元素BeautifulSoup库的理解BeautifulSoup库的引用BeautifulSoup库的解析器BeautifulSoup库的基本元素2.2 基于bs4库的HTML内容遍历方法标签树的下行遍历:标签树的上行遍历:标签树的平行遍历:bs4库的编码:2.3信息组织提取2.3.1 信息标记...

2019-09-08 18:01:20

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv3
    勤写标兵Lv3
    授予每个自然周发布7篇到8篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。