自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

转载 模块

在前面我们脚本是用 Python 解释器来编程,如果你从 Python 解释器退出再进入,那么你定义的所有的方法和变量就都消失了。为此 Python 提供了一个办法,把这些定义存放在文件中,为一些脚本或者交互式的解释器实例使用,这个文件被称为模块(Module)。模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。这也是使用 Python 标准库的方法。...

2020-08-07 19:03:56 100

转载 类与对象

1. 对象 = 属性 + 方法对象是类的实例。换句话说,类主要定义对象的结构,然后我们以类为模板创建对象。类不但包含方法定义,而且还包含所有实例共享的数据。封装:信息隐蔽技术我们可以使用关键字 class 定义 Python 类,关键字后面紧跟类的名称、分号和类的实现。2. self 是什么?Python 的 self 相当于 C++ 的 this 指针。3. Python 的魔法方法据说,Python 的对象天生拥有一些神奇的方法,它们是面向对象的 Python 的一切…它们是可以给你的类

2020-08-05 19:59:12 93

转载 Task6 基于深度学习的文本分类3-BERT

微调将最后一层的第一个token即[CLS]的隐藏向量作为句子的表示,然后输入到softmax层进行分类。预训练BERT以及相关代码下载地址:链接: https://pan.baidu.com/s/1zd6wN7elGgp1NyuzYKpvGQ 提取码: tmp5

2020-08-04 23:33:04 98

原创 函数

1. 函数还记得 Python 里面“万物皆对象”么?Python 把函数也当成对象,可以从另一个函数中返回出来而去构建高阶函数,比如:·参数是函数·返回值是函数函数的定义1.函数以def关键词开头,后接函数名和圆括号()。2.函数执行的代码以冒号起始,并且缩进。3.return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。函数参数Python 的函数具有非常灵活多样的参数形态,既可以实现简单的调用,又可以传入非常复杂的参数。从简到繁

2020-08-02 23:15:19 102

转载 字典

1. 可变类型与不可变类型·序列是以连续的整数为索引,与此不同的是,字典以"关键字"为索引,关键字可以是任意不可变类型,通常用字符串或数值。·字典是 Python 唯一的一个 映射类型,字符串、元组、列表属于序列类型。那么如何快速判断一个数据类型 X 是不是可变类型的呢?两种方法:·麻烦方法:用 id(X) 函数,对 X 进行某种操作,比较操作前后的 id,如果不一样,则 X 不可变,如果一样,则 X 可变。·便捷方法:用 hash(X),只要不报错,证明 X 可被哈希,即不可变,反过来不可被哈希

2020-07-31 21:07:31 76

转载 基于深度学习的文本分类2

word2vec模型背后的基本思想是对出现在上下文环境里的词进行预测。对于每一条输入文本,我们选取一个上下文窗口和一个中心词,并基于这个中心词去预测窗口里其他词出现的概率。因此,word2vec模型可以方便地从新增语料中学习到新增词的向量表达,是一种高效的在线学习算法(online learning)先来看一下官网的介绍:Using large amounts of unannotated plain text, word2vec learns relationships between words au

2020-07-31 21:02:55 123

原创 列表、元组和字符串

元组「元组」定义语法为:(元素1, 元素2, …, 元素n)·小括号把所有元素绑在一起·逗号将每个元素一一分开1. 创建和访问一个元组·Python 的元组与列表类似,不同之处在于tuple被创建后就不能对其进行修改,类似字符串。·元组使用小括号,列表使用方括号。·元组与列表类似,也用整数来对它进行索引 (indexing) 和切片 (slicing)。创建元组可以用小括号 (),也可以什么都不用,为了可读性,建议还是用 ()。元组中只包含一个元素时,需要在元素后面添加逗号,否则括号会被当

2020-07-28 21:09:00 136

原创 Task4 基于深度学习的文本分类1-fastText

FastTextFastText是一种典型的深度学习词向量的表示方法,它非常简单通过Embedding层将单词映射到稠密空间,然后将句子中所有的单词在Embedding空间中进行平均,进而完成分类操作。所以FastText是一个三层的神经网络,输入层、隐含层和输出层。下图是使用keras实现的FastText网络结构:FastText在文本分类任务上,是优于TF-IDF的:FastText用单词的Embedding叠加获得的文档向量,将相似的句子分为一类FastText学习到的Embeddin

2020-07-27 23:05:34 86

转载 零基础入门NLP赛事 - Task3 基于机器学习的文本分类

学习目标:1.学会TF-IDF的原理和使用2.使用sklearn的机器学习模型完成文本分类文本表示方法 Part1在机器学习算法的训练过程中,假设给定NN个样本,每个样本有MM个特征,这样组成了N×MN×M的样本矩阵,然后完成算法的训练和预测。同样的在计算机视觉中可以将图片的像素看作特征,每张图片看作hight×width×3的特征图,一个三维的矩阵来进入计算机进行计算。但是在自然语言领域,上述方法却不可行:文本是不定长度的。文本表示成计算机能够运算的数字或向量的方法一般称为词嵌入(Word Em

2020-07-24 22:40:37 105

原创 Python学习打卡-day2-条件语句

条件语句1. if 语句if 语句的 expr_true_suite 代码块只有当条件表达式 expression 结果为真时才执行,否则将继续执行紧跟在该代码块后面的语句。单个 if 语句中的 expression 条件表达式可以通过布尔操作符 and,or和not 实现多重条件判断。2.if-else条件语句Python 提供与 if 搭配使用的 else,如果 if 语句的条件表达式结果布尔值为假,那么程序将执行 else 语句后的代码。if语句支持嵌套,即在一个if语句中嵌入另一个if

2020-07-23 16:43:16 118

原创 python变量、运算符与数据类型

1.怎样对python中的代码进行注释? (1)# 表示注释,作用于整行。(2)’’’ ‘’’ 或者 “”" “”" 表示区间注释,在三引号之间的所有内容被注释例: “”"注释多行啦啦啦啦啦lalalal“”"2.python有哪些运算符,这些运算符的优先级是怎样的?(1)算术运算符、比较运算符、逻辑运算符、位运算符、三元运算符、其他运算符等(2)优先级:一元运算符优于二元运算符。先算术运算,后移位运算,最后位运算。例如 1 << 3 + 2 & 7等价于 (1

2020-07-22 21:00:55 70

转载 **零基础入门NLP赛事赛题理解--新闻文本分类**

1.赛题名称:零基础入门NLP之新闻文本分类2.赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。3.赛题数据赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。赛题数据由以下几个部分构成:训练集20w条样本,测试集A包括5w条样本,测试集B包括5w条样本。为了预防选手人工标注

2020-07-21 23:03:22 138

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除