自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Task6 基于深度学习的文本分类3-BERT

Task6 基于深度学习的文本分类3-BERTBERT 183-NEOWISE(nlp)-tang BERT import logging import random import numpy as np import torch logging.basicConfig(level=logging.INFO, format='%(asctime)-15s %(levelname)s: %(message)s') # set seed seed = 666 random.seed(seed) np.ra

2020-08-05 06:47:24 114

原创 Task05:基于深度学习的文本分类2(4天)

Task05:基于深度学习的文本分类2(4天)使用gensim训练word2vec 183-NEOWISE(nlp)-tang 使用gensim训练word2vec import logging import random import numpy as np import torch logging.basicConfig(level=logging.INFO, format='%(asctime)-15s %(levelname)s: %(message)s') # set seed seed =

2020-08-01 22:46:23 194

原创 Task04:基于深度学习的文本分类1(2天)

Task04:基于深度学习的文本分类1(2天) 183-NEOWISE(nlp)-tang 与传统机器学习不同,深度学习既提供特征提取功能,也可以完成分类的功能。从本章开始我们将学习如何使用深度学习来完成文本表示。 学习目标 学习FastText的使用和基础原理 学会使用验证集进行调参 ...

2020-07-28 12:09:51 71

原创 Task03 基于机器学习的文本分类

Task03 基于机器学习的文本分类学习目标机器学习模型 传统机器学习 学习目标 学会TF-IDF的原理和使用 使用sklearn的机器学习模型完成文本分类 机器学习模型 机器学习是对能通过经验自动改进的计算机算法的研究. 机器学习通过历史数据训练出模型对应于人类对经验进行归纳的过程,机器学习利用模型对新数据进行预测对应于人类利用总结的规律对新问题进行预测的过程. ...

2020-07-25 21:58:18 663

原创 Task02:数据读取与数据分析(1天)

Task02:数据读取与数据分析(1天) 183-NEOWISE(nlp)-tang 总体来说就是对文本向量进行一些统计指标并加以分析,关键是未能理解文本到向量的转换 import pandas as pd import matplotlib.pyplot as plt train_df = pd.read_csv('./train_set.csv', sep='\t', nrows=100) train_df.head() train_df['text_len'] = train_df['text'].

2020-07-22 22:14:57 87

原创 Task01:赛题理解(3天)

Task01:赛题理解(3天)学习任务介绍NLP研究的对象如何表示单词的含义Word2Vec方法的基本原理 183-NEOWISE(nlp)-tang 学习任务 赛题理解(臣妾做不到啊),还是先学习自然语言处理吧. 介绍NLP研究的对象 引用https://blog.csdn.net/u010451780/article/details/107225555 " 自然语言处理 语言能力 语言应用 在人与人交际中以及人与计算机交际中的语言问题 交叉学科 语言模型 隐马尔可夫模型 统计自然语言处理 基于统计的自然

2020-07-21 22:01:18 303

原创 Task4:方差分析(3天)

Task3:常见分布与假设检验(3天)学习任务知识点代码实现 91-听说大家很喜欢篮球队-tang 学习任务 理论部分 单因素组间方差分析与双因素方差分析; 方差的相关检验,主效应和交互效应; 练习部分 做理论知识点的笔记; python实现方差分析; 知识点 方差分析:Analysis of variance, ANOVA主要研究分类变量作为自变量时,对因变量的影响是否是显著的 分类变量 自变量 因变量 田间实验 焦虑症治疗 认知行为疗法:CBT 眼动脱敏再加工法:EMDR 状态特质焦虑

2020-06-30 21:20:40 177

原创 Task3:常见分布与假设检验(3天)

Task3:常见分布与假设检验(3天)学习任务知识点代码实现 91-听说大家很喜欢篮球队-tang 学习任务 理论部分 离散型分布,连续型分布,python实现及可视化; 假设检验步骤及两类错误解读; 假设检验的python实战; 练习部分 做理论知识点的笔记; python实现常见分布,python实现假设检验; 知识点 代码实现 ...

2020-06-27 22:32:33 238

原创 Task2:数理统计与描述性分析(2天)

Task2:数理统计与描述性分析(2天)学习任务知识点 91-听说大家很喜欢篮球队-tang 学习任务 理论部分 统计量与抽样;常用统计量; 数据集中与离散趋势的度量; 分布特征,偏度与峰度; 练习部分 做理论知识点的笔记; python实现数据各维度的描述性分析; 知识点 总体:研究对象的全体 个体:组成总体的每个基本单元 样本:从总体 X 中随机抽取一部分个体 X1,X2,...,XnX_1,X_2,...,X_nX1​,X2​,...,Xn​ ,称 $X_1,X_2,…,X_n $为

2020-06-25 07:37:48 126

原创 Task1:随机事件与随机变量(1天)

Task1:随机事件与随机变量(1天) 91-听说大家很喜欢篮球队-tang 知识点 一.随机事件 1. 基本概念释义 随机现象:不能确定结果,但是能确定结果范围 随机试验:记为EEE, 可以在相同条件下重复进行; 结果有多种可能性,并且所有可能结果事先已知; 作一次试验究竟哪个结果出现,事先不能确定. 样本空间:记为Ω\OmegaΩ,随机试验的所有可能结果组成的集合 样本点:记为ω\omegaω,试验的每一个可能结果 随机事件:记为A,B,CA,B,CA,B,C,样本空间Ω\Ome

2020-06-23 00:01:16 188

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除