自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 【NLP】新闻文本分类-----Bert文本分类

【NLP】新闻文本分类-----Bert文本分类Bert算法介绍基于Bert的文本分类Bert PretrainBert FinetuneBert算法介绍Google在NAACL 2018发表的论文中提出了BERT,与GPT相同,BERT也采用了预训练-微调这一两阶段模式。但在模型结构方面,BERT采用了ELMO的范式,即使用双向语言模型代替GPT中的单向语言模型,但是BERT的作者认为ELMo使用两个单向语言模型拼接的方式太粗暴,因此在第一阶段的预训练过程中,BERT提出掩码语言模型,即类似完形填空的

2020-08-04 21:31:29 1661

原创 【NLP】新闻文本分类---深度学习方法

【NLP】新闻文本分类---深度学习方法文本表示方法词向量Skip-grams原理和网络结构Skip-grams过程Skip-grams训练Word pairs and "phases"对高频词抽样基于TextCNN、TextRNN的文本表示TextCNN模型搭建前向传播TextRNN模型搭建前向传播使用HAN用于文本分类文本表示方法词向量本节通过word2vec学习词向量。word2vec模型背后的基本思想是对出现在上下文环境里的词进行预测。对于每一条输入文本,我们选取一个上下文窗口和一个中心词,并

2020-07-31 21:13:23 1061

原创 【NLP】新闻文本分类---FastText

【NLP】新闻文本分类---FastTextFastText 文本分类算法介绍代码实现通过k折交叉检验进行调参FastText 文本分类算法介绍FastText是一种典型的深度学习词向量的表示方法,它非常简单通过Embedding层将单词映射到稠密空间,然后将句子中所有的单词在Embedding空间中进行平均,进而完成分类操作。所以FastText是一个三层的神经网络,输入层、隐含层和输出层。xi 表示的是文本中第 i 个词的特征向量,该模型的负对数似然函数如下。下面式子中的矩阵 A 是词查找表,整

2020-07-27 22:09:03 402

原创 【NLP】新闻文本分类----基于机器学习的文本分类

【NLP】新闻文本分类----基于机器学习的文本分类机器学习模型文本表示方法one-hotBag of WordsN-gramTF-IDF基于机器学习的文本分类词袋法 + 岭回归分类器`TF-IDF + 岭回归分类器不同参数下的TF-IDF算法TF-IDF参数解读改变不同参数的F1结果改变ngram_range的参数TF-IDF算法与其他分类器模型机器学习模型机器学习是对能通过经验自动改进的计算机算法的研究。机器学习通过历史数据训练出模型对应于人类对经验进行归纳的过程,机器学习利用模型对新数据进行预测对

2020-07-25 23:54:02 1462

原创 【NLP】新闻文本分类 ----数据读取及分析

【NLP】新闻文本分类文本分析句子分布分析断句情况分析在上一节中,进行读取完成数据集后,还可以对数据集进行数据分析的操作。虽然对于非结构数据并不需要做很多的数据分析,但通过数据分析还是可以找出一些规律。此步骤我们读取了所有的训练集数据,在此我们通过数据分析希望得出以下结论:赛题数据中,新闻文本的长度是多少?赛题数据的类别分布是怎么样的,哪些类别比较多?赛题数据中,字符分布是怎么样的?文本分析句子分布分析观察可以发现,每行句子的字符使用空格进行隔开,统计句子长度及其长度的统计分布情况:断句情

2020-07-22 23:48:45 884

原创 【NLP】新闻文本分类

【NLP】新闻文本分类赛题理解和思路分析数据读取思路一:特征提取 + 分类器TF-IDF算法介绍TF-IDF实践步骤赛题理解和思路分析数据读取赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。赛题数据由以下几个部分构成:训练集20w条样本,测试集A包括5w条样本,测试集B包括5w条样本。为了预防选手人工标注测试集的情

2020-07-21 23:14:21 3313

原创 SQL 50题

SQL五十题表格信息SQL 01SQL 02SQL 03SQL 05SQL 06SQL 07SQL 08SQL 09SQL 10SQL 11SQL 12SQL 13SQL 14SQL 15SQL 16SQL 17SQL 18SQL 19SQL 20表格信息–1.学生表Student(s_id,s_name,s_birth,s_sex) --学生编号,学生姓名, 出生年月,学生性别–2.课程表Course(c_id,c_name,t_id)

2020-06-20 18:57:13 145

原创 食物语游戏测评

食物语游戏测评一.游戏团队及产品进展二.系统玩法评测三.产品优劣势分析四.竞品比较基本信息分析用户画像功能评价一.游戏团队及产品进展《食物语》是由腾讯于2019年发行的RPG手游,游戏核心世界观为讲述食神仇雠酝酿着巨大的阴谋的故事,玩家可以扮演空桑少主的身份,去守护众食魂,从而传承中华美食精神。与传统女性向游戏不同的是,《食物语》将回合制卡牌、收集养成、模拟经营等多个元素融合,受众较广。二.系统玩法评测从游戏核心玩法、玩家体验两个角度对食物语进行评测,得到的思维导图如下:三.产品优劣势分析

2020-05-25 16:56:59 2682

食物语游戏评测.docx

食物语手游玩家体验,针对市场分析、竞品分析、核心玩法体验、玩家体验等角度展开测评,给出了目前游戏中存在的不足和建议

2020-05-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除