3 陈宸-研究僧

尚未进行身份认证

暂无相关描述

等级
TA的排名 5w+

NLP自然语言处理:从词性标注中理解 条件随机场(CRF)

目录1.CRF的特征函数2.从特征到概率3.CRF和隐马科夫模型HMM4.关键总结如果说,你有一天生活中的一连串快照,你想在这些照片上面打上活动内容的标签(吃睡、睡觉、开车等)。你会怎么做?一种方式是忽略这些快照的本质,建立一个图片分类器。举个例子,事先给定一个月的打标快照,你可能会了学到在早上6点拍的较暗的照片很可能是在睡觉,有很多明亮颜色的照片,很可能是...

2019-08-20 17:04:07

NLP自然语言处理:神经网络语言模型(NLM)

目录一、传统语言模型1.1稀疏性1.2泛化能力差二、神经网络语言模型2.1前馈神经网络模型(FFLM)2.2循环神经网络模型(RNNLM)2.2.1循环神经网络模型示例2.2.2RNN语言模型训练过程2.2.3RNN语言模型反向传播2.2.4语言模型评估语言模型的构建目的是为了对语言中的各要素的分布进行估计,具有较长的研究历史和广泛...

2019-08-17 14:54:52

LeetCode:栈、队列、堆 问题解决方案集合(教程+Python代码)

目录预备知识:例1:LeetCode225.用队列实现栈(easy)例2:LeetCode232.用栈实现队列(easy)例3:LeetCode155.最小栈(easy)例4:LeetCode215.数组中的第K个最大元素(easy)例5:LeetCode295.数据流的中位数(hard)预备知识:栈Stack:(先进先出)队列Queue:...

2019-08-15 11:42:12

python中heapq堆的讲解

目录堆结题的基本技巧:heapq堆的常用方法:heapq.heappush(heap,item)heapq.heapify(list)heapq.heappop(heap)heapq.heapreplace(heap.item)heapq.heappushpop(list,item)heapq.merge(…)heapq.nlargest(n,heap...

2019-08-13 15:08:40

NLP自然语言处理:(viterbi算法、隐马科夫链、动态规划、naisy channel 模型)实现英文分词

目录一、viterbi算法二、英文分词基础知识2.1场景2.2公式推导(naisychannelmodel)2.3动态规划三、代码3.1数据处理3.2平滑处理3.3计算模型参数3.4viterbi算法viterbi算法是学习自然语言处理的基础算法,已经会有很多博客写了关于viterbi算法的数学介绍。但是对于在nlp中实践应用的博...

2019-08-03 16:29:24

LeetCode:链表问题解决方案集合(教程+Python代码)

目录例1:LeetCode206.链表逆序(easy)例2:LeetCode92.链表中间段逆序(medium)例3:LeetCode21.两个排序链表的合并(easy)例4:LeetCode160.求两个链表的交点(easy)例5:LeetCode142.链表求环(medium)例6:LeetCode86.链表划分(medium)例7:LeetCode138.复杂...

2019-07-29 14:26:50

LeetCode:滑动窗口问题解决方案集合(教程+Python代码)

目录LeetCode-3.无重复字符的最长子串LeetCode-76.最小覆盖子串LeetCode-30.串联所有单词的子串LeetCode-209.长度最小的子数组什么是滑动窗口?其实就是一个队列,比如题中的abcabcbb找出其中不含有重复字符的最长子串的长度,进入这个队列(窗口)为abc满足题目要求,当再进入a,队列变成了abca,这时候不满足要...

2019-07-24 09:58:28

准确分词:加载自定义字典分词(pyhanlp分词示例)

目录一、pyhanlp1.1基本介绍1.2pyhanlp加入字典二、分词对比tokenizer.py:hanlp函数cut_data.py主文件全部代码、数据集:https://github.com/455125158/NLP_basis一、pyhanlp1.1基本介绍pyhanlp介绍:https://github.com/ha...

2019-06-20 15:10:29

个性化推荐算法系统(2):基于二分图的个性化推荐召回算法personal rank(MovieLens数据集电影推荐)

目录一、二分图二、personalrank算法来感性的认识下personalrank:文字版来理性的认识下personalrank:公式版来理性的认识下personalrank:矩阵公式版三、代码实现personalrank3.1数据源:3.2read.py文件get_item_infoget_graph_from_data3.3矩阵p...

2019-06-19 11:15:34

个性化推荐算法系统(1):基于邻域的个性化召回算法LFM(MovieLens数据集电影推荐)

目录一、LFM理论二、LFM实战2.1数据处理:read.py1、得到电影信息2、得到每部电影平均得分3、准备LFM数据2.2LFM主体函数编写:LFM.py1、初始化向量2、计算模型预测出用户向量和电影向量之前的距离,欧氏距离3、得到lfm模型的用户向量和电影向量4、使用lfm得到的推荐结果,和得分5、启动函数6、分析推荐结果的好坏(只是打...

2019-06-04 20:18:00

Kaggle竞赛:San Francisco Crime Classification(旧金山犯罪分类) 参赛心得

目录一、项目概述二、数据预处理2.1特征项2.3非数值特征数值化(1)对category列进行编号(2)对DayOfWeek列进行编号(3)对PdDistinct列进行编号三、特征分析3.1按‘year’和‘month’类型统计3.2按‘DayOfWeek’和‘hour’类型统计3.3Address列3.4经度X和纬度Y四、特...

2019-05-30 21:16:40

数据处理与特征工程:One-Hot Encoder独热编码、Label Encoder标签编码、Binary Encoder二进制编码

目录一OneHotEncoder独热编码1.1OneHotEncoder独热编码原理2.1.为什么要独热编码OneHotEncoder?2.3独热编码优缺点2.4什么情况下(不)用独热编码?2.5什么情况下(不)需要归一化?二LabelEncoder标签编码三、BinaryEncoder二进制编码首先了解机器学习中...

2019-05-27 09:06:47

NLP自然语言处理:jieba中文处理入门与进阶(官方文档解读)

jieba就是非常好用的中文工具,是以分词起家的,但是功能比分词要强大很多。官方介绍:https://github.com/455125158/jiebaimportjiebaimportjieba.posseg#词性标注importjieba.analyse#关键词提取目录1.基本分词函数与用法1.1添加用户自定义词典2关键词提取2.1基...

2019-05-24 19:35:08

详解LSTM (Long Short - Term Memory)网络

在LSTM的文章中最出名文章之一就是ChristopherOlah的博文感觉这篇博客图画的非常棒,公式也写的很清楚,但是缺失一些感性理解。自己在看了七月在线寒小阳和练数成金对于LSTM的讲解,对于LSTM有了更深的理解,写一篇博客总结下。目录RNN引出LSTM的感性认知LSTM原理(理性认知)第一步:忘记门第二步:输入门第三步:更新第四步:输出...

2019-05-22 21:05:39

基于TensorFlow深度学习理论与实战:Tensorflow中优化器Optimizer

目录GradientDescentOptimizerMomentumOptimizerNesterovacceleratedgradientAdagradOptimizerRMSPropOptimizerAdamOptimizer博主看了一些Optimizer总结的文章,感觉有些博客全部是公式,不好理解。Optimizer:由随机梯...

2019-05-10 19:32:31

面试经验:腾讯微信事业群 - 微信总部机器学习岗面试

博主是3、4月份在腾讯上投的简历,因为博主在广州读研,想在广州工作,就选择的微信事业群了。然后我忘记笔试了。。。。。(都不发邮件提醒我!!!!)结果我过几天去看官网上看啥情况,结果笔试时间已经错过了,我当时就口吐芬芳!!!之后就没啥动静,到了5月的一个晚上,我接到了腾讯的电话,是微信总部的座机打来的(幸好手机识别了是微信总部的电话,不然我以为是骗子。。。。。)电话里,他就介绍了他自...

2019-05-08 20:11:21

范数正则化L0、L1、L2-岭回归&Lasso回归

目录一、L0/L1范数1、分别定义2、两者关系:3、参数稀疏的好处1)特征选择(FeatureSelection):2)可解释性(Interpretability):四、L1(Lasso)、L2(岭回归)范数五、Lasso算法和岭回归算法区别1、梯度下降速度2、模型空间的限制延伸一:L1&L2正则化一起结合的ElasticNets效果真的很好...

2019-05-07 13:41:37

量化金融分析AQF(13):64位、32位win7、8、10 安装TA-Lib(附已经编译好的安装包)

对于TA-Lib安装,困扰了我一下午。对于大家在网上找到的后缀是.zip的安装包,是还需要MicrosoftVisualC++编译的,你要是没有vc的话还要安装,又是版本问题,很麻烦。所以建议大家下载编译后的安装包。然后呢:给出加州大学的Python库下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/搜索TA-Lib...

2019-04-17 09:51:14

基于TensorFlow深度学习理论与实战(1): TensorFlow(Tensor、Session、执行图、Operation、Variable、初始化、Placeholder占位符、graph)

目录Tensor?Flow?Session(会话)执行图OperationsVariable初始化Variable赋值Placeholder占位符给placeholder赋值:feedgraphgraph可视化:tensorboardTensor?Flow?importtensorflowastftensor是张量的意思,顾...

2019-04-15 20:26:40

量化金融分析AQF(12):配对交易 Pair trading - 考虑时间序列平稳性、协整关系

目录1.数据准备&回测准备2.策略开发思路3.产生交易信号3.计算策略年化收益并可视化4.总结上节说到,做2只股票配对交易,先判断2只股票的平稳性,不平稳就做一阶差分和协整关系这篇博客就要来说协整关系协整关系简单的说就是2只股票的线性组合,并且这个组合是平稳的。先感性的认识:A股票的价格序列为X,B股票的价格序列为Y.用X、Y做线性...

2019-04-15 14:58:42

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。