9 福利2020

尚未进行身份认证

我要认证

计算机硕士,多年工作经验,在创业公司和大公司都工作过。曾作为技术和产品负责人,最多带领10人规模的团队进行开发。多年推荐系统/NLP/大数据工作经验,主要涉及业务包括新闻资讯推荐系统、直播类推荐系统、机器学习平台、智能决策平台、语音语义理解系统等。负责公司多个AI项目产品落地,包括文本分类、关键词抽取、命名实体识别、对话系统中语义理解、FAQ智能问答、知识图谱等。

等级
TA的排名 6k+

机器学习:04 Kaggle 信用卡欺诈

通过利用信用卡的历史交易数据,进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件

2020-09-15 15:59:13

机器学习:03 Kaggle比赛 患者是否患糖尿病

初步了解机器学习中的模型融合,讲解模型融合的方法,最后通过Kaggle比赛: 患者是否患糖尿病案例演示如何使用

2020-09-14 14:36:33

机器学习:02 特征工程和决策树回归

文章目录特征工程关注点聊聊互联网公司机器学习工作数据与特征处理数值型类别型时间型文本型统计特征组合特征特征选择Kaggle自行车租赁预测比赛数据集介绍基本介绍数据字段数据读取与预分析数据可视化数据类型数据统计分析目标字段相关分析相关性分析可视化对比 Count 和 核心字段关系机器学习算法在机器学习工作中,特征工程占据很重要的位置。特征工程关注点数据与特征处理数据选择/清洗/采样数值类型/类别型/日期型/统计型/文本型特征处理组合特征处理特征选择Filter特征选择Wrapper

2020-09-10 20:49:29

机器学习: 01 决策树分类

文章目录工具库导入读取数据特征工程处理特征(属性)和目标特征处理/特征工程构建决策树分类器可视化一下这颗决策树可视化方法1可视化方法2可视化方法3-推荐决策树算法小结决策树优点决策树算法的缺点:参考资料工具库导入#用于数据处理和分析的工具包import pandas as pd#引入用于数据预处理/特征工程的工具包from sklearn import preprocessing#import决策树建模包from sklearn import tree# sklearn版本 信息,按照最新即

2020-09-09 16:20:04

Python数据可视化库pyecharts

针对数据分析团队需求,简单整理了一些相关内容分享同步大家学习,旨在帮助机器学习人员、数据分析人员了解业务数据,针对性解决工程中面临的问题。文章目录pyecharts 介绍和安装特性pyecharts 安装版本检查pyecharts 折线图绘制一个简单的折线图Line 增加标题与图例Line 增加提示项pyecharts Bar 柱状图设置多组柱状图折线图 + 柱状图 组合pyecharts Pie 饼图pyecharts 第一个Pie 饼图pyechart 圆弧状Piepyecharts scatter

2020-09-08 11:06:38

自然语言处理(NLP):08-05 TextCNN短文本分类案例分享

文章目录数据预处理基于所有数据构建词典文本离散化处理文本数据集切分自定义DatasetDataLoader批量加载构建词向量词向量可视化gensim工具加载词向量模型词向量应用词向量转换 可视化表示构建领域的词向量词向量验证模型训练模型结构训练方法定义import warningswarnings.filterwarnings('ignore')import jiebafrom data_processing import load_datafrom collections import Coun

2020-09-06 21:01:10

自然语言处理(NLP):08-04 使用Tensorboard在 PyTorch 中进行可视化

tensorboard是tensorflow内置的一个可视化工具,它通过将tensorflow程序输出的日志文件的信息可视化使得tensorflow程序的理解、调试和优化更加简单高效

2020-09-06 20:45:17

自然语言处理(NLP):08-03 词向量word2vec

预训练词向量 Word+Character 300d下载地址: https://github.com/Embedding/Chinese-Word-Vectorsgensim是一个方便的nlp工具词向量词向量获取获取某个词向量和句子的向量相似文本的比较word2vec 词向量导入词向量gensim导入词向量需要词向量文件的首行是:所有的单词数 词向量的维度import gensimPRE_WORD_VECTOR = '../data/news/sgns.sogou.char'm

2020-09-06 20:42:03

自然语言处理(NLP):08-02 CNN文本分类论文讲解及TextCNN原理

卷积神经网络的核心思想是捕捉局部特征,对于文本来说,局部特征就是由若干单词组成的滑动窗口,类似于N-gram。卷积神经网络的优势在于能够自动地对N-gram特征进行组合和筛选,获得不同抽象层次的语义信息

2020-09-06 20:36:54

自然语言处理(NLP):08-01 数据分析和文本分类效果对比

文章目录导入库数据加载数据预处理统计指标数据分布统计每种标签数据分布字符长度可视化统计文本分词长度分析文本 词云可视化文本分类深度学习模型介绍模型对比:性能和得分总结总结导入库import pandas as pdimport jieba数据加载ROOT_PATH = '../data/news/'LABEL_PATH = os.path.join(ROOT_PATH,'class.txt')DAT_PATH = os.path.join(ROOT_PATH,'data.txt')pri

2020-09-06 20:28:51

自然语言处理(NLP):24Bert+Faiss快速搭建智能客服系统

本文分享主题:Faiss和bert提供的模型实现了一个中文问答系统。旨在提供一个用Faiss结合各种AI模型实现语义相似度匹配的解决方案。

2020-08-05 20:13:52

自然语言处理(NLP):23 Word2Vec词向量研究以及实践

本文主要同大家分享word2vec原理以及应用,通过文本相似度和新闻文本分类为案例进行展开,最后对词向量技术发展进行简述。

2020-07-14 11:22:59

深度学习开源数据集整理

Images Analysis数据集介绍备注网址Flickr30k图片描述31,783 image...

2020-07-04 16:51:59

自然语言处理(NLP):22 BERT中文命名实体识别

本文主要通过不同的数据集来进行 NER 模型验证验证,以及指定一些通过训练 NER 任务的一套标准,通过两条路线进行分析和总结。(1)工业界场景-> 学术界 NER 论文-> BERT 实现 NER 方案以及源码分析(2)预料数据-> 业务数据可视化分析-> 标准数据格式转换-> 模型训练-> 在线预测-> 序列标准任务优化和拓展作者:走在前方博客:https://wenjie.blog.csdn.net/专注于文本分类、关键词抽取、文本摘要、FQA .

2020-06-16 15:25:36

自然语言处理(NLP):21 音乐领域NLP比赛-语义理解NER应用(小数据集BERT快速验证)

专注于文本分类、关键词抽取、文本摘要、FQA问答系统、对话系统语义理解NLU、知识图谱等。结合工业界具体案例和学术界最新研究成果实现NLP技术场景落地。本文主要分析NER 在小规模数据集下BERT上快速验证,关于完成的意图识别和槽位抽取将在后续博客中总结分享。 博客:https://wenjie.blog.csdn.net/作者:走在前方主要内容任务描述介绍领域意图识别判断槽位填充数据预处理预料中有多种标签,我们重点关注 singer,songer 标签进行实验数.

2020-06-16 14:58:01

自然语言处理(NLP):15 图解attention计算过程(02)

seq2seq框架和attention 在机器翻译中应用,我们图解Attention 计算过程,进一步了解Attention 是如何运行的

2020-06-16 14:05:07

自然语言处理(NLP):20 基于知识图谱的智能问答系统

基于知识图谱的问答系统答即根据一个问题,抽出一条三元组,生成类 sql 语句,知识图谱查询返回答案。本文是基于知识图谱的问答系统,通过 BERT+CRF 做命名实体识别和句子相似度比较,最后实现线上的部署。

2020-06-10 15:26:42

自然语言处理(NLP):19 金融领域NLP竞赛——文本语义相似度

智能客服的本质,就是充分理解用户的意图,在知识体系中精准地找到与之相匹配的内容,回答用户问题或提供解决方案。问题相似度计算,是贯穿智能客服离线、在线和运营等几乎所有环节最核心的技术,广泛应用于搜索、推荐、对话等领域。

2020-06-10 14:56:46

自然语言处理(NLP):18 基于规则医药领域知识图谱

本文为了快速搭建一个垂直领域的知识图谱,实体抽取+实体关系暂采用规则处理,这里仅仅提供一种创建知识图谱的一种思路。后续给大家分享基于模型的知识图谱的问答。

2020-06-04 21:45:23

自然语言处理(NLP):17 Transformer模型解读

NLP 领域的模型研究已经被 transformer 模型占领了,学习Transformer 理解Attention,Self-Attention 机制应用实现以及原理,理解BERT 模型必备内容。

2020-06-03 14:50:41

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 技术圈认证
    技术圈认证
    用户完成年度认证,即可获得
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 阅读者勋章Lv2
    阅读者勋章Lv2
    授予在CSDN APP累计阅读博文达到7天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv2
    勤写标兵Lv2
    授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。