5 MXuDong

尚未进行身份认证

我要认证

假如有一天我变成了流氓,请告诉别人我曾经纯真过!

等级
TA的排名 1w+

提升深度学习模型的表现,你需要这20个技巧

原文:https://www.jiqizhixin.com/articles/2016-09-26-2 提升深度学习模型的表现,你需要这20个技巧By机器之心2016年9月26日 15:12本文原文的作者 Jason Brownlee 是一位职业软件开发者,没有博士学位的他通过「从应用中学习」的方法自学了机器学习,他表示对帮助职业开发者应用机器学习来解决复杂问题很有热情,也为机器学...

2019-07-25 09:12:07

Keras实现LeNet网络参考

模型论文地址Yann LeCun(1998)的论文《Gradient-Based Learning Applied to Document Recognition》,用于MNIST数据集。模型结构说明输入为32X32的灰度图像,第一层为6个5X5卷积核,不扩展边界;第二层为2X2的最大值池化层,步进为2X2;第三层为16个5X5卷积核,不扩展边界;第四层为2X2的最大值池化...

2019-06-10 22:26:44

连续特征离散化参考地址

连续特征离散化:https://blog.csdn.net/ztf312/article/details/53991329https://blog.csdn.net/hellozhxy/article/details/80675229https://blog.csdn.net/oppo62258801/article/details/79271762...

2019-04-06 16:41:53

CNN层调参经验与Drop层、BN层的使用经验

转载地址:https://www.cnblogs.com/bonelee/p/8534560.htmlhttps://blog.csdn.net/sean2100/article/details/83834565两篇文章主要给了两个结论:结论一:CNN 文本分类模型优化经验——关键点:加卷积层和FC可以提高精度,在FC前加BN可以加快收敛,有时候可以提高精度,FC后加...

2019-04-06 16:38:57

PyTorch实现的各类论文和代码参考(安利供保存收藏)

文章地址机器之心: https://www.jiqizhixin.com/articles/102101一篇翻译,主要是关于PyTorch的内容,提供了代码支持,项目地址:https://github.com/bharathgs/Awesome-pytorch-list具体的列表如下注意:主要还是参考原文,内容还是很有意义的自然语言处理和语音处理该...

2019-04-06 14:39:06

Python中from from __future__ import *的用法

from __future__ import *参考:https://blog.csdn.net/zzc15806/article/details/81133045我们在读代码的时候,总是会看到代码开头会加上from __future__ import *这样的语句。这样的做法的作用就是将新版本的特性引进当前版本中,也就是说我们可以在当前版本使用新版本的一些特性。 开头加上from _...

2019-02-23 15:10:34

机器学习NLP参考文章

本站整理了一些NLP的入门资料参考,建议初学者看看。需要复制链接在浏览器里打开。 1.通过kaggle比赛学习机器学习文本分类方法https://zhuanlan.zhihu.com/p/34899693?utm_medium=social&utm_source=wechat_session&from=groupmessage&isappinstalled=0&...

2019-02-23 15:00:41

loss问题——工作中对出现的loss问题描述与解决参考

问题一:loss跑飞如下图描述1、学习率(lr)过大,可以自定义一个学习率的值(较小)开始学习。参考blog:https://blog.csdn.net/CHNguoshiwushuang/article/details/81784299也就是说,学习率如果设置过大,会导致其直接跑到另外一边,从而导致loss跑飞。当然真实的loss变化是在一个奇异空间里的,不是图上的那种二...

2019-02-23 14:49:07

数据不平衡问题——SMOTE算法赏析

春节前后好久没有总结问题了,这一段时间一直在做NLP的文本分类(二分类)问题,遇到了各种问题 。分别如下:1、数据打标问题。运营人手不够可把兄弟们累坏了,是我给兄弟们分的任务,别打我嘿嘿。     打标问题主要是业务不熟悉,主观上分类很容易分错,在分类的时候一定要让运营方来确定分类标准。2、数据不平衡问题。T:F为1:10,重新筛选样本以后达到了T:F为1:17。     实在是数...

2019-02-23 13:52:13

算法工程师(机器学习)部分面试题(转载参考)

其他参考:https://www.jianshu.com/p/980efc8105b2?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendationhttps://www.jianshu.com/p/4a7f7127eef1?utm_campaign=male...

2019-01-27 13:32:46

Xgboost参数以及调优

现实工作中遇到了xgboost来做基准,原因主要是由于用它来做预测分类效果很理想。后面做深度学习很难能有比他好的。线上往往还是使用的xgboost训练出来的model!参考:https://blog.csdn.net/han_xiaoyang/article/details/52665396目录优势1、正则化2、并行处理3、高度的灵活性4、缺失值处理5、剪枝6、...

2019-01-27 13:19:07

Keras—猫狗数据集进行卷积(Conv2D)训练以及图像数据增强

 数据增强不可以增强验证集和测试集!!# !/user/bin/env python# -*- coding:utf-8 -*-"""@author:MXD@file: 小型数据集训练卷积神经网络.py@time: 2019/01/20 14:36@software: PyCharm"""import os, shutil###将数据分别存到各个文件夹# 原始数据集的...

2019-01-20 16:44:53

样本不平衡问题分析与部分解决办法

最近工作中在处理文本分类问题遇到了分类不均衡的问题,主要还是样本太少还同时非常的不均衡正负样本1:10(类别不平衡比例超过4:1,就会造成偏移),就使用了SMOTE方法。注意:在进行数据增广的时候一定要将测试集和验证集单独提前分开,扩张只在训练集上进行,否则会造成在增广的验证集和测试集上进行验证和测试,在实际上线后再真实数据中效果可能会非常的差。目录什么是样本类别分布不均衡?问题描...

2019-01-20 14:11:03

深度学习中的特征工程——不同数据类型与采用的处理方式

之前关于特征工程的blog:https://blog.csdn.net/qq_33472765/article/details/86422199什么是特征工程?顾名思义,特征工程是一种工程活动,目的是从原始数据中最大限度的提取出能表征原始数据信息的特征。数据和特征决定了机器学习的上限,算法和模型不过是逼近这个上限。不过深度学习不用像传统机器学习那样人为合成高级复杂特征,只需利用人类的先验知...

2019-01-20 13:48:07

大规模文本分类参考(转发)

前几天在网上看到了一个blog关于大规模文本分类的内容,在这里转发保存一下。大规模文本分类实践-知乎看山杯总结 原文地址:http://coderskychen.cn/2017/08/20/zhihucup/本文主要介绍了我在知乎看山杯机器学习挑战赛中的一些实验和总结,代码已公开,传送门。阅读本篇大约需要10分钟。 尊重原创,转载请注明出处。先晒一发排名,9th,有小遗憾,但是...

2019-01-20 13:43:35

Keras—embedding嵌入层的使用

最近在工作中进行了NLP的内容,使用的还是Keras中embedding的词嵌入来做的。Keras中embedding层做一下介绍。中文文档地址:https://keras.io/zh/layers/embeddings/参数如下: 其中参数重点有input_dim,output_dim,非必选参数input_length.初始化方法参数设置后面会单独总结一下。demo...

2019-01-20 13:38:25

Keras :MNIST数字图像识别示例(卷积神经网络)

Keras:MNIST数字图像识别示例 # !/user/bin/env python# -*- coding:utf-8 -*-from keras.datasets import mnistfrom keras.utils import to_categoricalfrom keras import layersfrom keras import models# imp...

2019-01-13 20:07:15

Keras部分源码赏析

Keras 源码分析此文档中,凡代码里用pass,均系省略源码以便阅读,起“本枝百世”之用。此注明者,乃pass非源码所有,勿叫读者疑心不解也。[TOC]Keras 概览我们从一个简单的全连接分类器来看Keras的设计原则和阅读源代码。在Keras的官网上有这样一个简单全连接网络的示例The Sequential model API:import kerasfrom ker...

2019-01-13 18:35:50

pytorch torch matplotlib openCV-python pytorch0.4 numpy中文文档参考地址

pytorch torch matplotlib openCV-python pytorch0.4 numpy中文文档参考地址参考地址: https://ptorch.com/news/50.html跳转 地址:PytorchTorchPytorch视频MatplotlibOpenCV-PythonPytorch0.4Numpy...

2019-01-13 18:19:21

Pandas速查手册

原文:https://cloud.tencent.com/developer/article/1094110对于数据科学家,无论是数据分析还是数据挖掘来说,Pandas是一个非常重要的Python包。它不仅提供了很多方法,使得数据处理非常简单,同时在数据处理速度上也做了很多优化,使得和Python内置方法相比时有了很大的优势。如果你想学习Pandas,建议先看两个网站。(1)官网: P...

2019-01-13 18:11:12

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!