7 JeemyJohn

尚未进行身份认证

我要认证

对机器学习、深度学习、数据挖掘、大数据分析,以及各种开源框架的使用和源码分析等技术感兴趣的朋友,可以加我微信JeemyJohn,申明自己是csdn读者!

等级
TA的排名 5k+

IntelliJ IDEA平台下JNI编程全解

文章目录1、前言2、搭建gcc编译环境3、编写Java代码1、前言众所周知,Java语言是基于虚拟机的解释性语言(Java代码经过编译器编译之后并不是能够直接在机器上执行的二进制代码,而是JVM虚拟机能够识别的字节码,依靠Java虚拟机进行解释执行)。而C/C++是编译型语言(编译完成后是能够直接在机器上运行的二进制指令)。虽然,随着Java虚拟机技术的改善和优化,Java性能相对于刚出来那会已经有了极大地提升,但是C/C++语言的性能还是会比Java要高,这是不争的事实。2、搭建gcc编译环境3、

2020-06-06 16:37:35

面试题—有重复序列全排列问题

最近面试遇到个高频面试题:有重复序列全排列问题,现在Java代码展示给大家,原理稍后有空补充。public class Demo { public static void main(String[] args) { char a1[] = {'a', 'b', 'c'}; perm(a1, 0, 3); System.out.printl...

2020-03-05 12:34:59

面试题—三个数之和小于某个值的组合个数

本题是阿里蚂蚁金服面试题:给定一个数组s,和一个数a,在数组s里面找到3个数使这3个数的和小于a,即s[i]+s[j]+s[k]<a,请你设计一个函数返回数组s里这样的组合有多少个? int f(double s[], double a) { int cnt = 0; Arrays.sort(s); int i = 0; ...

2020-03-05 11:57:15

Python计算相关性

计算相关性import numpy as npimport pandas as pd# load datadata = pd.read_csv('result.csv', header=0)print(data)df = data.drop(['experiment'], axis=1)# 计算不同的相关系数corr = df.corr(method='pearson')p...

2018-11-14 14:35:48

实战微课:机器学习在推荐系统中的应用-章华燕-专题视频课程

在机器学习领域,“没有免费的午餐”是一个不变的定理。简而言之,没有一种算法是完美的,可以作为任何问题的佳解决方案。本课程后通过完整的大型项目,帮助学员从 构建数据集、特征选择 、模型调参 、模型评估与验证 一步步掌握机器学习项目开发的完整流程,同时能够完整地学习到推荐系统的相关基础知识。...

2018-07-27 15:51:30

机器学习小咖养成记视频教程-章华燕-专题视频课程

本视频课程是机器学习算法入门的升级课程。从机器学习、深度学习基础入手,以模型为基础,以算法与数学推导为核心,以算法调参与应用为导向。通过对机器学习中几个经典核心算法:朴素贝叶斯、逻辑回归、决策树、集成学习算法、聚类算法、神经网络、SVM等从而帮助学员彻底理解每个模型的运行原理与效果。后通过完整的大型项目,帮助学者从 构建数据集、特征选择 、模型调参 、模型评估与验证 一步步掌握机器学习项目开发的完...

2018-06-20 15:43:31

机器学习路线-章华燕-专题视频课程

机器学习路线: 机器学习能做什么; 机器学习有哪些方向; 怎么入门和转行机器学习; 怎么入门和转行机器学习; 人脸识别技术的漏洞; 高光谱图像技术的原理;应用高光谱与机器学习区分真人和照片...

2018-06-01 17:39:08

机器学习核心算法各个击破

0. 前言  近年来,随着 Google 的 AlphaGo 打败韩国围棋棋手李世乭之后,机器学习尤其是深度学习的热潮席卷了整个IT界。所有的互联网公司,尤其是 Google 微软,百度,腾讯等巨头,无不在布局人工智能技术和市场。百度,腾讯,阿里巴巴,京东,等互联网巨头甚至都在美国硅谷大肆高薪挖掘人工智能人才。现在在北京,只要是机器学习算法岗位,少则月薪 20k,甚至100k 以上……   ...

2018-04-28 20:08:20

LightGBM大战XGBoost,谁将夺得桂冠?

0.引言  如果你是一个机器学习社区的活跃成员,你一定知道 提升机器(Boosting Machine)以及它们的能力。提升机器从AdaBoost发展到目前最流行的XGBoost。XGBoost实际上已经成为赢得在Kaggle比赛中公认的算法。这很简单,因为他极其强大。但是,如果数据量极其的大,XGBoost也需要花费很长的时间去训练。      绝大多数人可能对 Light Gradie...

2018-04-13 15:36:45

Vim实战技巧锦集

1、VIM的概念和基础操作 vi 命令行下面的文本编辑工具,vim是vi的增强版本。命令vim可以启动vim编辑器。一般可以通过vim+目标文件路径的形式使用vim。如果目标文件存在,则vim打开该文件;若目标文件不存在,则新建该文件。1.1 VI拥有三种模式:命令模式、插入模式和ex模式 1、任何模式都可以通过esc键回到命令模式; 2、在命令模式中按”i“键可以进入到插入模式

2018-02-12 11:54:49

Spark资源调优

Spark作者:章华燕                编辑:龚    赛概述1        在开发完Spark作业之后,就该为作业配置合适的资源了。Spark的资源参数,基本都可以在spark-submit命令中作为参数设置。很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置这些参数,最后就只能胡乱设置,甚至压根儿不设置。资源参数设置的不合理,可能会导致没有充分利用集群资源,作业

2018-01-08 00:00:00

CNN模型之ShuffleNet

CNN作者:叶 虎                编辑:李文臣引言1        ShuffleNet是旷视科技最近提出的一种计算高效的CNN模型,其和MobileNet和SqueezeNet等一样主要是想应用在移动端。所以,ShuffleNet的设计目标也是如何利用有限的计算资源来达到最好的模型精度,这需要很好地在速度和精度之间做平衡。ShuffleNet的核心是采用了两种操作:pointwi

2018-01-03 00:00:00

系列学习——推荐算法综述

作者:章华燕                编辑:祝鑫泉前言1随着移动互联网技术和社交网络的发展,每天都有大量包括博客,图片,视频,微博等等的信息发布到网上。我们正处于大数据的时代,传统的信息检索技术已经不能满足用户对信息发现的需求,推荐引擎的出现,可以帮用户获取更丰富,更符合个人口味和更加有意义的信息。个性化推荐主要是根据用户的兴趣和和利时行为特点,向用户推荐所需的信息或商品,帮助用户在海量信息

2018-01-01 00:00:00

浅析深度学习在实体识别和关系抽取中的应用

实体识别作者:蒙    康                编辑:黄俊嘉命名实体识别1命名实体识别(Named Entity Recognition,NER)就是从一段自然语言文本中找出相关实体,并标注出其位置以及类型,如下图。命名实体识别是NLP领域中的一些复杂任务的基础问题,诸如自动问答,关系抽取,信息检索等 ,其效果直接影响后续处理的效果,因此是NLP研究的一个基础问题。NER一直是NLP领域

2017-12-31 00:00:00

一步步教你理解LSTM

作者:王千发编辑:田 旭什么是LSTM1LSTM全名是Long Short-Term Memory,长短时记忆网络,可以用来处理时序数据,在自然语言处理和语音识别等领域应用广泛。和原始的循环神经网络RNN相比,LSTM解决了RNN的梯度消失问题,可以处理长序列数据,成为当前最流行的RNN变体。LSTM应用举例2假设我们的模型的输入是依次输入一句话的每个单词,我们需要对单词做分类,比如有两句话:(1

2017-12-29 00:00:00

Spark问题集锦

使用外部链接对象(如Jedis客户端)在Streaming RDD中发送数据时,一定要使用单例。否则会出现各种Bug。在IDEA中使用maven混合Scala和Java打Jar包时,Java的类要写在Java目录里。如果将Java类定义在scala目录下,会出现 NoClassDefFoundError 异常。持续更新中…… 对机器学习和人工智能感兴趣,请扫码关注微信公众号!

2017-12-28 21:36:34

机器学习实战---线性回归提高篇之乐高玩具套件二手价预测

作者:崔家华     编辑:王抒伟PS(欢迎访问作者个人网站:www.cuijiahua.com)线性回归零前言:本篇文章讲解线性回归的缩减方法,岭回归以及逐步线性回归,同时熟悉sklearn的岭回归使用方法,对乐高玩具套件的二手价格做出预测。一岭回归:如果数据的特征比样本点还多应该怎么办?很显然,此时我们不能再使用上文的方法进行计算了,因为矩阵X不是满秩矩阵,非满秩矩阵在求逆时会出现问题。为了解

2017-12-24 00:00:00

Spark 常见问题解决方案

Spark 常见问题收集,并给出相应的解决方案。分享给大家,希望大家不要走弯路……

2017-12-23 14:40:53

Spark资源调优

0. 概述  在开发完Spark作业之后,就该为作业配置合适的资源了。Spark的资源参数,基本都可以在spark-submit命令中作为参数设置。很多Spark初学者,通常不知道该设置哪些必要的参数,以及如何设置这些参数,最后就只能胡乱设置,甚至压根儿不设置。资源参数设置的不合理,可能会导致没有充分利用集群资源,作业运行会极其缓慢;或者设置的资源过大,队列没有足够的资源来提供,进而导致各种异常。总

2017-12-23 13:24:32

Spark Streaming之妙用foreachRDD和foreachPartition

0. 前言  DStream中的foreachRDD是一个非常强大函数,它允许你把数据发送给外部系统。因为输出操作实际上是允许外部系统消费转换后的数据,它们触发的实际操作是DStream转换。所以要掌握它,对它要有深入了解。下面有一些常用的错误需要理解。经常写数据到外部系统需要创建一个连接的对象(例如根据TCP协议连接到远程的服务器,我们连接外部数据库需要自己的句柄)和发送数据到远程的系统。为此,开

2017-12-20 21:24:24

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。