4 张雲飞

武汉斗鱼网络科技有限公司 - 数据挖掘工程师

我要认证

手握代码,心怀天下。专注大数据挖掘,机器学习 公众号:雨云飞 欢迎骚扰

等级
TA的排名 3w+

pip升级出错 ModuleNotFoundError: No module named pip的解决办法

Traceback (most recent call last): File "d:\python375\lib\runpy.py", line 193, in _run_module_as_main "__main__", mod_spec) File "d:\python375\lib\runpy.py", line 85, in _run_code exec(code, run_globals) File "D:\Python375\Scripts\pip3.exe\_.

2020-06-10 12:55:59

Scala语言基础:函数式编程

scala和Java、Python一样是面向对象语言,本文讲解scala中函数定义、高阶函数和函数式编程实例WordCount1.函数定义与高阶函数Scala是一门多范式编程语言,混合了...

2020-05-18 21:00:00

scala语言基础:面向对象编程中的继承与特质

scala和Java、Python一样是面向对象语言,本文讲解scala面向对象中继承与特质的相关概念与实例。1.继承Scala中的继承与Java有着显著的不同:(1)重写一个非抽象方法...

2020-05-16 21:00:00

scala语言基础:面向对象编程中的类与对象

scala和Java、Python一样是面向对象语言,本文讲解scala面向对象中的类与对象相关概念与实例。1.类类和对象是Java、C++等面向对象编程的基础概念。类是用来创建对象的蓝...

2020-05-14 21:00:00

scala语言基础:一文带你熟悉六大数据结构

scala语言的数据结构基础,涵盖数组、列表、元组、集、映射、迭代器等。1.数组数组是编程中经常用到的数据结构,一般包括定长数组和变长数组。本教程旨在快速掌握最基础和常用的知识,因此,只...

2020-05-12 21:00:00

scala控制结构:条件表达式与循环

今天带大家一起过一遍scala语言的基础知识,涵盖if条件表达式、for循环与while循环。if条件表达式Scala IF...ELSE 语句是通过一条或多条语句的执行结果(True或...

2020-04-22 21:00:43

scala语言基础:变量声明 基本数据类型 Range和文件读取

今天带大家一起过一遍scala语言的基础知识,涵盖变量声明、基本数据类型、Range使用和文件读取。val变量与var变量Scala有两种类型的变量,一种是val,是不可变的,在声明时就...

2020-04-17 21:00:00

强推Markdown神器,一秒钟拯救微信公众号排版

我一直觉得微信公众号是最难用的文章编辑器,直到我开始写知乎专栏。作为两个UGC内容为主的产品,用户体验如此之差真的大大降低了写作者的创作欲望。基于这个痛点,滋养了一大批像365编辑器、壹伴、秀米等第三方微信图文排版编辑工具,但是页面杂乱繁复,模版花里胡哨,还要忍受粘贴后样式全乱的崩溃感。有一天偶然在github上发现了lyric大神的微信公众号排版编辑器项目,可以直接将Markdown格式...

2020-04-17 17:08:55

淡黄的长裙,蓬松的头发,Scala是个啥?干啥得靠它

笔者今天开始记录一下Scala语言的基础学习。Scala语言一般很少独立使用,而是作为在大数据领域的开发语言,是Spark的底层语言,也是Spark的首选调用语言。Scala简介 ...

2020-04-08 21:00:00

妈妈再也不用担心双系统安装了!(最详细!附镜像资源+分区详解+实测教程)...

ubuntu又出新版本了~附上19.10双系统安装教程,一文解决资源、分区和安装问题!一、制作ubuntu启动盘1.下载ubuntu19.10首先我们通过链接https...

2020-04-04 20:59:10

Spark机器学习不想跟你说话并向你扔了一个kaggle小例子

在前文中分别就Spark机器学习中的各个模块进行逐个描述,本文将Kaggle中Flights and Airports Data数据集作为研究对象,使用Spark对其进行简单的pipl...

2020-04-02 21:00:00

一文带你get七种常用特征工程方案

当在做数据挖掘和数据分析时,数据是所有问题的基础,并且会影响整个工程的流程。相比一些复杂的算法,如何灵活的处理好数据经常会取到意想不到的效益。而处理数据不可或缺的需要使用到特征工程。目录一、什么是特征工程二、常用方法1. 时间戳处理2. 分解类别属性3.分箱/分区4. 交叉特征5. 特征选择6. 特征缩放7. 特征提取一、什么是特征工程简单的说,...

2020-04-02 11:19:24

用python分析1225万条淘宝数据,终于搞清楚了我的交易行为

1、项目背景与分析说明1)项目背景  网购已经成为人们生活不可或缺的一部分,本次项目基于淘宝app平台数据,通过相关指标对用户行为进行分析,从而探索用户相关行为模式。2)数据和字段说明...

2020-04-01 21:00:00

Spark分布式机器学习源码分析:模型评估指标

Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据...

2020-04-01 21:00:00

牛客SQL题解 - 获取当前薪水第二多的员工的emp_no以及其对应的薪水salary,不准使用order by

题目描述查找当前薪水(to_date='9999-01-01')排名第二多的员工编号emp_no、薪水salary、last_name以及first_name,不准使用order byCREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`first_name` varchar(14...

2020-04-01 12:11:45

牛客SQL题解 - 获取当前薪水第二多的员工的emp_no以及其对应的薪水salary

题目描述获取当前(to_date='9999-01-01')薪水第二多的员工的emp_no以及其对应的薪水salaryCREATE TABLE `salaries` (`emp_no` int(11) NOT NULL,`salary` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date NOT NULL,PRIMAR...

2020-04-01 12:08:42

牛客SQL题解 - 统计出当前各个title类型对应的员工当前薪水对应的平均工资

题目描述统计出当前各个title类型对应的员工当前(to_date='9999-01-01')薪水对应的平均工资。结果给出title以及平均工资avg。CREATE TABLE `salaries` (`emp_no` int(11) NOT NULL,`salary` int(11) NOT NULL,`from_date` date NOT NULL,`to_date` date...

2020-04-01 12:06:25

Spark MLlib分布式机器学习源码分析:频繁模式挖掘

Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~目录1.FP增长算法2.FP示例3.关联规则4.序列模式挖掘本...

2020-04-01 10:37:25

Spark MLlib分布式机器学习源码分析:特征提取与转换

Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~本文采用的组件版本为:Ubuntu 19.10、Jdk 1.8.0_241、Scala...

2020-04-01 10:33:54

Spark MLlib分布式机器学习源码分析:奇异值分解(SVD)与主成分分析(PCA)

原理 Spark是一个极为优秀的大数据框架,在大数据批处理上基本无人能敌,流处理上也有一席之地,机器学习则是当前正火热AI人工智能的驱动引擎,在大数据场景下如何发挥AI技术成为优秀的大数据挖掘工程师必备技能。本文结合机器学习思想与Spark框架代码结构来实现分布式机器学习过程,希望与大家一起学习进步~本文采用的组件版本为:Ubuntu 19.10、Jdk 1.8.0_241、...

2020-04-01 10:30:21

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 签到达人
    签到达人
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 阅读者勋章Lv2
    阅读者勋章Lv2
    授予在CSDN APP累计阅读博文达到7天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 原力探索
    原力探索
    参与《原力计划【第二季】——打卡挑战》的文章入选【每日精选】的博主将会获得此勋章。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。