2 CDA·数据分析师

尚未进行身份认证

我要认证

分享数据分析和人工智能领域的干货或外文翻译,囊括数据挖掘、数据分析、大数据分析、机器学习、深度学习、神经网络、算法工程、AI科技。还有职场经验交流、时代热门资讯,以及人生的点点滴滴。望大家一起努力,成为更好的自己!

等级
TA的排名 662

R语言描述统计第一弹 | 计算泰坦尼克号不同舱位的存活率

作者:丁点helper来源:丁点帮你今天开始学习在R语言中做描述性统计。为了便于大家边学边练,可以下载这个数据:文件名:titanic.csv链接:https://pan.baidu.com/s/1Pj0EsaBZdnw6mHPpeVd9Aw 密码: yuym将本地文件导入到R中为了便于数据管理和操作,我们通常会把数据保存为.csv格式,这是excel中的一种较为简单的数据格式。想要把一个.csv格式的数据导入R,可以用read.csv()这个函数:# 将本地文件t...

2020-09-28 11:15:15

2020-09-28

作者:陈熹来源:早起Python大家好,又到了python办公自动化专题。在之前我们详细讲解过如何使用Python自动更新Excel表格并调整样式,在上次的自动化案例中要求两个或多个Excel表格数据要匹配/对称才能够自动更新,今天我们再次来解决在数据不对称的情况下如何自动更新表格,这是更常见的情况,也是我遇到的一个具体需求。需求分析现在我们有类似如下一份记录了口袋妖怪名字的分组名单:(未全部展示,实际有A-U组+1个"未分组")现在有一份更新的名单(仅含名字)需要根据这..

2020-09-28 10:50:08

SQL优化之你真的会用索引吗?

作者:丶平凡世界来源:SQL数据库开发提到SQL索引,想必小伙伴们都知道,它是为了提高查询效率而生。但是在查询过程中,怎么才能让我们的查询语句使用到索引?相必大家或多或少都会遇到这样的问题。今天我们就来回答这个问题。1、聚集索引和非聚集索引索引一般分为聚集索引和非聚集索引。聚集索引速度很快,但只能建一个,所以尽量把经常使用的列建成聚集索引。非聚集索引虽然没聚集索引快,但是可以建多个,比全表扫描快。2、如何建立高效的索引A.关联条件上建立索引例如:SELECT ...

2020-09-28 10:39:45

mysql 常用命令手册

来源:SQL数据库开发之前介绍了一系列的mysql基础知识,今天我们将MySQL常用的功能命令整理出来,供大家参考使用!1.导出整个数据库 mysqldump-u用户名-p–default-character-set=latin1数据库名>导出的文件名(数据库默认编码是latin1)mysqldump-uwcnc-psmgp_apps_wcnc>wcnc.sql2.导出一个表 mysqldump-u用户名-p数据库名表名&...

2020-09-28 10:30:17

生存分析初探:怎么看懂生存数据?

作者:丁点helper来源:丁点帮你今天我们开始一个新的主题——生存分析。什么叫生存分析?为什么要采用生存分析呢?前面我们一起学习的多重线性回归和Logistic回归都主要是用来分析某个结果的影响因素,比如教育程度对收入的影响,或者,糖尿病发生与否的影响因素,这些方法主要是在静态地分析某一个特定的结果。可是,倘若我们不仅仅关心结果的发生情况(发病VS未发病),同时我们也想看看发生该结果所经历的时间长短,此时,简单的线性或Logistic回归就难以满足这个需求,而生存分析可以来回答这类似的..

2020-09-27 10:54:35

mysql基础知识——AS别名

作者:丶平凡世界来源:SQL数据库开发又到mysql基础知识环节了,今天我们要给大家介绍的是AS别名,大家一起来瞧瞧哦!别名是什么别名类似我们小时候父母给我取的小名,虽然叫法不同,但是实际上还是同一个对象。别名的作用SQL 别名用于为表或表中的列提供临时名称。 SQL 别名通常用于使列名更具可读性。 SQL 一个别名只存在于查询期间。别名的使用场景在下列情况下使用别名是有用的:查询涉及多个表 用于查询函数 需要把两个或更多的列放在一起 列...

2020-09-27 10:40:47

豆瓣9.2!17万条弹幕告诉你《沉默的真相》凭什么高口碑!

CDA数据分析师 出品作者:Mika数据:真达【导读】今天教大家用Python分析《沉默的真相》的17万条弹幕。距离上一部国产良心剧《隐秘的角落》刷屏还不到2个月,“秃头梗”、“爬山梗”还让人记忆犹新。紧接着又一部爆款国产剧来了,那就是最近口碑炸裂的《沉默的真相》。同样是来自爱奇艺针对悬疑短剧的“迷雾剧场”,《沉默的真相》根据紫金陈的小说《长夜难明》改编,讲述了检察官江阳历经多年,付出无数代价查清案件真相的故事。开播当天《沉默的真相》在豆瓣开分8.8分,随着剧集的播出...

2020-09-27 10:21:57

炫富神器 | 辣条专业国内首开,网友:中国吃货石锤了 ​!

辣条,起源湖南平江,以面粉为主原料,通过挤压熟化调味而成。因国外售价12美元而声名远播,被网友调侃为新时代炫富神器。辣条的受众涵盖老老少少,市场需求巨大,不过辣条的质量问题,一直以来都是政府及社会大众的关注点。为吃到放心辣条,并将其制作专业化、标准化。近日,国内首个辣条专业班在湖南平江县开班,旨在为辣条行业输送专业人才。59名学生实地参观了辣条制作,这是继螺蛳粉后,又一网红小吃专业,网友笑言:中国吃货石锤了!俗话说:没有辣条的童年是不完整滴!可见,辣条是孩子必备零嘴之一,辣条在中国为

2020-09-27 10:03:17

如何理解广义线性回归分析Logistic输出的OR值?

作者:丁点helper来源:丁点帮你前文,我们对Logistic回归分析的来龙去脉有了一个基本的了解,但是Logistic回归之所以应用十分广泛还有一个重要的原因——能直接输出OR值?什么是OR值?如何理解?我们今天就来好好看一看。怎么理解OR值多重线性回归,一般是指有多个自变量X,只有一个因变量Y。前面我们主要是以简单线性回归为例在介绍,两者的差距主要在于自变量X的数量,在只有一个X时,就称简单线性回归。OR值是《流行病学》中的重要概念,称作“优势比”(odds ratio)...

2020-09-25 11:41:58

聊聊python数据处理全家桶(Sqlite篇)

作者:星安果来源:AirPython聊到 python中的Redis,本篇文章继续说另外一种比较常用的数据库:Sqlite。Sqlite 是一种嵌入式数据库,数据库就是一个文件,体积很小,底层由 C 语言编写,经常被集成到移动应用程序中事实上,python内置了 sqlite3 模块,不需要安装任何依赖,就可以直接操作 Sqlite 数据库——准备和 Python 操作 Mysql 类似,操作 Sqlite主要包含下面 2种方式:sqlite3 + 原生 SQL SQL...

2020-09-25 10:58:35

mysql基础知识——正则表达式(下)

作者:丶平凡世界来源:SQL数据库开发上一篇mysql基础知识,我们讲解了正则表达式的一些简单用法,今天我们再来学习一下它的几个特殊用法。示例数据表我们还是以表customers为例,这一次我们添加了一位外国朋友。表customers匹配特殊字符正则表达式是由具有特定含义的特殊字符构成,我们已经用过 . 、[]、|、和-。如果我们需要匹配这些特殊字符该怎么办?例如我们想找出customers表中姓名里带 . 的客户信息,该怎么写?如果按这种写法:SELEC...

2020-09-25 10:24:31

2020在学硕士达300万,失去学历光环的新生代何去何从?

现今,高学历人群日益增多,物以稀为贵的高学历光环淡去。无论本科生还是研究生,甚至博士生,求职竞争力都大不如前,就业压力越来越大。据悉,自新中国成立以来,70多年的时间内中国累计培育了1000多万博士和硕士,2020年在学研究生将达300万,我国已成世界研究生教育大国。来源:中新网教育水平是镜子的两面,中国高端人才的数量和质量提升的同时,亦反映出即便研究生学历含金量未降低,其竞争激烈的程度也已白热化。我们已步入无法单凭学历取胜的时代,这种焦虑导致社会上出现了一批又一批的考证大军。在校考英语4级

2020-09-25 10:09:49

月薪起码2万+,看桑基图分分钟教饼图做人!

作者:伍正祥来源:AI入门学习今天教大家画一个图,桑基图,一个大大提高你的江湖地位的图。桑基图是一种流图,其实在前期文章中提到过,但是并没有讲细节的画法,现在教大家两种画法,一个是R语言(案例1、2、3),一个是直接在线画(案例4)。案例1:你的工资是怎么霍霍的?假如你月薪20000,你能拿到多少?最后花完还剩多少?可能比你想象的要少。一部分被国家拿走,当然国家并不是要你的钱,只是帮你存起来,等你长大了,不对,是老了会还给你的(此处我想起了压岁钱的故事),当然税收部分,那国家说了,强制征..

2020-09-24 11:13:50

别再问我python怎么操作Word了!

作者:陈熹来源:早起Python在之前的自动化系列文章中,我们分别讲解过python操作Excel利器openpyxl,也讲过python操作PDF的几种方式,今天我们将通过代码讲解Python操作Word文档docx的常用方法。安装docx是一个非标准库,需要在命令行(终端)中使用pip即可安装pipinstallpython-docx一定要注意,安装的时候是python-docx而实际调用时均为docx!前置知识Word中一般可以结构化成三个部分:文档...

2020-09-24 10:55:16

聊聊 python 数据处理全家桶(Redis篇)

作者:星安果来源:AirPython前面两篇文章聊到了 python 处理 Mysql、Sqlite 数据库常用方式,本篇文章继续说另外一种比较常用的数据存储方式:RedisRedis:Remote Dictionary Server,即:远程字典服务,Redis 底层使用 C 语言编写,是一款开源的、基于内存的NoSql 数据库由于 Redis 性能远超其他数据库,并且支持集群、分布式及主从同步等优势,所以经常用于缓存数据、高速读写等场景本篇文章就聊聊 Python 操作...

2020-09-24 10:34:38

mysql基础知识——正则表达式(上)

作者:丶平凡世界来源:SQL数据库开发大家好!又到mysql基础知识讲解的时间啦!今天,要给大家说的是正则表达式!正则表达式的作用正则表达式也叫做匹配模式(Pattern),它由一组具有特定含义的字符串组成,通常用于匹配和替换文本。正则表达式的语法SELECTcolumn1,column2,...FROMtable_nameWHEREcolumnNREGEXPpattern;正则表达式的关键字是REGEXP,后面接需要进行匹配的文本。...

2020-09-24 10:17:39

广义线性回归分析模型Logistic,一文读懂它!

作者:丁点helper来源:丁点帮你前文我们已经讲解了相关与回归的基础知识,并且重点讨论了多重线性回归的应用与诊断分析。今天的文章,我们来看看日常学习和科研中应用同样广泛的另一类回归分析——Logistic回归。Logisti回归与多重线性回归的区别多重线性回归,一般是指有多个自变量X,只有一个因变量Y。前面我们主要是以简单线性回归为例在介绍,两者的差距主要在于自变量X的数量,在只有一个X时,就称简单线性回归。读过我们前面“线性回归”系列文章的同学,肯定已经知道,采用线性回归的第一准..

2020-09-23 11:46:30

咋做数据分析,张口就来RFM模型,结果用错了

作者:接地气的陈老师来源:接地气学堂上一篇讲了【用户画像高大上,但90%的人都做失败了!】后,很多同学表示想看RFM模型,今天它来了。RFM模型是很传统的数据分析模型,几乎所有文章都会提到它,然而市面上流传的各种乱用、错用也非常多。今天我们系统讲一下1RFM基本原理RFM模型是三个单词的缩写:最近一次消费时间(Recency),取数的时候一般取最近一次消费记录到当前时间的间隔,比如7天、30天、90天未到店消费。直观上,一个用户太久不到店消费,肯定是有问题,得做点什么事情。...

2020-09-23 11:32:49

mysql基础知识篇:LIKE

作者:丶平凡世界来源:SQL数据库开发我们继续mysql基础知识篇,今天给大家介绍的是like运算符,你知道怎么用吗?LIKE 作用在WHERE子句中使用LIKE运算符来搜索列中的指定模式。LIKE 语法SELECT column1, column2, ...FROM table_nameWHERE columnN [NOT] LIKE pattern;提示:还可以使用AND或OR运算符组合任意数量的条件。名词解释通配符:用来进行模糊匹配的一部分特殊字符。...

2020-09-23 11:17:37

python初学者的自我修养,找到自己的方向

作者:梁唐来源: 早起Python早起导读经常会有读者读者在后台问我,学习python有哪些适合新手入门的小项目推荐,所以今天这篇文章咱们来聊聊这个问题。对于我来说Python的应用场景主要是机器学习、深度学习相关,对于其他的场景涉猎不多。因此本文的目的并不是列举出一系列小项目给你们练手,而是希望引导大家思考这个问题,从而找到适合自己的练习项目。python的误区不知道各位初学者如何看待Python这一门语言,又是如何看待程序员的技能,根据我的理解, 这当中可能存在一些误解。其实不...

2020-09-23 11:03:54

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 1024超级勋章
    1024超级勋章
    授予原创文章总数达到1024篇的博主,感谢你对CSDN社区的贡献,CSDN与你一起成长。
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。