2 CDA·数据分析师

尚未进行身份认证

我要认证

分享数据分析和人工智能领域的干货或外文翻译,囊括数据挖掘、数据分析、大数据分析、机器学习、深度学习、神经网络、算法工程、AI科技。还有职场经验交流、时代热门资讯,以及人生的点点滴滴。望大家一起努力,成为更好的自己!

等级
TA的排名 645

python列表的11个方法全解

作者:小伍哥来源:AI入门学习列表是python里面非常重要的数据类型,其中的方法总共有11个,数量掌握这些方法,对数据的处理效率会大大提高,现在分享给大家。print(dir(list()))#查看列表的方法[ ..., 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']01、append()方法描述:append() 方法在列..

2020-10-29 14:46:39

除了ABtest,数据分析测试方法还有这些!

作者:接地气的陈老师来源:接地气学堂业务方要你人工智能大数据精准预测,预测偏差多少钱,就扣你多少钱的工资,你怕不?!偏偏真的就有很多类似场景,话不多说,直接上干货:问题场景:某互联网金融公司准备通过投放获取投资客户,最近听说私域流量很火,但是从来没在公众号渠道试验过,现计划在公众号渠道进行投放,请数据分析部门利用大数据人工智能精准预测投放效果,到底做一次投放能赚多少钱。假设你是这个公司的数据分析师……1别忘了你还有这个武器正确回答:预测个屁!业务部门是不懂数据原理的,有想不...

2020-10-29 11:50:31

python有序字典的两个小“惊喜”

英文:Ordered dict surprises(https://nedbatchelder.com//blog/202010/ordered_dict_surprises.html)作者:Ned Batchelder译者:豌豆花下猫来源:Python猫从python 3.6 开始,常规的字典会记住其插入的顺序:就是说,当遍历字典时,你获得字典中元素的顺序跟它们插入时的顺序相同。在 3.6 之前,字典是无序的:遍历顺序是随机的。关于有序字典,这里有两件令人意外的事情。...

2020-10-29 10:53:17

6个你可能不熟悉的Linux实用命令!

来源:网络Linux是一个强大的操作系统,这篇文章收集了6个你可能没有用过的Linux命令,但却相当的有用,供大家参考。1)bc这个Linux命令用于精度比较高的数学运算。如:开平方根等。下面利用bc命令写个脚本(文件名:sqrt)#!/bin/bashif[ $thenecho'Usage: sqrt number'exit1elseecho-e"sqrt($1)\nquit\n"| bc -q -ifi接着,可使用这个脚本进行平...

2020-10-29 10:17:24

SQL基础知识:常用字符处理函数

作者:丶平凡世界来源:SQL数据库开发ASCII(字符串)返回字符串表达式中最左侧的ASCII代码值,示例:SELECTASCII('S'),ASCII('SQL')CHAR(字符)将整数类型的ASCII值转换为对应的字符,示例:SELECTCHAR(83)LEN(需要获取长度的字符串) 返回:字符串的长度示例:SELECTLEN('SQL学习之路')LEFT(需要被从左边截取的字符串,截取的长度)返回:左边的字符串示例:...

2020-10-28 12:01:10

秒懂!图解四个实用的pandas函数!

作者:Baijayanta Roy来源:towardsdatascience编译&内容补充:早起Python在用python进行机器学习或者日常的数据处理中,pandas是最常用的Python库之一,熟练掌握pandas是每一个数据科学家的必备技能,本文将用代码+图片详解Pandas中的四个实用函数!shift()假设我们有一组股票数据,需要对所有的行进行移动,或者获得前一天的股价,又或是计算最近三天的平均股价。面对这样的需求我们可以选择自己写一个函数完成,但是使用pan..

2020-10-28 11:21:01

python随机模块22个函数详解(下)

作者:小伍哥来源: AI入门学习这篇文章继续给大家介绍python中的随机模块,随机数可以用于数学,游戏,安全等领域中,还经常被嵌入到算法中,用以提高算法效率,并提高程序的安全性。平时数据分析各种分布的数据构造也会用到。12 uniform描述:产生[a,b]范围内一个随机浮点数。uniform()的a,b参数不需要遵循a<=b的规则,即a小b大也可以,此时生成[b,a]范围内的随机浮点数。语法:random.uniform(x, y)random.uniform(10,..

2020-10-28 10:51:02

python随机模块22个函数详解(上)

作者:小伍哥来源: AI入门学习今天给大家纤细介绍下python中的随机模块,随机数可以用于数学,游戏,安全等领域中,还经常被嵌入到算法中,用以提高算法效率,并提高程序的安全性。平时数据分析各种分布的数据构造也会用到。random模块,用于生成伪随机数,之所以称之为伪随机数,是因为真正意义上的随机数(或者随机事件)在某次产生过程中是按照实验过程中表现的分布概率随机产生的,其结果是不可预测的,是不可见的。而计算机中的随机函数是按照一定算法模拟产生的,对于正常随机而言,会出现某个事情出现多次的情..

2020-10-28 10:45:32

R语言绘图 | 折线图画法,如何画出你满意的图?

作者:丁点helper来源:丁点帮你上篇文章中,我们用世界银行的例子给大家介绍了散点图怎么画,那折线图呢?绘制折线图如果将散点图上的点从左往右连接起来,就会得到一个折线图。今天我们以R中自带的Orange 数据集为例,来学习折线图的画法,该数据集中包含五种橘树的树龄和年轮数据。要考察橘树的年轮如何随着树龄变化,先画个散点图看看:#先看第一种橘树,提取第一种树的数据,保存在t1中t1<-subset(Orange,Tree==1)戳此复习subset()函数的功能...

2020-10-27 11:50:58

SQL基础知识:事务

作者:丶平凡世界来源: SQL数据库开发事务在SQL应用中很广泛,特别是针对一些读写问题时,使用事务可以很好的规避意外(脏读,幻读,不可重复读)。而且事务在出来误操作时也有很好的预防作用,特别是像SQL Server这种自动提交的数据库平台,使用事务能防止误删和误更新。什么是事务事务是在数据库上按照一定的逻辑顺序执行的任务序列,既可以由用户手动执行,也可以由某种数据库程序自动执行。事务实际上就是对数据库的一个或者多个更改。当你在某张表上创建更新或者删除记录的时,你就已经在使用事务了。..

2020-10-27 11:33:46

6种数据格式对比,用Jupyter+pandas高效数据分析

编译:刘早起(有删改)来源:towardsdatascience、GitHub等在使用python进行数据分析时,Jupyter Notebook是一个非常强力的工具,在数据集不是很大的情况下,我们可以使用pandas轻松对txt或csv等纯文本格式数据进行读写。然而当数据集的维度或者体积很大时,将数据保存并加载回内存的过程就会变慢,并且每次启动Jupyter Notebook时都需要等待一段时间直到数据重新加载, 这样csv格式或任何其他纯文本格式数据都失去了吸引力。本文将对pa...

2020-10-27 11:23:54

分析5万多场英雄联盟比赛,教你如何轻松用python预测胜负

CDA数据分析师 出品作者:真达、Mika数据:真达后期:Mika【导读】今天教大家用Python预测英雄联盟比赛胜负。Show me data,用数据说话!今天我们聊一聊 python预测LOL胜负。目前,英雄联盟S10全球总决赛正在火热进行中,最终决赛将于10月31日在浦东足球场举行。作为当下最火热的电竞赛事,这点燃了全球无数玩家的关注,相信没有哪个英雄联盟玩家会错过这场受众超广、影响力超大的国际电竞赛事。LPL究竟能否在家门口拿下第三座世界赛奖杯也成了许多玩家关注...

2020-10-27 11:04:30

SQL基础知识:约束(实例)

作者:丶平凡世界来源:SQL数据库开发今天,给大家介绍SQL中六种工作中经常使用到的约束,供大家参考!NOT NULL约束NOT NULL 约束强制列不接受 NULL 值。NOT NULL 约束强制字段始终包含值。这意味着,如果不向字段添加值,就无法插入新记录或者更新记录。下面的 SQL 强制表"Customers" 的"客户ID" 列和 "姓名" 列不接受 NULL 值:CREATETABLECustomers(客户IDINTNOTNULL,姓名VA...

2020-10-26 14:20:42

聊聊python 办公自动化之 Excel(上)

作者:星安果来源:AirPython1. 前言在我们日常工作中,经常会使用Word、Excel、PPT、PDF等办公软件。但是,经常会遇到一些重复繁琐的事情,这时候手工操作显得效率极其低下;通过python 实现办公自动化变的很有必要。接下来的一系列文章,我将带大家对Python 办公自动化做一个全面的总结,绝对的干货!2. 准备使用 Python 操作 Excel 文件,常见的方式如下:xlrd / xlwt openpyxl Pandas xlsxwr...

2020-10-26 13:52:20

《羞羞的铁拳》表现精彩的艾伦,甘做十几年配角,原因是?

​提到沈腾,大家一定不会陌生,从《夏洛特的烦恼》到《羞羞的铁拳》,都展现出了其在喜剧方面的极佳造诣。他主演的作品中,不知道你是否有留意到,总有那么几个特别熟悉的配角,表现亦非常精彩。《羞羞的铁拳》海报图片来源:豆瓣如《羞羞的铁拳》中的艾伦,很多观众说他的出场就是笑点,在电影中如此出色,和演员本身巨大的付出分不开。∨艾伦表现力出众,在很多口碑极佳的喜剧中担任配角。他不仅表现力十足,还是富二代,名副其实的“京城贵公子”,却能甘心做了几十年的绿叶,实属难得。艾伦的出彩不但博得了观众

2020-10-26 13:37:32

刷爆网络的动态条形图,3行Python代码就能搞定

作者:小伍哥来源:AI入门学习上次出了一个在网站「Flourish」画动态条形图的文章【动态条形图视频教程】,需要登录网址很多人可能觉得不方便,现在有大佬出了个Python包,只需几行代码就能搞定动态条形图,非常强大,给大家分享下。一、前期准备工作1、官方参考文档GitHub :https://github.com/dexplo/bar_chart_race说明文档:https://www.dexplo.org/bar_chart_race/2、软件安装(该安装方法只能安装...

2020-10-26 11:51:04

一文搞懂“正态分布”所有重要知识点

作者:丁点helper来源:丁点帮你正态分布,这个我们从中学就学过的内容,真有这么重要吗?我想,真正学懂统计的人对这一点是不会质疑的,且不谈特别高深的统计理论,彻底弄懂正态分布是灵活运用统计学中各种假设检验方法、看懂p值,理解均数置信区间的前提。今天,我尝试带着大家搞懂对于正态分布你需要知道的所有知识点。作为统计学的基础,我们会主要注重思维理解,复杂的数学计算在此略去。这并非意味着数学不重要,对数学的仔细专研恰恰会特别辅助理解和掌握,只是对于大部分数学基础不好的同学这个难度不小,所以我们在这..

2020-10-23 13:49:25

mysql基础知识——UNION

作者:丶平凡世界来源:SQL数据库开发又来到了mysql基础知识系列版块,今天给大家带来的是UNION。UNION的作用UNION运算符用于组合两个或更多SELECT语句的结果集。UNION使用前提UNION中的每个SELECT语句必须具有相同的列数这些列的数据类型必须兼容:类型不必完全相同,但是必须可以隐式转换。 每个SELECT语句中的列也必须以相同的顺序排列UNION 语法SELECT column_name(s) FROM table1UNIONSELE...

2020-10-23 13:40:30

用户生命周期,这部分关键内容,书上忘了讲!

作者:接地气的陈老师来源:接地气学堂在做数据分析的时候,用户生命周期分析,是个很典型的“理论一听就懂,数据一做就废”的东西。很多同学很困扰:“到底生命周期该怎么算?为啥我算的套到业务上不成立!”今天我们系统解答一下。1书本上的生命周期在各路书本、文章中,大家都看到过这张图:要注意的是,这个图讲的是理论上的用户生命周期。它假设了用户留存与用户价值之间存在倒U型关系。因此推导出:用户必须得维护好 要搭建成长路径 要计算全生命周期价值 不要只计较眼前利益 前期重体验,...

2020-10-23 11:48:49

用python转换PDF/Word/Excel/PPT等!

作者:刘早起来源:早起Python大家好,又到了Python办公自动化专题。今天讲的是各位一定会接触到的PDF转换,关于各种格式的文件转换为PDF有很多第三方工具与网站可以实现,但是使用Python的好处不仅可以批量转换,同时一旦脚本写完了以后就可以一键执行,彻底解放双手,那么本文就来盘一盘如何使用Python来将Word/Excel/PPT/Markdown/Html等各种格式的文件转换为PDF!Word转PDFWord转PDF应该是最常见的需求了,毕竟使用PDF格式可以更方便展示文档..

2020-10-23 11:26:13

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 1024超级勋章
    1024超级勋章
    授予原创文章总数达到1024篇的博主,感谢你对CSDN社区的贡献,CSDN与你一起成长。
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。