2 CDA·数据分析师

尚未进行身份认证

分享数据分析和人工智能领域的干货或外文翻译,囊括数据挖掘、数据分析、大数据分析、机器学习、深度学习、神经网络、算法工程、AI科技。还有职场经验交流、时代热门资讯,以及人生的点点滴滴。望大家一起努力,成为更好的自己!

等级
TA的排名 1k+

时间序列数据的特征提取

CDA数据分析师 出品当你想对时间序列数据做分类时,有两种选择,一个是用时间序列特定的方法,比如说说LSTM模型。另外一种方法就是来从时间序列中提取特征从而将这些特征用在有监督的模型上。在这篇文章中,我们来看下如何使用tsfresh包自动的提取时间序列数据。这份数据的来源是 。这个网站中提供对很多数据集有高精度的模型,如何有兴趣的,可以去详细了解一下。时间序列比一般标准的目标要难一些,这...

2020-04-03 15:56:17

让你成为统计大师的假设检验指南

CDA数据分析师 出品简介–思维方式的差异当一个人MIS专业人士的身份开始了职业生涯,然后进入商业智能(BI),随后进入了商业分析,统计建模以及机器学习领域。这些转换中的每一个都会要求改变如何关于看待数据的思维方式。但是,在所有这些过渡中都值得一提的是。当以BI专业人员的身份创建管理仪表板和报告时。因为公司内部的结构性不同,可能会需要BI团队向业务分析师(BA)团队报告。那么这个时候就...

2020-04-03 15:42:28

AI如何改变人类社会的各种业务模式?

CDA数据分析师 出品在过去的20年中,一些愤世嫉俗的人一直担心,人工智能(AI)的发展会破坏企业结构,导致大量失业和财富不平等加剧。到目前为止,这些担忧尚未实现。但这并不是说AI并没有从很多方面改变商业世界,AI带来了与挑战一样多的新机会。尽管机器人还没有取代人类,但是已经有重要的迹象表明AI可以在工作中和在家中使用。它在医疗保健和金融领域很流行,现在在这些数据繁重的行业中主导着后端操...

2020-04-02 18:00:29

罗永浩直播卖货:1.1亿销售额,近5000万人围观,抖音请值了?

累计4800万人围观,1.1亿销售额,抖音音浪收入超过360万元,创下了抖音平台目前已知的最高带货纪录。作者 | Bonnie来源 | 创业邦就在昨晚,罗永浩以还不错的数据在抖音完成了他的首场3小时直播带货。而在另一边,有着淘宝第一主播称号的薇娅,以4000万的价格直播卖火箭。注:50万是定金,然后成功卖出开播之前,罗永浩先开启了打赏,截至晚上八点直播正式开始,打赏达到52.8...

2020-04-02 17:32:09

破解机器学习的误区——常见机器学习神话究竟从何而来?

CDA数据分析师 出品Forrester Research最近发布了一份名为“ 粉碎机器学习的七个神话”的报告。在其中,作者警告说:“不幸的是,一些对机器学习项目做出重要决策的企业领导者,普遍存在机器学习的误解。”当高管和经理谈论AI以及机器学习时,他们有时会犯一些事实错误,显示出他们真正的知识水平。卡尔森说:“当产品负责人说诸如“我们正在使用强化学习,因为我们将用户反馈纳入趋势模型中...

2020-04-01 14:41:16

通过一张图就能看懂世界石油分布?Python爬虫轻松搞定!

CDA数据分析师 出品2020年的3月注定将载入史册。一边是新冠肺炎疫情在全世界快速扩散,另一边是掌控着世界40%以上油气产量的巨头们撕破脸皮。面对在OPEC+会议中坚持不再减产的俄罗斯,沙特阿拉伯决意提升石油产能抢占市场,石油价格战毫无征兆地开打。国际原油价格出现大幅波动。3月9日,黑色星期一,世界油价剧烈杀跌,跌幅超过30%。那么作为现代工业里最重要的命脉,世界石油产量分布究竟如...

2020-03-31 14:59:37

了解CNN的局限性,这是AI的最大成就之一

CDA数据分析师 出品经过漫长的冬季之后,人工智能的发展经历了炎热的夏天,这主要归功于深度学习和人工神经网络的发展。更准确地说,对深度学习的新兴趣很大程度上归功于卷积神经网络(CNN)的成功,卷积神经网络是一种特别擅长处理可视数据的神经网络结构。但是,如果我告诉您CNN根本存在缺陷怎么办?这就是深度学习的先驱之一Geoffrey Hinton 在AAAI会议(主要的年度AI会议之一)上的...

2020-03-30 16:44:54

用Python实现随机森林算法

CDA数据分析师 出品拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱。bagging(bootstrap aggregating 的缩写)算法从训练数据的样本中建立复合模型,可以有效降低决策树的方差,但树与树之间有高度关联(并不是理想的树的状态)。随机森林算法(Random forest algorithm)是对 bagging 算法的扩展。...

2020-03-30 16:09:44

python统计分析之HR如何察觉员工的潜在离职因素

CDA数据分析师 出品前言:大数据使企业能够确定变量,预测自家公司的员工离职率。” ——《哈佛商业评论》2017年8月“员工流失分析就是评估公司员工流动率的过程,目的是预测未来的员工离职状况,减少员工流失情况。” ——《福布斯》2016年3月一、背景介绍1. 数据来源本项目数据集来自DataCastle训练赛。数据及代码链接:https://pan....

2020-03-30 15:50:01

Python统计分析之HR如何更快察觉员工的潜在离职因素

HR如何才能知道员工的潜在离职因素呢?前言:大数据使企业能够确定变量,预测自家公司的员工离职率。” ——《哈佛商业评论》2017年8月“员工流失分析就是评估公司员工流动率的过程,目的是预测未来的员工离职状况,减少员工流失情况。” ——《福布斯》2016年3月一、背景介绍1. 数据来源本项目数据集来自DataCastle训练赛。数据及代码链接:链接:https://pa...

2020-03-30 15:12:18

疫情之下:内心越慌乱,你越要修炼这4件事

这次疫情,给我们每个人的生活都带来了不同程度的混乱。作者 | 艾菲原文 | 疫情之下:内心越慌乱,你越要修炼这4件事但同时,我们也不得不承认,它只是在用一种近乎极端残酷的方式,迫使我们去重新审视生活的本来样貌:原本的生活是祥和的,忽然,某个意外出现,也许是被离婚分手、也许是被公司辞退、也许是生病住院、也许是有人欠了你债迟迟不还、也许是孩子被人欺负,于是混乱就发生了。在混乱...

2020-03-30 13:29:23

疫情过后,正确的生活打开方式

我们的生活被突如其来的“疫情”按下了暂停键,在一次次的重启中我们逐渐领悟,生命的意义。疫情过后,我们的生活要如何正确打开呢?保持合理的饮食作息习惯果蔬多一点多吃蔬菜对保护心血管和防癌很有好处,每天都应吃不少于 300 克的蔬菜,以叶菜和深色蔬菜(如深绿色、红色、橘红色、紫色等)为主。尽可能每天吃一至两种水果。油盐少一点盐吃太多了会加重肾脏的负担,可能降低口腔黏膜的屏障作用,增加感...

2020-03-30 11:48:50

特斯拉电池工厂大裁员;美计划限制华为芯片供应;海康威视暂停调薪

资 讯海康威视被曝已通知员工四月份薪资不再调整根据三言财经本周报道,海康威视内部员工通过脉脉爆料称收到公司邮件上注明:取消所有餐费补贴、取消小零食、取消交通补贴、取消通讯补贴、取消过节费、取消工作服、取消生日福利,并延长剩余年假清偿,调整从 3 月份开始。同时,四月份薪资不再调整。美国政府计划限制华为全球芯片供应链消息人士透露,特朗普政府一些高官已同意出台新措施,限制华为的全球芯片供应...

2020-03-30 11:17:08

7个回归分析方法!数据分析师必须掌握

什么是回归分析?**回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。**这种技术通常用于预测分析、时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。**回归分析是建模和分析数据的重要工具。**在这里,我们使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。我会在接下...

2020-03-30 11:00:28

7个回归分析方法!数据分析师必须掌握

什么是回归分析?回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析、时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。回归分析是建模和分析数据的重要工具。在这里,我们使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小...

2020-03-30 10:58:42

医疗保健中的自然语言处理

CDA数据分析师 出品当涉及医疗保健行业时,人们可能会想到AI方法的众多用例,例如机器视觉或预测分析。但是, 自然语言处理(NLP)在医疗保健中的应用也多种多样。在本文中,我将介绍NLP为医院和医疗保健公司开发的一些应用程序。我们将通过探索向医疗保健提供商提供NLP软件的四家公司来做到这一点:IQVIA 的平台利用社交媒体等非结构化和替代性数据源,以及医疗文档,来生成有关法规和合规性...

2020-03-27 19:08:58

2020~2030:人工智能将占据主导地位的十年

CDA数据分析师 出品机器人学家和科幻小说家艾萨克·阿西莫夫(Isaac Asimov)在他的小说《机器人》(1950年)中预测,到2030年,机器人和人工智能将被禁止进入地球。相反,我们看到了人工智能的巨大进步,而且这种趋势可能会在未来十年内持续下去。英国对AI的投资最近达到了2019年的历史新高,从2018年全年的10.2亿美元增加到2019年前六个月的10.6亿美元。此外,欧盟委员...

2020-03-27 18:52:41

机器学习算法之有监督学习和无监督学习的区别

CDA数据分析师 出品如今机器学习和人工智能是大家耳熟能详的两个词汇,在我们日常生活中也是被高频的提到。其实机器学习只是人工智能的一部分,是人工智能的一个子集,它往往是通过示例和经验模型让计算机去执行一些操作任务,研究人员和开发人员比较比较热衷于它。在生活中,我们应用的很多东西其实都使用的是机器学习算法,例如我们使用的好多APP,包括AI助手、web搜索、手机翻译等,现在你手机社交媒体新闻...

2020-03-27 18:38:51

数据科学、人工智能与机器学习傻傻分不清楚,这次通通给你讲清楚

尽管"数据科学"、人工智能 (AI) 和机器学习属于同一领域,彼此相互联系,但是它们也有特定的应用背景和意义。它们有时也会有重叠,但基本上它们都有自己的特定的用途。什么是数据科学?数据科学是指与数据系统和数据处理有关的研究领域,它旨在维护数据并从中推导出数据蕴含的意义。数据科学家将工具、应用、理论和算法结合在一起来理解数据。由于现在全球各个组织或系统都在生成指数级的数据量,因此很难监视和存储...

2020-03-27 14:32:41

深度学习基础:为什么神经网络的感知机中的神经元需要偏置项?

作者 | Caio Davi每个人都知道神经网络中的偏置(bias)是什么,而且从人类实现第一个感知器开始,每个人都知道神经元需要添加偏置项。但你是否考虑过我们为什么要使用偏置项呢?就我而言,直到不久前我才弄清楚这个问题。当时我和一个本科生讨论了一些神经网络模型,但不知何故她把“偏置输入”(bias input)和“统计基差”( statistical bias)搞混了。对我来说,向她解...

2020-03-27 14:26:58

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 1024超级勋章
    1024超级勋章
    授予原创文章总数达到1024篇的博主,感谢你对CSDN社区的贡献,CSDN与你一起成长。
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。