自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

python_new的博客

人生苦短快学python

  • 博客(25)
  • 收藏
  • 关注

原创 神经网络文章整理

最近在看神经网络,前向传播其实比较容易理解,但是对于反向传播理解不是很透彻,所以特意整理了几篇优秀博主文章来进行学习,感觉相当不错,特意转载。神经网络概述:https://blog.csdn.net/illikang/article/details/82019945神经网络公式推导:https://blog.csdn.net/qq_32865355/article/details/80260212神经网络反向传播举例:https://blog.csdn.net/qq_29407397/articl

2020-05-16 17:46:19 244

原创 关于AUC和ROC曲线的理解

http://blog.csdn.net/dinosoft/article/details/43114935http://my.oschina.net/liangtee/blog/340317

2020-04-24 10:39:47 302

转载 常见分布的概率分布及期望方差

文章转载:https://www.jianshu.com/p/c05bafb52877

2020-04-07 20:58:01 5706 1

原创 多元线性回归模型检验-续上篇

https://editor.csdn.net/md/?articleId=105137945其实上一篇讨论的多元线性回归还不是很全面,而且训练和测试集都没有分,在这里继续讨论多元线性回归模型检验的相关问题。多元线性回归的输出变量是连续变量,输入变量中如果包含离散变量需要做哑变量或One-hot编码,连续变量可以直接用来建模。共线性问题:https://www.sohu.com/a/326...

2020-04-04 20:42:46 3229

原创 统计建模-多元线性回归预测房价

持续找工作中,闲聊时间看看统计建模的相关知识,首先来看建模的一般流程:(1)获取数据,理解指标含义,对指标进行归类(2)数据(3)前期预处理:比如ID,或者该指标的取值唯一等字段就不用参与建模了(4)数据探索,看数据的分布情况,发现缺失、异常、数据均衡性问题1、自变量x和因变量y的分布情况;连续变量看均值、中位数、标准差、偏度等,离散变量看频数,占比等;...

2020-03-27 17:00:50 2723

原创 关于从事数据分析行业的一些思考

刚毕业半年,半吊子水平的数据分析师,面试官基本上也不问你特别深层次的东西,问了一些有关职业的理解和发展规划,现在把他记录在博客上面,后续继续改正,如有不妥之处,还望批评指正。0X01数据分析师的理解:一、数据分析师的产生数据分析师并不像产品和开发那样在公司创业初期不可或缺,是公司发展到一定程度之后的产物;因为在产品初期,产品本身就可以做数据分析,到后来业务线不断增加,产品那些忙不过来,这个时...

2020-03-11 20:41:45 298

原创 统计推断中的参数估计和假设检验

拿到一个数据之后,一般都需要用python读进来或者在excel里面观看每个变量的含义,有助于理解这个数据,同时要一个变量一个变量进行排序,看看缺失值,异常值等情况,进行数据清洗如何培养数据的敏感性??多看数据的分布图(直方图和柱形图一般就可以了),或者列联表分析图,然后基于对业务的理解,能看出来这个数据大概是个什么情况错误值的处理方法:1、首选是改对了(成本很高)2、用缺失值替换3、删...

2020-03-07 15:25:29 1818

原创 闲聊数据建模流程

闲聊在数据建模之前的一些数据预处理步骤。如何培养数据之间的敏感性,多看各指标的分布,通过直方图,柱形图,概率密度图能看到数据的分布情况,能看到数据集中在什么位置,边界值在什么位置。1、取数:首先是理解业务,理清逻辑,写sql去数据库里面取数2、简单理解变量:取数完成之后,放到excel或者是用python读取文件,浏览数据,记录下每一个变量的含义,并且对变量进行分组,比如在金融行业,将能代表...

2020-03-06 13:12:22 504

原创 统计分析知识之--描述性统计

数据统计之描述性统计:变量类型包括分类变量和连续变量。如果细分分类变量又可以分为名义变量和等级变量,名义变量没有高低贵贱之分,如男女性别,等级变量存在等级之间的划分,如成绩的优良、中等、及格等:度量标准分类变量:分类变量使用频次和百分比(行汇总、列汇总呢、总计百分比)来进行度量,至于频次就可以使用列联表来进行展示,百分比可以用柱形图等。连续变量:连续变量的度量就比较复杂了,主要包含三...

2020-02-29 18:24:16 3878

原创 数理统计的相关知识

闲情逸致,写几篇小文,也算是安慰一下自己------------统计分析常用分析方法-------------下图总结了统计学中我们常用到的一些统计分析方法,图表来源于Ben老师。从大类来看,分析包含四大类:探索性分析(新产品如何定价[成本、市场竞争和需求]),描述性分析(昨天交易情况如何,偏向于统计维度),解释性分析(指标为什么下降[先看同比情况;然后查看其他因素,周六日、节假日、服务器崩溃...

2020-02-29 14:28:05 249

原创 Python原生态函数小结

最近疫情大爆发,简历投出去基本上没什么反应,闲着也是闲着还不如巩固一下以前的知识:1、字符串可以是单引号、双引号(一般一行以内,当然也可以使用 \ )、三引号(多行);单引号和双引号可以互用;c = ‘It is a “dog”!’2、常用函数str.strip(",") – 去除字符串里面的 , 号str.split(",") – 对字符串按照,进行分割------------...

2020-02-28 16:44:09 184

原创 常用广告计价方式

当今,广告可谓是遍布在生活的方方面面,不论是坐地铁的大张海报、宣传栏,地铁里面的移动电视,各大高楼大厦的液晶显示屏;看在线视频时令人讨厌的前贴片、中插、弹幕广告等,几乎无处不在,下面简单介绍一下广告的计价方式:CPM:说白了就是按照展示次数收费,1CPM就是曝光1000次,重在曝光,效果具有延迟效应;CPC:按点击收费,有些广告主说光是展示,用户又不去点击我们的广告,有什么用?又不能给我带来转...

2019-11-06 23:46:40 1151

原创 python遍历sheet并将处理结果存储到当前工作表中

1、背景刚开始的时候,领导给了我一张excel表,她说每周都不定期更新,每次更新都是复制粘贴,不但容易出错,而且要花费2个多小时,然后她问我,你在下班时间可以考虑怎么用脚本如python,或VBA把这个东西做批量化处理,提高一下工作效率,我说好,然后就开始构思怎么去处理这样一种格式的数据,捡起我3个月都没写脚本的热情,就展开了。刚开始也没想着一下就能完全实现,一步一步来,快一点是一点,然后写了一...

2019-10-31 23:52:10 6729

原创 python遍历文件夹中带指定后缀的文件并做数据拼接

1、背景不知道小伙伴们平时有没有这样的困惑,去平台上面疯狂的导数,然后复制粘贴,做加工处理,做个表格,交给领导看,稍微不注意,还出错,被领导一顿批,下面我介绍一种简单的应用场景,使用代码来批量实现。具体的情况如下:(1)在某个文件夹下面,我们想把以xlsx为后缀的文件筛选出来(2)获取下划线后面的订单id(3)将xlsx为后缀的文件内容做纵向拼接文件夹的内容如下:订单表201910...

2019-10-29 22:54:51 2384

原创 统计学基础-周计划1

数据的集中趋势众数概念:一组数据中出现次数最多的数,众数可以是多个,也可以没有。举个栗子:[0,0,1,1,2,3]中的众数是0和1,[0,1,2,3]中没有众数,[0,1,2,1]中的众数是1。中位数概念:一组数据中,中间位置的那个数,假设n为奇数,排序之后中间的那个值就是中位数,如果n是偶数,排序之后中间两个数的平均值即为中位数。举个栗子:假设排序之后的数据为[0,1,2,4,4]...

2019-07-21 08:38:53 285

原创 mysql求累计值,实现python中cumsum的功能

由于实际需要,特意写此博客记录一下怎么在mysql中实现累加的功能,达到python中cumsum的效果博客参考:https://www.cnblogs.com/bourneli/archive/2013/08/09/3248908.html有如下数据:实现如下功能1,即新增一列求累计值:实现如下功能2,即新增一列求当月累计值:建表与插入数据sql:SET NAMES utf8m...

2019-06-02 21:55:08 1856

原创 pandas数据读取与存储

数据读取与存储1常用数据的读取1.1读取csv文件1.2使用read_table读取数据1.3读取mysql数据(未使用ssh通道)1.4读取excel数据1.5读取Mongodb数据1.6读取api接口数据2.常用数据的存储2.1写入csv文件2.2写入excel文件2.3写入数据库中1常用数据的读取1.1读取csv文件import pandas as pd例:data= pd.read...

2019-05-08 21:34:50 7081

原创 【活动分析】某电商双十一活动分析报告

某电商双十一活动分析报告1营收总述1.1营收结构1.2营收趋势1.3订单构成1.4订单趋势1.5用户结构2商品分析2.1订单价格区间分布2.2各价格区间销售量及销售额分布2.3各类商品订单数2.4各类商品销售额2.5商品二八法则3用户分析3.1地理分布3.2订单付款时长3.3购买力Top153.4终端分析3.5合作伙伴4总结本报告旨在汇报某电商双十一前后两个月的营收概况。1营收总述1.1营收...

2019-02-12 19:52:40 4708 1

原创 【网站流量分析】某网站网站流量分析报告(CNZZ统计)

某网站流量分析报告1思维导图2流量分析2.1趋势分析2.2对比分析2.3当前在线3来源分析3.1来源分类3.2搜索引擎3.3搜索词3.4受访界面4访客分析4.1区域分布4.2运营商4.3终端4.4新老访客4.5忠诚度4.6活跃度4.7用户结构5结论与建议5.1结论5.2建议1思维导图2流量分析2.1趋势分析从最近7天的流量趋势来看,网站每天早上10点到下午5点这个时间段的访客最多,每天平...

2019-02-12 19:17:33 15563 1

原创 【用户运营】滴滴出行活动策划、用户成长体系、用户增长逻辑分析

滴滴出行活动策划、用户成长体系、用户增长逻辑分析1功能模块分析及产品介绍1.1功能模块1.2产品介绍2活动策划(以愚人节为例)2.1活动主题2.2活动目的2.3活动目标2.4活动资源2.5活动对象2.6活动规则2.7活动时间2.8活动推广2.9活动平台3用户成长体系3.1概念3.2滴币(积分)体系3.3会员体系3.3.1快车3.3.2礼橙专车3.4滴币和会员体系总结与疑惑4用户增长4.1用户增长逻...

2019-02-12 12:27:18 14955

原创 【竞品分析】摩拜和ofo竞品分析报告

摩拜和ofo竞品分析报告1竞品分析思维导图2背景3竞品选择4市场分析4.1行业生命周期4.2宏观环境分析4.2.1政策4.2.2经济4.2.3社会4.3竞争分析4.3.1竞品信息4.3.2品牌热度4.3.3需求图谱4.3.4资讯关注度4.3.5用户搜索地域分布4.3.6用户年龄结构分布5产品分析5.1下载量5.1.1安卓端5.1.2ios端5.2用户场景5.3微博推广5.4产品体验5.4.1启动界...

2019-02-12 10:14:41 2125

原创 vmware12安装ubuntu16.04问题汇总

环境:windows10 64位笔者今天在使用vmware安装ubuntu16.04的时候出现下列错误: Failed to initialize policy for cpu: 0 (-19),刚开始还以为是镜像文件出现了问题,结果发现是vmware版本的问题。产品密钥自己找吧,一大堆。vmware 12:只能安装ubuntu14.04 vmware 14:才能安装ubuntu16....

2018-06-01 21:55:30 2217

原创 python脚本开机自启

问题描述:将python脚本设置成开机自启。环境:windows7 64位    前段时间,一直想把文件打包成exe文件,然后设置成开机自启,虽然感觉很装逼,但是使用pyinstaller打包成exe文件的历程却是非常坎坷,一改脚本或者导入一个新的库,打包就出现各种报错,各种问题,最后博主实在找不到解决办法之后放弃了,谁知突然间却看到有博客说能直接把py程序设成开机自启,真是开心,下面说明一下操作...

2018-05-25 11:05:48 13013 1

原创 pyinstaller no module named “”

环境:(1)window7 64位(2)pyinstaller

2018-05-21 19:40:33 15126

原创 python数据分析

利用python进行数据分析 第三章学习总结

2017-08-18 10:31:12 462

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除