自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(48)
  • 收藏
  • 关注

原创 搭建数据指标体系(抖音)

文章目录一、搭建指标体系的意义二、如何搭建指标体系1. 选择关键指标(北极星指标)2. 从AARRR模型出发搭建产品基本指标体系3. 基于业务/产品模块所属类型搭建指标一、搭建指标体系的意义好的指标可以指导产品和业务的发展,梳理业务关系,搭建指标体系的主要目的有:确定北极星指标,统一各团队的发展方向,定量衡量公司业务的好坏;搭建完善的产品数据监控看板,监控业务情况,及时发现业务问题,评估业务中可以改进的地方;统一指标口径“你无法衡量的你就无法管理”。只有明确好指标和目标,才能真正的实现用数据

2022-05-17 19:25:27 2917

原创 支付宝营销策略效果分析 A/Btest

文章目录一、项目背景A/B test的流程二、分析过程2.1 数据预处理2.2 计算样本量是否满足最小样本数2.3 实验评估-假设检验方案2的点击率是否显著提升三、结论一、项目背景A/B test在评估不同项目的效果和优劣时由非常大的作用,在目前的互联网领域得到了广泛的应用,本分析以支付宝某次营销活动为例,分别统计两组营销方案的点击率,通过A/B测试计算比较两种策略的投放效果。数据来源于阿里云天池Audience Expansion Dataset在本次分析中,我们只使用到effect_tb.cs

2022-05-10 12:37:05 932

原创 A/B test 总结

A/B test是一种通过制定两个方案,在同一时间段分别让**成分相同(相似)**的用户群随机使用一个方案,收集各群组的用户体验数据和业务数据,最后根据显著性检验分析评估出最好版本正式采用。01 A/B test的目的1、 判断哪个更好2、计算收益,ROI02 A/B test的一般流程与PM沟通,分析现状,确定改进点;确认观测指标,即是否成功的标准;设计优化版本的原型并完成开发;确定测试时长:时长不宜过短,会导致测试用户全为高频率用户;确定实验流量:分流要保证同时性和相似性;测试并收

2022-01-21 14:10:10 492

原创 SQL基础入门【4】函数

教程参考:菜鸟教程datawhale-wonderfulsql 3.3 各种各样的函数数学函数ABS – 绝对值语法:ABS( 数值 )ABS 函数用于计算一个数字的绝对值,表示一个数到原点的距离。当 ABS 函数的参数为NULL时,返回值也是NULL。MOD – 求语法:MOD( 被除数,除数 )MOD 是计算除法余数(求余)的函数,是 modulo 的缩写。小数没有余数的概念,只能对整数列求余数。注意:主流的 DBMS 都支持 MOD 函数,只有SQL Server 不支持

2021-12-14 21:00:59 519

原创 【数据分析】电商平台入驻商用户画像分析

电商平台入驻商数据分析思路1.1 互联网电商平台入驻商数据分析的一般思路获得数据 :前台数据(价格、销量、关键词,需要通过爬虫获得)+后台数据(广告数据、订单数据。平台提供的接口,入驻商自用统计软件,卖家报表界面)分析业务需求 :选品需求(从供应商联系货源,贴牌销售:打造自己的品牌or白牌销售:低价销售)(需要从用户偏好来反馈选品)、运营需求、营销需求产生数据成果 : 用户画像、商品画像、自动化程序/算法亚马逊前台数据落地页可以看到商品的图片,名称,评分,价格,颜色,尺码,买家

2021-12-08 20:24:17 3766 1

原创 【三节课数据分析】ch3.数据分析的九种方法

文章目录01 对比分析比什么?02 多维度拆解案例说明 数据涨跌如何处理03 漏斗观察案例常见的渠道划分方式渠道质量跟踪04 分布情况常见的群体划分05 用户留存的分析方法一般的计算方式案例某批漫画对付费会员转化的效果评估(漏斗分析、用户分群)某一主播对产品价值的影响(精准留存对比)上线以探索更长期的产品潜力06 用户画像6.1 标签有哪些?6.2 标签从哪儿来?6.3 案例高质量拉新07 归因查找末次归因递减归因首次归因案例 精准运营运营资源盘活用自动化的方法推送与用户有关的内容08 路径挖掘09 行为序

2021-12-03 12:01:38 4873

原创 SQL中的时间函数

DATE(date) #提取日期或日期/时间表达式的日期部分,date参数是合法的日期表达式。## DATE('2008-11-11 13:23:44.657') ## 2008-11-11 DAY() #返回一个整数值,表示指定日期的月份中的第几天## DAY('2008-11-11 13:23:44.657')## 11时间差DATEDIFF(date1, date2):# 前-后#得到的结果是date1与date2相差的天数。#如果date1比date2大,结果为正;如果

2021-12-01 22:40:40 2666

原创 【三节课数据分析】ch1.指标建模

指标建模对当前业务有参考价值的统计数据。在开始之前,先用一个例子说明,如何用数据指导业务。小明在某便利店工作,一天,老板让小明想办法让总销售额提高20%。总销售额是什么? GMV = 客单价 * 付费人次因此有两种途径可以提高总销售额:一是提高客单价,显然不合理,但小明发现最近购买饮料的人很多;二是增加付费人数(付费单数)小明通过记正字的方法记录路过人数和进店人数及消费人数,之后慢慢发展成用计数器…excel计算。小明发现,现在的路过人数-进店人数的转化率为5%,进店人数-付费人数的转化率为

2021-12-01 17:02:48 1446

原创 七周成为数据分析师 第一周:数据分析思维

视频链接:【秦路】七周成为数据分析师《第一周:数据分析思维》数据课件及数据—链接:百度云链接提取码:io6g数据分析的三种思维结构化在做数据分析的过程中,我们往往会出现想到一点是一点的感觉,一次性分析,没有复用性,比如下面这个例子。现在有一个线下销售的产品。我们发现8月的销售额度下降,和去年同比下降了20%。我想先观察时间趋势下的波劢,看是突然暴跌,还是逐渐下降。再按照丌同地区的数据看一下差异,有没有地区性的因素影响。我也准备问几个销售员,看一下现在的市场环境怎么样,听说有几家竞争对手也缩

2021-09-01 22:07:05 536

原创 力扣数据库(end09.02)

175 组合两个表表1: Person+-------------+---------+| 列名 | 类型 |+-------------+---------+| PersonId | int || FirstName | varchar || LastName | varchar |+-------------+---------+PersonId 是上表主键表2: Address+-------------+---------+|

2021-09-01 17:08:47 276

原创 【2021.08】python会员数据化运营task2

基于RFM的精细化用户管理1.案例背景对用户进行分组可以更好的了解用户价值。本案例使用某企业四年的家电订单数据,使用RFM模型对用户进行分组,基于业务部门的用户分群需求,我们计划将RFM的3个维度分别作3个区间的离散化,这样出来的用户群体最大有27个。从交付结果看,给业务部门做的分析结果都要导出成Excel文件,用于做后续分析和二次加工使用。另外,RFM的结果还会供其他模型的建模使用,RFM本身的结果可以作为新的局部性特征,因此数据的输出需要有本地文件和写数据库两种方式。本节案例选择了4年的订单数据

2021-08-31 14:31:03 295

原创 【2021.08】python会员数据化运营task01

文章目录学习目的学习目的1、了解企业数据化运营中,运用数据工具对会员进行运营的思路和方法2、了解RFM模型的运用3、掌握Python处理数据的技巧4、掌握EXCEL表的可视化图表及透视工具

2021-08-22 23:14:26 691

原创 MySQL基础入门【#】习题篇18 - 34

文章目录18 列出薪水比smith多的所有员工信息19 列出所有"CLERK"(办事员)的姓名及其部门名称,部门的人数.20 列出最低薪金大于1500的各种工作及从事此工作的全部雇员人数21 列出在部门"SALES"<销售部>工作的员工的姓名,假定不知道销售部的部门编号.MySQL下载请查看:MySQL基础入门【1】下载与使用Part1笔记:MySQL基础入门【2】Part2笔记:MySQL基础入门【3】动力节点入门视频链接:MySQL基础入门-mysql教程-数据库实战(MySQL

2021-08-13 21:23:45 168

原创 MySQL基础入门【#】习题篇1-17

文章目录01 取得每个部门最高薪水的人员名称02 那些人的薪水在部门的平均薪水之上03 取得部门中(所有人的)平均薪水等级04 不准用组函数,取得最高薪水05 取得平均薪水最高的部门编号(两种方法)06 取得平均薪水最高的部门的部门名称07 求平均薪水等级最低的部门的部门名称08 取得比普通员工(员工代码没有出现在mgr字段上的)最高薪水还要高的领导人姓名09 取得薪水前五名的员工10 取得薪水第六到第十的员工11 取得最后入职的5名员工12 取得每个薪水等级有多少员工MySQL下载请查看:MySQL基

2021-08-13 01:06:55 175

原创 MySQL基础入门【3】

文章目录13 补充知识,查询结果的去重14 连接查询14.1 什么是连接查询?14.2 连接查询的分类?14.3 基础知识补充,表的别名14.4 内连接等值连接非等值连接自连接14.5 外连接14.6 三张表怎么连接查询?15 子查询15.1 什么是子查询?子查询都可以出现在哪里?15.2 where 子句中使用子查询15.3 from后面嵌套子查询15.4 在select后面嵌套子查询16 union16.2 规则17 limit (重要!)17.1 语法机制17.2 sql的分页机制17.3 limit

2021-08-12 20:46:19 151

原创 MySQL基础入门【2】

文章目录01登陆02 sql DB DBMS分别是什么,他们之间的关系03 什么是表3.1 SQL语句的分类04 导入数据05 对SQL脚本的理解06 查看表的结构和数据结构6.1 表中的数据07 常用命令7.1 创建数据库7.2 select database(); 查看当前使用的是哪个数据库7.3 select version(); 查看mysql的版本号。7.4 终止一条语句命令7.5 退出mysql7.6 查看创建表的语句08 简单查询语句(DQL)8.1 语法格式:8.2 示例09 条件查询9.1

2021-08-12 20:25:49 165

原创 MySQL基础入门【1】MySQL下载与使用

文章目录Mysql下载与使用下载安装初次使用笔记内容参考动力节点MySQL入门课程学习,b站视频链接:MySQL基础入门-mysql教程-数据库实战(MySQL基础+MySQL高级+MySQL优化+MySQL34道作业题)Mysql下载与使用下载参考链接:小白入门:MySQL超详细安装教程(mac版)茶拉斯图拉突然发现不知道之前下载什么东西的时候安装了迅雷,迅雷是真的快啊。1.打开官网进入macOS系统版本Download MySQL Community Serverdev.mysql.com

2021-08-12 19:18:03 159

原创 【2021.07】datawhale组队学习李宏毅 总结

文章目录01机器学习介绍02 回归step1:modelstep2:评价一个模型的好坏step3:使用gradient descent进行优化优化03 误差估测方差和偏差偏差 v.s. 方差04 训练集划分交叉验证N-fold cross validation05 gradient descent06 深度学习step1:神经网络step2:模型评估step3:选择最优函数0708 卷积神经网络CNN特征CNN架构对这一期的组队学习内容进行总结梳理。01机器学习介绍【2021.07】datawhale

2021-07-25 23:16:26 387 1

原创 【2021.07】datawhale组队学习李宏毅task06

本笔记为datawhale7月组队学习笔记,视频链接:李宏毅《机器学习》 p21 李宏毅《机器学习》 p21 卷积神经网络开源文档:卷积神经网络文章目录为什么用CNN?small regionSame patternsSubsamplingCNN架构ConvolutionProperty 1Property 2convolution 和 fully connected之间的关系Max poolingFlattenCNN in KerasCNN学到了什么?分析全连接层让图更像数字Deep DreamDee

2021-07-25 00:28:05 138

原创 【2021.07】datawhale组队学习李宏毅task05

文章目录Small gradient如何分辨local minima 和 saddle point?为什么我们想要知道是卡在local minima 还是 saddle point呢?Warning of MathTayler Series Approximation如果卡在saddle pointBatch and Momentumsmall batch v.s. large batchLarger batch size does not require longer time to compute gr

2021-07-21 23:47:35 155

原创 【2021.07】datawhale组队学习李宏毅task04

文章目录深度学习的发展趋势深度学习的三个步骤Step1:神经网络完全连接前馈神经网络全链接和前馈的理解深度的理解矩阵计算本质:通过隐藏层进行特征转换示例:手写数字识别Step2:模型评估Step3:选择最优函数反向传播思考隐藏层越多越好?普遍性定理本笔记为datawhale7月组队学习笔记,视频链接:李宏毅《机器学习》 p13深度学习开源文档:深度学习深度学习的发展趋势回顾一下deep learning的历史:1958: Perceptron (linear model)1969: Perce

2021-07-17 22:27:08 158

原创 【2021.07】datawhale组队学习李宏毅task03

文章目录误差的来源估测bias和variance估测估测x的偏差和方差评估x的偏差估测x的方差多个f不同模型的方差不同模型的偏差偏差v.s.方差误差来自方差还是偏差?偏差大-欠拟合方差大-过拟合模型选择交叉验证N-fold cross validationgradient descentadaptive learning rateAdagrad 是什么?Adagrad举例多参数下结论不一定成立进一步的解释随机梯度下降法特征归一化warning of math泰勒展开式梯度下降的限制Gradient Desc

2021-07-16 23:38:36 180

原创 【2021.07】datawhale组队学习李宏毅task02

文章目录回归定义和应用例子回归定义应用举例模型步骤step1:模型假设单个特征:一元线性模型多个特征:多元线性模型step2: 模型评估 goodness of function1、收集和查看训练数据2、定义模型的好坏step3:最佳模型 - 梯度下降如何筛选最优的模型(参数w,b)梯度下降推演最优模型的过程梯度下降在实际应用中面临的挑战w和b偏微分的计算方法如何验证训练好的模型的好坏更加强大复杂的模型:1元N次线性模型过拟合问题出现步骤优化更多的input正则化总结案例此文章为datawhale2021

2021-07-14 22:43:08 211

原创 【2021.07】datawhale组队学习李宏毅task01

文章目录机器学习介绍hand-crafted rules监督学习regressionclassificationstructured learning选择模型半监督学习迁移学习无监督学习强化学习课程提示为什么要机器学习机器学习介绍hand-crafted rules河狸天生的能力就是筑水坝,用程序语言来描述就是:if 河狸听到水流声then 河狸开始筑水坝直到听不见流水声这里的要求只有听到水流声,因此生物学家可以通过播放水流声的方式来欺骗河狸筑水坝。我们模仿这种方式来做一个chat-box,在

2021-07-13 00:12:54 219 2

原创 Task2个人网站的搭建

文章目录01 项目创建1.1地址配置1.3 创建超级管理员1.4 修改后台语言1.5 创建表1.6 添加到后台2 修改页面逻辑2.1 添加页面模板文件夹2.2 添加文章详情页面03 部署3.1 安装 PyMysql3.2 修改 Settings.py 文件01 项目创建1.1地址配置先启动虚拟环境+打开宝塔的界面注意一下之前跟着视频安装的mysql版本是5.5,现在要改成安装8.0。在网站子菜单栏中选择添加站点设置内容忘记截图了,记得截图一下数据库的用户和密码。用户:blog密码:同宝塔

2021-06-21 01:25:15 119

原创 datawhale组队学习Django—day00&day01

文章目录基础软件安装UbuntuUbuntu内操作ssh连接什么是sshubuntu安装ssh服务启动服务器的SSH服务ssh本地连接ubuntuvscode部署ubunturemote - SSH安装连接ubuntupython环境vscode在ubuntu写代码环境配置代码运行Django环境配置Django简单使用环境再检查Python基础知识数据类型流程控制函数HTML基础HTML文件基本组成通过宝塔上传已有的文件基础软件TyporaVmware 虚拟机Ubuntu 镜像Vscode向

2021-06-16 23:20:09 99

原创 智慧海洋——task2 数据分析

task2 数据分析2.1 学习目标学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值、异常值)学习了解变量之间的相互关系、变量与预测值之间的存在关系。完成相应学习打卡任务2.2 内容介绍数据总体了解读取数据集并了解数据集的大小,原始特征维度;通过info了解数据类型;粗略查看数据集中各特征的基本统计量缺失值和唯一值查看数据缺失值情况查看唯一值情况数据特性和特征分布三类渔船轨迹的可视化坐标序列可视化三类渔船速度和方向序列可视化三类

2021-04-17 02:11:07 381 2

原创 第七章 缺失数据

第七章 缺失数据一、缺失值的统计和删除1、缺失信息的统计缺失数据可以用isna或isnull(两个函数没有区别)来查看每个单元格是否缺失,通过和sum的组合可以计算出每列缺失值的比例:df = pd.read_csv('joyful-pandas/data/learn_pandas.csv', usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight', 'Transfer'])df.isna().head()GradeName

2021-01-03 23:15:02 256

原创 综合练习

综合练习????:http://datawhale.club/t/topic/579【任务一】企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标:其中 p(xi) 是企业该年某产业收入额占该年所有产业总收入的比重。在company.csv中存有需要计算的企业和年份,在company_data.csv中存有企业、各类收入额和收入年份的信息。现请利用后一张表中的数据,在前一张表中增加一列表示该公司该年份的收入熵指标 I 。【数据下载】链接:https://pan.

2021-01-01 23:55:13 170

原创 第六章连接

第六章 连接一、关系型连接1、连接的基本概念把两张相关的表按照某一个或某一组键连接起来是一种常见操作,这个键十分重要,往往用on参数表示。另一个重要的要素是连接的形式,连接函数merge和join中提供了how参数来代表连接方式,分为左连接left、右连接right、内连接inner、外连接outer,它们的区别可以用如下示意图表示:左连接:以左边的键为准,如果右边表中的键存在于左边,则将该键在右边中的值添加到左表中,否则处理为缺失值。右连接:以右边的键为准。内连接:只合并两边同时出现的键。

2020-12-29 23:48:57 241

原创 第五章 变形

第五章 变形一、长宽表的变形一个表中把性别存储在某一个列中,那么它就是关于性别的长表,如果性别的值包含在列名中,列中的元素是某一其他的相关特征数值,那么这个表是关于性别的宽表。也可以理解为,就性别这一特征来说,长表的一行数据量少,行数多,宽表的一行数据量大,行数少。下面的两张表就分别是关于性别的长表和宽表:pd.DataFrame({'Gender':['F','F','M','M'], 'Height':[163, 160, 175, 180]})# Gender Height# 0 F

2020-12-27 23:43:33 144

原创 第四章 分组

第四章 分组一、分组模式及其对象1 、分组的一般模式想要实现分组操作,必须明确三个元素:分组依据、数据来源、操作及返回结果,分组代码的一般模式即:df.groupby(分组依据)[数据来源].使用操作依据性别分组,统计全国人口寿命的平均值:df.groupby('Gender')['Longevity'].mean( )按照性别统计身高中位数:df = pd.read_csv('joyful-pandas/data/learn_pandas.csv')df.groupby('Gender'

2020-12-25 23:44:03 369

原创 第三章 索引

第三章 索引一、索引器1、表的列索引通过类似字典标记的方式或属性的方式,可以将DataFramed的列获取为一个Series。只取出一列 frame2['state'],列名中不包含空格时,可以直接用.loc取出:frame2.state取出多个列 则可以通过[列名组成的列表],得到一个DataFrame2、序列的行索引以字符串为索引的Series (也可以理解为必须给索引的值的显示索引)只取出单个索引 使用[item],得到该item对应的所有值取出多个索引 使用[item的列表]

2020-12-22 20:19:57 409

原创 Pandas基础

pandas 基础一、文件的读取和写入1、文件读取pandas将表格型数据读取为DataFrame,其中最常用的是read_csv,read_table,read_excel函数说明read_csv默认分隔符为逗号read_table默认分隔符为制表符read_excel读取xls或xlsx文件这些函数有一些常用的公共参数header=None: 表示第一列不作为列名,默认为Trueindex_col: 指定某一列或某几列为索引usecols:指定

2020-12-19 22:33:43 280 1

原创 Matplotlib介绍

Matplotlib介绍01 Matplotlib介绍一、介绍需要注意的是:pylab在ipython环境中才能做出图像,如果使用的是Jupyter,需要输入更多的命令。二、几个????生成一个简单的图Figure和Subplot最简单的创建figure以及axes的方式是通过`pyplot.subplots`命令,它可以创建一个figure,并返回一个含有已创建的subplot对象的Numpy数组。创建axes以后,可以使用`Axes.plot`绘制最简易的折线图。可以用`plt.figure`创建一个新

2020-12-14 23:58:49 1182 2

原创 git使用及Github

Git学习下载git使用初始创建版本库把文件添加到版本库文件修改后再提交版本回退版本管理工作区和暂存区的概念撤销修改主要学习资料:[廖雪峰Git学习教程]git官方手册下载官方下载链接????我使用的是mac,mac的下载方式还挺多的git使用初始git version#查看git的版本,同时也可以确定git是否安装成功git config --global user.email "[email protected]"git config --global user.name "Yo

2020-10-21 15:35:05 234

原创 老图搬砖day10——EL+JSTL

目录10.1 EL10.2 JSTL今天上午的时间都留给做昨天的题目了,所以今天的内容很少,也没有课后作业。10.1 ELExpression language 表达式语言可以简化对变量或对象的访问表达方式为${变量或对象}<%= request.getAttribute("error")==null? "" : request.getAttribute("error")%&gt...

2020-08-13 23:01:19 109

原创 老图搬砖day9——Servlet

目录9.1 Servlet基础9.1.1 基础9.1.2 Servlet的配置9.1.3 乱码解决9.2 进阶9.2.1 Servlet的生命周期9.2.2 get和post9.2.3 页面的跳转服务器跳转和客户端跳转的区别9.2.4 Servlet作用域9.1 Servlet基础Server + let 服务器端小应用程序Servlet 是一个Java程序,是驻留在服务器端,运行以处理客...

2019-08-21 09:26:53 151

原创 老图搬砖day09——Servlet+mySQL+JSP完成简单页面登陆注册

这里写自定义目录标题题目描述sql部分题目描述使用MySQL数据库建立数据库名称:jsp建立数据表:inf(id,name,pwd,age,gender)create table inf(id int primary key auto_increment, name char(20) not null, pwd char(20) not null, age int not nul...

2019-08-20 10:56:56 268

原创 老图搬砖day08——c3p0&Java Web

文章目录8.1 c3P0连接池8.1.1 导入jar包8.2 Web项目基础8.2.1 B/S相对于C/S的优势8.2.3 动态网站和静态网站8.3 Tomcat的安装与配置8.3.1 安装8.3.2 Tomcat目录介绍8.3.3 tomcat的常用配置8.4 Java Web项目开发过程8.4.1 创建一个Web项目8.4.2 设计Web项目的目录结构8.4.3 编写Web项目的代码8.4.4...

2019-08-18 22:07:18 205

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除