2 吴呆槑

学生身份

我要认证

新手一枚,欢迎交流分享

等级
TA的排名 30w+

学习笔记——使用HiveSql建表

创建数据库create database frog_db;删除数据库drop database frog_db cascade;cascade 可以强制删除非空数据库;慎用创建数据表create table student(id int comment 'id',name string comment '姓名',score decimal(30,6) comment '成绩')stored as textfile; stored as textfile:指定表数据文件存储格式查

2020-10-18 16:58:43

学习笔记——Hive的进入和退出以及HiveSql 的运行方式

Hive的基本使用进入hive窗口输入hive即可进入hive窗口退出输入 exit;hiveSql 的两种运行方式直接在hive窗口中执行 sql 语句使用 shell 脚本执行 sql 语句方法一:hive -e 直接执行sql语句, hive -v -e 的v表示展示log信息​ 适用于当想把sql语句自动化执行时,就可以写成shell 脚本的方式,然后通过调度平台调用shell 脚本即可,是常用的一种方式。进入hive,运行后自动退出hive#!/bin/shhive -

2020-10-18 15:10:31

学习笔记——数据仓库基本介绍

数据仓库基本介绍数据仓库基本定义定义区别数据仓库的定义与特点数据仓库的组成与分层组成分层数据仓库的建模范式建模维度建模维度建模的三种模式实例数据仓库基本定义定义数据仓库 ( Data Warehouse ) 简称 DW 或 DWH ,是数据库的一种概念上的升级,是为企业所有级别的决策制定过程,出于分析性报告和决策支持目的而创建。区别操作型数据库业务支撑细节数据日常收录量少频率高分析型数据库历史数据汇总数据定期更新量大频率低数据仓库的定义与特点数据仓库的组成

2020-10-12 16:38:08

学习笔记——数据分析在电商行业常用的分析方法

电商行业分析方法细分思想与“人——货——场”“人—货—场”能够为人提供宏观视野的分析。其原理类似于分类分析,即将所有需要被分析到的数据单元,打上“人”“货”“场”的标签,然后再进行相应的数据分析与处理。在实际应用场景中,‘人—货—场’分析法往往被灵活运用在初步诊断某一竞品店铺分析"ABC分析法"商品ABC分级的关键指标是 “支付转化率”“商品库存”, 根据这两个指标所制定的分级逻辑,以判定商品是属于哪一级的。商品的ABC分级法需要将分析颗粒精细到每个款式,分析相对繁杂,所以一般只有在店铺进行大型促销活动时才

2020-09-11 21:03:44

学习笔记——关于数据分析在电商行业中的常用业务指标

电商业务指标体系运营部门职能: 首先是负责达成整个品牌的业绩目标;指标:一般衡量业绩使用GMV、业绩达标率、业绩增长率、销售利润额四个指标来进行综合评估。使用毛/净利润率、销售利润额、折扣、营销推广费用来评估成本。运营模块分析指标商品部门职能: 商品模块 主要分为商品企划与商品运营。

2020-09-11 15:31:17

学习笔记——pandas入门

1.DataFrame 的创建多维列表创建数组字典创建import pandas as pdarray = [[1,2,3],[3,4,5]]df = pd.DataFrame(array)df 0 1 2 0 1 2 3 1 3 4 5 type(

2020-09-09 00:29:47

学习笔记——数据分析的方法

数据分析方法对比分析定义对比分析是给一个孤立的指标找到一个判断标准,因为一个孤立的指标是没有任何实际指导意义的。对比分析的目的在于找出差异后进一步挖掘差异产生的原因,从而找到优化的方法。对比分析在于看出基于相同数据标准下,由其他影响因素所导致的数据差异。分析的步骤1、找出主要因素进行对比如果要对比不同渠道吸引用户的效果,那就需要找出各个渠道的用户访问量、点击量、注册量等指标2、进行多维度的对比寻找合适的维度进行对比,例如时间、空间、目标等3、对比指标要逻辑一致对象要相似,比如说北

2020-09-08 23:30:41

学习笔记——关于数据分析在电商、金融及游戏行业的应用

数据分析在各个行业的应用01电商行业的数据分析用户行为流程获取用户:首先产品会通过一些广告,微信群链接等进行宣传,用户看到后会进行点击,如果符合他的预期,就会进行下载和注册(如果是小程序就是关注和注册,如果是平台商铺就是点击商品),到这一步就相当于获取到了用户了。产生付费:用户对商品进行浏览,并且加入购物车,进行购买或者不购买常见指标11、PV/UV(点击率/浏览率):统计宣传的曝光情况2、新用户数新增、及渠道占比情况3、注册转换比率情况4、不同渠道获客留存情况常见指标2

2020-09-08 17:41:07

学习笔记——数据分析中指标体系的相关内容

数据分析指标体系01数据分析指标体系的组成数据指标的三要素指标意义:怎么用大白话说出来这个指标,它的目的是什么统计时间:指标具有时间性,需要明确是什么时间段的数据计算规则:是比例还是总数,是谁比谁还是谁加谁数据指标的组成主指标:主指标也叫核心KPI,是用来评价成果最直接的指标。例如判断一个产品卖的好不好,第一个想到的就是销售额是多少。注意主指标有可能需要多个,这样才能做综合评价。比如产品卖的好,光看金额还不够,可能还要看毛利率,这才是真正赚到的钱。可能还得看销售数量,因为销售数量和

2020-09-08 15:05:43

关于使用conda activate无法进入虚拟环境 CommandNotFoundError: Your shell has not been properly configured to use

问题描述:可以使用conda env list 查看所有虚拟环境(frog_36) C:\Users\User> conda env list# conda environments:#base C:\Users\User\Anaconda3frog_36 * C:\Users\User\Anaconda3\envs\frog_36但是无法进入某个虚拟环境C:\Users\User>conda activat

2020-08-23 14:06:34

学习笔记——创建虚拟环境

创建指定python版本的虚拟环境格式:conda create -n 环境名 python=3.6 (版本号可以任意指定)虚拟环境命令查看当前所有虚拟环境conda env list查看当前所拥有的包conda list进入虚拟环境activate 环境名退出当前虚拟环境conda deactivate-删除虚拟环境conda remove -n 环境名 --all...

2020-08-17 16:19:08

练习——MySQL 查询

基础题数据准备先创建student和score表,添加基本数据,用于查询演练创建student表SQL代码如下create table student(id int(10) not null unique primary key,name varchar(20) not null,gender varchar(4),birth year,department varchar(20),address varchar(50));创建score表SQL代码如下:create tab

2020-08-14 15:55:18

练习——MySQL数据库操作

基础题关系型数据库核心元素有哪些?数据行数据列数据表(数据行的集合)数据库(数据表的集合)使用命令行连接数据库服务器的命令是什么?mysql -u用户名 -p密码或mysql -u用户名 -p回车后输入用户名列出数据库的命令查看所有数据库show databases;使用数据库use 数据库名;查看当前使用的数据库select database();创建数据库create database 数据库名;删除数据库dorp database 数据

2020-08-13 23:04:57

学习笔记——python文件操作

文件操作:打开文件,关闭文件在python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件打开文件:open(‘文件名’,‘访问模式’)需要添加文件的路径,默认在当前路径示例f=open(r"C:\Users\data\...\test.txt","w") # r 表示后面的内容不转义关闭文件:文件名.close()f.close()常见的文件访问模式访问模式说明r以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。w

2020-08-12 00:44:15

学习笔记——Python 模块函数

模块函数模块 就好比是 工具包,要想使用这个工具包中的工具,就需要 导入 import 这个模块在模块中定义的 全局变量 、 函数 都是模块能够提供给外界直接使用的工具用处在一个 Python 文件中定义 变量 或者 函数,然后在另外一个文件中使用 import 导入这个模块。导入之后,就可以使用 模块名.变量 / 模块名.函数 的方式,使用这个模块中定义的变量 或者 函数注意:模块名也是标识符:由字母、下划线 和 数字 组成,不以数字开头,不与关键字重名示例# 建立 info.py 文

2020-08-09 23:28:03

学习笔记—— Python 定义函数

函数的定义定义函数的目的:增加代码的重用性,避免冗余。函数的定义:把 具有独立功能的代码块 组织为一个整体,在需要的时候 调用函数的使用包含两个步骤:定义函数 —— 在函数中编写代码,实现功能调用函数 —— 执行编写的代码函数调用不能放在 函数定义 的上方!使用函数名 调用函数之前,必须要保证 Python 已经知道函数的存在格式def 函数名(): 函数的封装代码 ...函数名 的命名规则可以由 字母、下划线 和 数字 组成不能以数字开头不能与关键字重

2020-08-09 20:31:03

学习笔记—— python变量 字典

Python变量 字典字典的定义字典的常用操作增加删除元素修改查询字典的遍历总结字典的定义字典dictionary用 {key:value,…} 定义字典使用键值对**{key : value}**存储数据,键值对之间使用 , 分隔键 key 是索引:注意 索引不再是 0,1,2… 了,虽然可以用数字,但是一般使用字符串键 和 值 之间使用 : 分隔键必须是唯一性:如果有多个,后者会覆盖前者键 只能使用字符串、数字型或元组值可以取任何数据类型xiaoming = {"name": "小

2020-08-08 22:02:09

学习笔记——python 变量 元组

元组Tuple元组与列表类似,但是是用 () 定义,且元组的元素不能修改元组 表示多个元素,可以是不同类型的数据,组成的序列。用于存储 一串 信息,数据 之间使用 , 分隔元组中 只包含一个元素 时,需要 在元素后面添加逗号,不加就不是元组了元组的索引从0开始索引 就是数据在 元组 中的位置编号元组常用操作修改(修改列表或字典)元组中的元素无法修改除非,元组中的元素如果为列表/字典,则可以修改列表/字典中的元素的值a = [1,1] # 列表tuple1=(

2020-08-08 01:41:52

学习笔记——Python变量 列表

Python变量 列表列表列表的常用操作增加元素删除元素修改元素:直接指定索引赋值,就是修改元素内容修改元素元素排序关于列表的循环列表List(列表) 是 Python 中使用最频繁 的数据类型,在其他语言中通常叫做数组列表专门用于存储 一串信息,每一个信息称为元素列表用 [ ] 定义,数据 之间使用 , 分隔列表的索引从0开始索引是数据在列表中的位置编号,也可以称为下标定义列表>>> list = [1,2,3,4,5]>>> prin

2020-08-08 00:47:59

学习笔记——Python的while 循环语句

while 循环的基本使用循环的作用就是让指定的代码重复的执行,或直到满足条件后退出循环while 循环最常用的应用场景就是让执行的代码按照指定的次数重复执行基本语法变量设置初始值while 条件(判断 变量是否满足条件): 条件满足时执行事件 a 条件满足时执行事件 b 条件满足时执行事件 c ...(省略)... 修改变量练习"""需求 —— 跟老婆承认错误,说五遍"老婆,我错了""""i=1while i <= 5:

2020-08-04 01:29:14

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv3
    勤写标兵Lv3
    授予每个自然周发布7篇到8篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。