自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(123)
  • 收藏
  • 关注

原创 如何展开一个专题分析报告

数据分析比较重要的是思维和业务理解,能够理解业务数据指标体系之间的关联,然后通过数据指标和分析报告的形式,将业务问题说明白,讲清楚。(4)、目前该车型原生完单订单中新老客完单情况和企业完单情况(维度:业务线,企业名称,客户分类;业务经验:如果没有业务经验,很多指标只是数字,我们在拿到一个分析任务的时候,要知道,要从哪些指标和维度来看这个问题。(1)、目前该车型的完单量和效率数据(维度:城市,完单车型,需求车型;维度:订单编号,用车日期,城市,业务线,客户分类,企业名称,完单车型,需求车型。

2023-10-19 14:42:19 180

原创 出行OTA渠道规则

2、资质审核:根据对接沟通中的平台线上所需要的资料进行提交和审核(一般平台都是只需要平台的大证和小证,个别平台需要车辆的行驶证、车辆的网约车证,数量不定,根据平台的要求提供)3、系统对接:需要平台和供应商进行技术对接,对接完成后,平台下单可以直接跳转到供应商的系统,实现下单,接单,数据传送等过程的自动化。预定规则主要包含订单类型、最小预约时间、最大预约时间、免费等待时间、免费取消时间、有损取消时间、取消费用、等待费用这9项内容。携程(携程包车)、飞猪、航旅、曹操、同程、12306、高德、美团、南航。

2023-10-16 15:57:02 281

原创 数据报表的质量

2、数据运维需要做好,保证数据的基数和准确。1、多培训,多沟通升级。

2023-10-13 15:25:48 75

原创 数据报表的种类

根据报表等情况,一般数据报表可以分为和,日常报表又分为和。

2023-10-13 15:08:05 372

原创 银行权益用车情况分享

【代码】银行权益用车情况分享。

2023-10-11 15:29:35 52

原创 DATETRUNC()

DATETRUNC() 日期格式进行处理select DATETRUNC(use_time,‘yyyymm’)from dwm_stg_order_all_info;Datepart parameter of function DATETRUNC ‘yyyymm’ is not supported yet, we only support ‘[dd, mm, yyyy, mi, ss, year, month, mon, day, hour, hh, ff3, q, w]’ now.select

2021-11-11 18:18:16 530

原创 concat

含义:将多个字符串连接成一个字符串。语法:concat(str1, str2,…) 返回结果为连接参数产生的字符串,如果有任何一个参数为null,则返回值为null。SELECT operat_dat,operat_time,concat(operat_date,' ',operat_time)FROM dw_price_adjust_log_info;operat_date operat_time _c220211019 18:27:00 20211019 18:27:0..

2021-10-27 15:52:10 138

原创 SQL中EXTRACT() 函数

EXTRACT()("提取"的意思) 函数用于返回日期/时间的单独部分,比如年、月、日、小时、分钟等等。就是返回出来具体的年,月,日2008-12-29 16:25:46.635SELECT EXTRACT(YEAR FROM OrderDate) AS OrderYear,EXTRACT(MONTH FROM OrderDate) AS OrderMonth,EXTRACT(DAY FROM OrderDate) AS OrderDayEXTRACT(year_monthFROM OrderD

2021-07-29 15:35:52 8481

原创 GET_JSON_OBJECT函数

GET_JSON_OBJECT用于解析JSON对象。语法:get_json_object ( json_string, path )例子:数据:event_kv_json"{"deviceId":"953e1dbd0868a1e6","$$_tracking_android_id":"953e1dbd0868a1e6","$$_os":"Android","ds":0,"order_type":"7","$$_com_type":"0","$$_log_type_flag":"thrift","$

2021-07-27 18:18:57 1757

原创 PERCENT_RANK 函数

与 PERCENT 函数类似,PERCENT_RANK 函数为窗口的 ORDER BY 子句所指定列中的值返回秩,但以介于 0 和 1 之间的小数形式表示,计算方法为 (RANK - 1)/(N- 1)。随着窗口在输入行中向下移动,会计算在窗口的 ORDER BY 子句中所指定的表达式的秩。当 ORDER BY 子句包括多个表达式时,若第一个表达式与相邻行具有相同值,则第二个及后续表达式将用于区分并列情况。NULL 值排在任何其它值的前面(在升序序列中)。示例1以下示例返回按性别显示 New York

2021-07-22 14:30:24 8093 2

原创 【阿里云】创建表并线下导入

创建表(两种方式)1、菜单式新建表阿里云–DataWorks–DataWorks首页–DataStudio–数据开发–业务流程–原始数据同步–表--杭州运营(相关文件夹)–右键–新建表创建表内容请选择引擎类型–MaxCoumpute表名**(必须英文)– dw_hz_city_target_info(可以根据公司自己的命名规则)中文名–根据需求填写添加字段–字段英文名,字段中文名,字段类型(这里注意字段类型一定要和上传表格中的字段类型保持一致)**2、命令式CREATE TABLE IF

2021-07-22 11:22:52 629

原创 python预测模型

####趋势外推预测:根据事物的历史和现实数据,寻求事物随时间推移而发展变化的规律,从而推测其未来状况的一种常用的预测方法。运用一个数学模型,拟合一条趋势线,然后用这个模型外推预测未来时期事物的发展。Tableau—选择拟合线(历史数据做折线图)–一元线性拟合出来的趋势线。####回归预测:根据自变量和因变量之间的相关关系进行预测的。回归问题的学习等价于函数拟合:选择一条函数曲线使其很好的拟合已知数据且能很好的预测未知数据。####组合预测:对同一个问题,采用多种预测方法。组合的主要目的是综合利

2021-07-20 10:34:59 2721

原创 SQL AND & OR 运算符

AND 和 OR 运算符用于基于一个以上的条件对记录进行过滤。AND 和 OR 可在 WHERE 子语句中把两个或多个条件结合起来。如果第一个条件和第二个条件都成立,则 AND 运算符显示一条记录。如果第一个条件和第二个条件中只要有一个成立,则 OR 运算符显示一条记录。例子1:选择优惠券开始有效期在2021年6月,并且城市为杭州或者西安。SELECT id,name,effective_begin,date(effective_begin) as 优惠券开始有效期,issue_count

2021-06-18 18:13:11 202

原创 SQL中时间相关函数

时间格式转化 函数:DATE()命令格式:DATE(datetime)用途:将datetime的格式转化为YYYY-MM-DD参数说明:时间格式转化 函数:DATETIME()命令格式:DATEtime(datetime)用途:将datetime的格式转化为YYYY-MM-DD HH:MM:SS参数说明:取现在的时间 函数:GETDATE()命令格式:GETDATE()用途:取当时的时间 取出来的时间格式为:yyyy-mm-dd hh-mm-ss参数说明:GETDATE后面

2021-06-16 14:57:10 3053

原创 SQL中in子句

(select distinct company_id,company_uic_no as 商户uid编号,company_name as 企业名称,city_name as 所在地,company_contact as 联系人,contact_phone as 联系人电话,create_time as 账户开通时间,nvl(admin_name,'') as BD姓名from dw_company_info_managewhere company_name not like 'OTA%'an

2021-06-10 17:24:35 329

原创 SQL中like子句

like操作符用于在where子句中搜索列中的指定模式。like操作符语法select column_name(s)from table_namewhere column_name like pattern原始的表(用在例子中的):例子1:现在,我们希望从上面的persons表中选取居住在以‘N’开始的城市里的人:select * from personswhere city like ‘N%’提示:‘%’用于定义通配符(模式中缺少的字母)结果:例子2接下来,我们希望从‘per

2021-06-10 17:22:27 150

原创 SQL中COUNT的用法

#COUNT功能功能:对计算对象进行计数处理格式:count()说明:一般与group by 一起使用注意:案例:计算不同日期的订单数量原表:order日期订单号1124324356156456451465414654334533445654select 日期,count(订单号) as 订单数from ordergroup by 日期结果表:日期订单数142131

2021-06-10 17:09:47 7799

原创 SQL中nvl函数

NVL空值判断函数,作用是如果判断的值为空,不会展现为/N格式,而转换为需要转换的格式类型#1、NVL(表达式A,表达式B)如果表达式A为空值,NVL返回值为表达式B的值,否则返回表达式A的值。该函数的目的是把一个空值(null)转换成一个实际的值。其表达式的值可以是数字型、字符型和日期型。但是表达式A和表达式B的数据类型必须为同一个类型。nvl(company_name,'') as 企业名称 如果企业名称为空,显示为空;否则返回company_namenvl(clue_num,0)如果c

2021-06-10 14:55:45 488

原创 关于df中的排序

python内置的sorted()和.sort() 都是稳定的排序方法。日期是索引,因为high这列可以有重复值,所以需求是按high列降序排列,如果遇到重复值,再按第二顺序也就是日期索引列进行升序排列。但是发现pandas的sort_values不支持一列升序,一列降序。有什么办法吗?df.sort_values([‘high’, ‘日序’], ascending=[False, True...

2019-03-19 15:14:22 9424

原创 关于行和列的操作

增加一行hangzhou = zhewan_score_original[zhewan_score_original.城市 == '杭州市']hangzhou_d = hangzhou.服务分.describe()hangzhou_d.loc['90分以下'] = len( hangzhou[hangzhou.服务分<90])hangzhou_d.loc['80分以下...

2019-03-14 18:38:55 266

原创 series转换成dataframe

在平时数据分析时,通过describe和groupby生成的统计数据,更多的时候是属于series格式的。而我们在后续的分析或者数据合并的过程中,我们往往需要将series格式转换成dataframe格式,往往存在以下两种情况单个的series转换成dataframe,其中也要将index去除索引,变成dataframe中的一列#生成序列,这里注意pd.Series的S一定要大写ser...

2019-03-14 16:28:18 24144 3

原创 python2和python3的区别

【1】print用法在python2中 print后面直接跟字符串,而在python3中字符串需要用小括号进行封装。#python2print 'nimen'#python3print ('nimen')【2】string中字母序列的表达方式在python2中用string.letters表示所有字母,在python3中用string.ascii_letters表示所有字母。s...

2018-10-09 19:11:00 193

原创 python核心编程第六章

6-1 字符串。string模块中是否有一种字符串方法或者函数可以鉴定一个字符串是否是另一个大字符串的一部分?#in/not in 可以判断一个字符串是否再另一个字符串中'bc' in 'abcd'Out[3]: True'bc' not in 'abcd'Out[4]: False6-2 字符串标识符。修改例6-1的idcheck.py脚本,使之可以检测长度为一的标识符,并且可以...

2018-10-09 19:04:22 265

原创 python核心编程第二版-第五章习题--自己写(欢迎批改)

第二题:操作符1/写一个函数,计算并返回两个数的乘积;2/写一段代码调用这个函数并显示它的结果def ji(a,b): return a*bji(2,6)第三题:标准类型操作符。写一段脚本,输入一个测验成绩,根据下面的标准,输出他的评分成绩(A-F).A:90~100B:80-89C:70-79D:60-69E:<60def fenshu(a): if...

2018-09-18 13:43:13 540

原创 jupter notebook安装

1、Mat 在他的课程中写道:“到目前为止,安装 Jupyter 最简单的方法是采用 Anaconda。” Anaconda 是为数据科学建立的一个软件包。由于这节课中已经有了 Jupyter Notebook Workspaces,所以并不一定需要在你的计算机上设置 Anaconda,但我们仍然建议最好设置一下。 2、还可以使用命令行的 pip 安装 Jupyter:如果不想使用 Anacon...

2018-09-13 15:55:56 2148

原创 【报错】:Missing parentheses in call to 'print'

使用print函数的时候往往会出现这个错误。 当你执行:print "hello world"出现以下错误: Missing parentheses in call to ‘print’原因:Python2.X和Python3.X不兼容。现在大部分人用的是Python3,而print “hello world”是Python2中的语法,在Python3中需要使用print()语...

2018-09-11 17:20:05 1284

原创 【报错】ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() o

**ambinguous:模糊的,有歧义的 这个错误的理解:所选的真值不明确。可能是将一个值与多个值或一个列表中的值相比较、匹配,导致的问题** 出现以上错误的代码:def xianhao(b): if (汇总0901['尾号'] == '0')&(汇总0901['尾号'] == '5'): return '星期五' elif (汇总0901['尾号...

2018-09-11 17:12:44 10538

原创 【报错】"cannot convert the series to class 'float'

def is_number(s): try: float(s) return True except ValueError: pass try: import unicodedata unicodedata.numeric(s) return True except (...

2018-09-07 17:24:55 11266 3

原创 python中基本数据处理

同一个数据框中,根据两列数据得出新一列数据例:有某工厂的上班时间,一列是夜间上班时间,一列是白间上班时间,我们需要根据这两列数据得出一列新数据:工人的夜班和白班情况。 具体规则: 1、如果夜间在线时长大于0,称之为夜班 2、如果白间在线时长大于0,称之为白间 3、如果司机当天在线时长为0 ,这称为未做单 4、如果夜间和白间的在线时长都大于0,称之为混合def function(a...

2018-09-06 16:51:21 273

原创 Python中的对象

在Python中的对象数据类型主要包含,数值型、字符型、逻辑型、列表、元祖、字典、数据框。 本文将针对不同的数据类型进行介绍,说明其用法。 一、数值型、字符型、逻辑型说明数值型定义:数值型主要是指实数,正数,负数以及0。分为长整型,浮点值,复数 运算:数值型可以进行标准算术运算(+ - * / // % **) 举例:长整型(long):94895893589...

2018-09-05 17:33:06 3761

原创 Python代码过长换行问题

在Python中当代码过长,需要换行的话,如果之前换行会出现报错,需要在每一行的末尾加一个英文的”\”才可以正确换行。data['tool'] = data['jk']+\ data['df']+\ data['iui']...

2018-09-04 13:48:16 10966

原创 行为心理学

行为是心理和环境两个因素共同决定的当你在分析行为时,发现为什么出现了这种行为而没有出现另外一种行为,就要综合考虑一下环境的影响因素。 你的神经质或者一些行为习惯不会因为微博的使用而有本质的改变,但是你面对面和人聊天的时候,以及在微博或者微信中与人互动的时候的行为表现确实会因为环境的不同而有不同的表现形式。...

2018-09-04 13:45:25 506

原创 SQL-CONCAT相关的用法

起初在使用SQL进行多条件选择时,会使用where和and语法结合,在书写的过程中会显得非常累赘。后来发现了concat_ws的用法,可以将多条件进行结合,用起来很方便。CONCAT_WS()CONCAT_WS(separator, str1, str2,...)它是一个特殊形式的 CONCAT()。第一个参数separator是剩余参数间的分隔符。分隔符可以是与剩余参数一样的字符串。...

2018-08-10 14:57:38 9027

原创 Excel打开CSV格式,大数字乱码情况

我们在打开CSV保存的身份证号,ID等大数字时,经常会出现末尾几位变为0的情况。 解决方案: 使用导入的方式打开而不是使用打开的方式。

2018-07-04 18:07:04 11898 1

原创 Python中的操作符

算数操作符+ - * / // % **1、操作符介绍 从左到右这些操作符依次是:加、减、乘 、传统除法、浮点除法、取余,乘方 单斜杠用作传统除法,双斜杠用作浮点除法(对结果进行四舍五入),传统除法是指如果两个操作都是整型的话,它将执行的是地板除(取比商小的最大整数),而浮点除法是真正的除法,不管操作数是什么类型,浮点除法总是执行真正的除法。 ...

2018-05-25 11:32:38 1672

原创 【报错】Missing parentheses in call to 'print'

在执行过程中出现以下报错:print 'hello world' File "<ipython-input-1-d05d0c8adf1f>", line 1 print 'hello world' ^SyntaxError: Missing parentheses in call to 'print'原因:在Python...

2018-05-25 10:51:20 18277 1

原创 【报错】python 中 出现 invalid syntax

invalid syntax 就是语法错误常见的场景: 1、在使用筛选是使用等号:例如data['car']==2data[‘car’]==2写成data['car']=2

2018-05-24 15:32:39 47011

原创 【报错】Python中expected an indented block

IndentationError: expected an indented block Python严格地要求代码缩进,缩进的代码块相对于上一级是从属关系。用if语句举个例子: if a==2: print ‘hello world’if语句的条件为真时会执行print语句,print语句是if语句的从属代码块,代表从属关系,print语句之前有4个空格。如果if语句没有任何从属的代码块就会...

2018-05-24 15:28:10 12883

原创 数据可视化-Tableau-故事

故事故事非常适合叙述你从数据中发现的规律。它们和显示面板相似,你可以创建工作表,然后将工作表拖到故事中。但是,每个工作表都单独显示,并且会有按顺序显示的叙述性文字。 这是创建的一个故事,我想查看为何 Global Superstore 在某些国家是亏损状态。你可以在此处下载工作簿或使用公共故事。 从这个故事中可以看出,在很多国家,超低价折扣是亏损状态的罪魁祸首。折扣活动并没有带来利润增...

2018-05-13 11:07:46 9793

原创 数据可视化-Tableau-显示面板

显示面板显示面板用来将多个表格收集到一起表达一种想法。例如,这是一个关于 Salesforce 数据中销售机会的显示面板示例。可以从该显示面板中看出,点击某个视图会过滤掉其他视图中的数据。这是其中一个非常棒的交互式功能,使你能够让查看者探索你的数据。显示面板还适合根据各种视图构建报表,从而追踪每天或每周的工作。 Tableau 在他们的库中提供了大量出色的显示面板。可以查看这些显示面板并寻找...

2018-05-13 11:00:26 5774

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除