自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(143)
  • 资源 (2)
  • 收藏
  • 关注

原创 【Python小笔记】零碎同步

【代码】【Python小笔记】零碎同步。

2023-08-03 09:49:50 192

原创 【CSS】快速入门笔记

CSS快速入门笔记

2023-03-11 22:49:04 397

原创 【Oracle基础】包和包主体

oracle 包

2023-03-09 11:42:24 180

原创 【Oracle 技巧积累】

记录遇到的oracle问题

2022-10-25 17:11:25 220

原创 帆软FineBI随时记

FINEBI使用过程中的技巧

2022-07-20 10:34:58 1408

原创 【SQLITE】聚合函数的一些特征

sqlite聚合的一些特点

2022-07-17 11:24:02 513

原创 旁门左道PPT-3节课

PPT 形状、配色、排版

2022-06-11 10:44:45 3046

原创 帆软大赛作品

https://bbs.fanruan.com/thread-139792-1-1.html欢迎打卡交流~

2022-05-17 14:39:20 644

原创 【FineBI】vs均值的处理方法(数据底层+组件制作+数据权限)

一、需求描述在多个维度组成的表中,实现明细数据数据要子级维度的整体值比较二、需求探索表1数据集:select * from tab如图,无法在先按品牌,再按品类的分组条件下,算数品类整体数因此,数据集中需要事先算出单独按照和3种品类汇总的数三、方法探索方法1:数据堆叠select '明细' as 数据类型, t.* from tab tunion allselect '品类汇总' as 数据类型, t.*, t0.* from (select t.品牌 from

2022-02-22 20:32:20 824

原创 【FineBI】权限控制之动态维度/动态列

文章目录一、功能需求二、实现过程1.前期准备1)维度表和主表准备2)帆软系统用户准备和权限设置2.数据集创建和仪表板制作3.仪表板挂出1)申请仪表板挂出2)快速挂出三、实现效果1.应出结果2.实现结果一、功能需求根据登陆者的身份,将数据指标以不同的维度展示例如:总部身份的人按分公司展示业绩总额、分公司身份的人按门店展示业绩总额二、实现过程1.前期准备1)维度表和主表准备数据库中有维度表1:员工组织表维度表2:部门架构表事实表:业绩表2)帆软系统用户准备和权限设置添加用户设置

2022-02-16 00:11:33 2582 1

原创 【产品经理】流程图和泳道图绘制

https://www.bilibili.com/video/BV16o4y1d7yA?spm_id_from=333.1007.top_right_bar_window_history.content.click一、流程图的重要性1.复杂过程简单展现2.流程再造-《企业再造》(哈默、钱皮)3.工作任务-组织管理二、高效画图1.工具选择a.PPT\WORDb.VISOc.MINDMANGER2.流程图结构a.顺序结构b.选择结构c.循环结构3.组成元素4.设计规范5.案例

2021-12-11 14:02:40 1172

原创 【Python小笔记】使用循环读取并合并多个sheet

假设一个excel文件多个sheet具有相同的结构import pandas as pdtofile='E:\tofilename.xlsx'fromfile=r'E:\fromfilename.xlsx'#获取sheet名列表sheetlist=pd.ExcelFile(fromfile).sheet_names#使用循环读取并拼接for sn in sheetlist: dfi=pd.read_excel(fromfile,sheet_name=sn)#依次读取sheet

2021-09-09 18:01:06 951

原创 【Python小笔记】1解决pandas to_excel覆盖原sheet,2同时写入多个sheet

from openpyxl import load_workbookimport pandas as pdtopath='E:\Mercy\data\public\门店名称匹配test.xlsx'excel_writer = pd.ExcelWriter(topath, engine='openpyxl')#生成一个ExcelWriter对象book = load_workbook(excel_writer.path)#记录下这个Excel文件的原有sheetexcel_writer.book

2021-09-06 14:51:18 3906 4

原创 【Python小笔记】找到文件夹下最新文件

import os# 输入目录路径,输出最新文件完整路径def find_new_file(dir): '''查找目录下最新的文件''' file_lists = os.listdir(dir) file_lists.sort(key=lambda fn: os.path.getmtime(dir + "\\" + fn) if not os.path.isdir(dir + "\\" + fn) else 0) print('

2021-09-06 14:50:10 1565

原创 【Python小笔记】读取模糊文件名

import sysimport reimport pandas as pdimport ospat=re.compile('全渠道.*?')for file_name in os.listdir('E:\Mercy\data\public'): if re.match(pat,file_name): depart_path='E:\Mercy\data\public\\'+file_namedf_depart=pd.read_excel(depart_path,she

2021-09-06 14:49:06 1270

原创 【每日一文】三个步骤,用户流失可以这样分析

原文地址:三个步骤,用户流失可以这样分析文章目录一、判断用户流失的性质和类型1.判断什么样的用户才是流失用户2.流失用户的特征3.用户流失前的行为分析二、分析用户流失的原因1.用户生命周期2.用户流失前行为分析三、制定流失运营机制1.预防流失机制2.流失召回机制1)判断用户是否有回流可能性2)流失用户召回方案设计四、结语一、判断用户流失的性质和类型通过数据取判断1.判断什么样的用户才是流失用户TA–时间Time和关键行为Action:用户在多长时间内没有进行关键行为的操作2.流失用户的特征新老

2021-07-13 11:19:41 481

原创 数据科学包整理

##导入数据from sklearn.datasets import 内置数据集##分类#朴素贝叶斯from sklearn.naive_bayes import GaussianNB#高斯朴素贝叶斯from sklearn.naive_bayes import MultinomialNB#多项式朴素贝叶斯#决策树from sklearn.tree import DecisionTreeClassifier#决策树分类from sklearn.tree import export_

2021-07-13 09:53:43 131

原创 【每日一文】从0开始建立数据指标体系

原文链接:《从0开始建立数据指标体系》文章目录一、为啥需要数据指标二、为啥需要数据指标体系三、数据指标体系五大件第一要素:主指标(一级指标)第二要素:子指标(二级/三级指标)第三要素:过程指标第四要素:分类维度第五要素:判断标准四、数据指标体系如何发挥作用五、如何构造数据指标体系第一步:明确工作目标,清晰主指标第二步:清晰判断标准第三步:了解业务管理方式,找合适的子指标第四步:梳理业务流程,设定过程指标第五步:添加分类维度六、为什么我做的不是指标体系一、为啥需要数据指标把不确定、不具体、不准确的信息,

2021-06-30 18:31:34 237

原创 【每日一文】如何构建指标体系?

原文链接:《如何构建指标体系?》1.什么是指标体系?指标体系是从不同维度梳理业务,把指标系统地组织起来。指标体系=指标+体系2.指标体系有什么用?判断业务是否正常(健康),一个指标常常不能充分说明问题,可以通过指标体系对业务进行监控。监控业务状况通过拆解指标寻找当前业务问题评估业务可改进的地方,找出下一步工作地方向3.如何建立指标体系?1) 明确部门KPI,找到合适的一级指标一级指标:是用来评价公司或部门运营最核心的指标,一般是业务流程的最终结果。一级指标根据业务情况,可能有多个

2021-06-30 18:22:12 1386

原创 【TASK】泰坦尼克项目

复习:这门课程得主要目的是通过真实的数据,以实战的方式了解数据分析的流程和熟悉数据分析python的基本操作。知道了课程的目的之后,我们接下来我们要正式的开始数据分析的实战教学,完成kaggle上泰坦尼克的任务,实战数据分析全流程。这里有两份资料:教材《Python for Data Analysis》和 baidu.com &google.com(善用搜索引擎)1 第一章:数据载入及初步观察1.1 载入数据数据集下载 https://www.kaggle.com/c/titanic/ov

2021-06-15 20:08:53 922 5

原创 【PowerQuery】基础

https://editor.csdn.net/md?not_checkout=1&articleId=11516077601 添加自定义列1.调出power query选择表格区域(或选中表格区域某个单元格),右击,[从表格/区域获取数据],确认数据来源和是否包含标题2.常用设置主要标签-主页、转换、添加列属性-名称-可以修改表名应用的步骤-可以撤销步骤3.添加列从标签【添加列】-【自定义列】设置-新列名自定义公式=_(代表一整行,详见M函数)(【视图】-【编辑栏】查看公式

2021-06-09 21:46:04 10079 1

原创 【每日一文】《数据分析:如何分析活动效果?》

原文链接:数据分析:如何分析活动效果?1.活动评估的常见错误所有以评估/评价/判断作为动词的问题,答案只有一种:“好or坏”。所以一定要有结论,切忌没有结论,只是分析过程、分析指标。2.活动评估关键问题数据+标注=判断。因此想得出好/坏判断,需要有2样东西:明确的考核指标。明确目标数值。3.从0建立评估模型的做法第一步,梳理活动流程。运营活动会改变用户的行为,进而体现为数据指标的变化。第一步就是了解活动具体流程,了解活动可能导致的用户行为变化。了解到行为变化以后,可以进一步看这些行为能

2021-06-01 18:09:51 2609

原创 【Python小笔记】xlsxwriter写入excel文本和图片

import xlsxwriter as xlsx #读取/创建文件book=xlsx.Workbook('E:\\Mercy\\data\\mytest\\xlsxwriter_test.xlsx')#添加工作表sheet=book.add_worksheet('demo')#输入文本amount=56sheet.write('A1','实际支付金额:'+str(amount))#输入图表import matplotlib.pyplot as pltimport numpy a

2021-04-10 10:18:18 366 1

原创 【数据仓库】原理

课程地址:https://www.bilibili.com/video/BV1qv411y7Wv

2021-02-07 17:09:18 126

原创 【数据仓库-Hive】笔记(未完)

一、数据库操作1.创建数据库show databases;create database 数据库名称 if not exit;ues 数据库名称;新建的数据库都保存在hdfs上,由hive-site.xml属性指定hive.metastore.warehouse.dir/user/hive/warehouse2.指定路径创建数据库create database 数据库名 location 位置3.设置数据库键值对信息create database 数据库名 with dbproper

2021-01-08 15:45:08 276

原创 【Python数据分析与数据化运营】代码笔记

4.1.6 Python 聚类分析《cluster.txt》前两列是特征,最后一列是标签 导入库import numpy as np # 导入Numpy库import matplotlib.pyplot as plt # 导入Matplotlib库from sklearn.cluster import KMeans # 导入sklearn聚类模块from sklearn import metrics # 导入sklearn效果评估模块数据准备raw_data = np.loadtxt('

2021-01-07 10:00:21 820

原创 【Python数据分析与数据化运营】chapter5 会员数据化运营

一、概述二、关键指标三、应用场景四、分析模型五、

2021-01-06 15:34:14 280

原创 AdaBoost营销响应预测

文章目录一、背景介绍二、流程简述三、自定义函数1.导包2.数据集信息1)基本信息查看2).缺失值查看3)样本均衡审查3.数据预处理1)数据类型变换2)NA值替换3)标志变换4.获得最佳参数模型四、训练集数据应用1.加载训练集2.数据审查和预处理3.获取最优参数模型4.建立并训练模型五、预测集数据应用1.加载预测集数据2.数据审查并预处理3.应用模型4.与实际效果比较一、背景介绍前13列是13个特征,最后一列是响应的结果《order.xlsx》sheet1是训练集,sheet2是预测集二、流程简述先

2021-01-06 15:06:27 780 1

原创 【Power BI】基础可视化快速笔记

文章目录1.工作机制2.主要模块3.获取数据4.转换数据类型5.基本制图步骤6.图表进阶教程1.工作机制2.主要模块分别是报表、数据、关系,点击切换3.获取数据打开时主页,获取数据如果连接数据库,当数据有更新的时候,可以使用<刷新>来更新图标4.转换数据类型如果导入数据时,默认生成的数据格式和实际需要的不符,可以在导入是选择[转换数据]打开Power Query编辑器,点击标题前小图标,转换数据类型。修改完之后点击关闭并应用,或者应用如果已经导入了,但数据类型不符

2021-01-04 15:18:22 166

原创 【Python小项目】Python进行RFM用户价值分析

一、准备源数据从订单表中抽样查询确定时间段的订单数据SELECT USERID,PROVINCE,ORDERDATE,ORDERID,AMOUNTFROM RETAIL.ORDERS_ALL SAMPLE (50)WHERE TO_CHAR(ORDERDATE,'YYYYMMDD')>=20200101导出到csv文件《sales.csv》二、读取源文件默认格式下,USERID、ODERDATE、ORDERID默认都是数值型,需要进行类型转换dtypes={'USERID':obj

2020-12-31 10:59:46 742

原创 【Tableau】快速笔记

01 下载、安装和激活下载:https://www.tableau.com/zh-cn/support/releases安装和激活按提示操作02 基础导入数据全功能文件数据库熟悉数据源界面左侧:连接(文件|数据库)信息上部:数据源信息下部:数据内容底部:页面切换状态栏数据连接:实时 VS 提取连接多个数据:添加数据类型:维度 VS 度量初体验切换至【工作表1】页,可以重命名快速画图:拖动所需的度量字段和维度字段拖动到【行】和【列】上方图标可以

2020-12-31 09:51:12 363

原创 【sqoop】笔记

一.简介二.安装三.导入1.全量导入到hdfs2.全量导入到hive方式一3.导入表数据的子集(where过滤)4.导入表数据的子集(query查询)5.增量导入1)append四、导出五、job作业

2020-12-22 11:48:19 103

原创 【Linux】shell脚本

一、基础知识1.shell简介shell是用户使用 Linux 的桥梁,在Linux中输入命令的界面就是shell,如[root@localhost ~]# alias ld=‘ll -d’[root@localhost ~]#echo $SHELL[root@localhost ~]#echo $02.shell版本最常用的是 /bin/bash3.shell脚本shell脚本是一个文本,通过赋权后可执行,执行的内容有文本内容决定。shell脚本搭配正则表达式、管道命令、数据流重定向等

2020-12-09 14:32:23 166

原创 【Linux搭建】安装jdk和kettle,并在linux中使用kettle以及后台执行定时任务

JDK镜像:http://www.sousou88.com/spec/java_openjdk.html

2020-12-06 22:21:45 1106 1

原创 【Linux搭建】使用yum命令安装mysql并远程连接

参考文档1:Linux环境yum,安装MySQL1.查看系统是否有安装mysql[root@localhost ~]#yum list installed mysql*[root@localhost ~]#rpm –qa|grep mysql*[root@localhost ~]#yum list mysql*2.安装mysql客户端[root@localhost ~]#yum install mysql3.安装mysql服务端1[root@localhost ~]#yum install

2020-12-05 12:49:36 259

原创 【Linux搭建】安装配置Linux虚拟机详细步骤

一、安装VMware搜索引擎下载安装VMwareVMware Woorkstation12二、安装虚拟机1.下载Centos7CentOS-7-x86_64-DVD-2003.iso2.在VMware上主页-创建新的虚拟机3.虚拟机向导配置:典型稍后安装操作系统操作系统:Linux ,版本Centos 64位修改虚拟机名称和位置自定义磁盘大小自定义硬件修改内存(本机的一半)添加镜像文件网络默认NAT模式4.开启虚拟机选择Install CentOS

2020-12-03 00:22:35 554

原创 【Linux】基础常用操作之二

文章目录一、压缩和解压命令1) `tar`【格式 .tar.gz】2)`zip`和`unzip`【格式 .zip】二、文件查找1)`find`查找文件2)`grep`查找文件内容3)`which`查找可执行文件位置三、系统管理命令1)`ps`查看系统中当前运行的进程2)`kill`杀死进程3) 管道`|`四、用户操作1)用户创建`useradd`和密码设置`passwd`2)用户删除 `userdel `3)切换用户`su`五、权限管理1)分析权限2)修改权限`chmod`六、网络和服务管理1)查看主机名`

2020-12-01 15:52:28 88

原创 定时任务计划设置(python脚本、oracle数据库、kettle转换和作业)

一、python脚本描述:每天都要执行一个爬虫脚本G:\scripts\ufo.py方法:Step 1.系统搜索框搜索“任务计划程序”并打开,左侧建立文件夹(可不建)后,在文件夹内创建任务Step 2.在【常规】里面输入名称以及运行设置Step 3.切换到触发器,新建时间间隔规则Step 4.切换到【操作】,新建操作规则方法1:填写运程所需的程序以及脚本地址方法2:新建一个bat文件,填写运行程序地址和脚本地址然后填入该bat文件的地址Step 5.【条件】【设置】里面修改关于

2020-11-20 13:45:01 1790 4

原创 【机器学习-样例】关联规则和频繁样式探勘

一、关联规则通过电影观看记录来找到关联的电影以便推荐1.电影表import pandas as pddf_movie=pd.read_csv('E:/Jupyter workspace/python_for_data_science/Data/movies.csv')df_movie.head()2.观影记录表df = pd.read_csv('E:/Jupyter workspace/python_for_data_science/Data/ratings.csv')df.head()

2020-11-13 17:45:23 243

原创 【机器学习-样例】降维模型

降维原因:不同特征之间有的互相影响的。具有重叠性,进而影响到统计结果的真实性,所以需要降低维度降维应用:组合浓缩特征剔除不必要的特征降维方法:选择特征 Feature Selection抽取特征 Feature Extraction一、 Feature Selection方差选择法-移除低变异数的特征-VarianceThresholdimport pandas as pddf=pd.pandas.read_csv('E:/Jupyter workspace/python_for_data

2020-11-04 14:48:10 776

kettle配套资源

kettle 8.2数据仓库零基础快速入门对应课程资源,里面有的文件和做好的转换和转换,方便随时下载随时回忆细节

2020-12-04

ppt笔记—draft.pptx

课程随手练习文件,用于结合笔记回忆一些细节知识点。个人练习草稿

2019-06-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除