自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 资源 (1)
  • 收藏
  • 关注

原创 sql学习笔记

1.rank() ,dense_rank(), row_number()https://blog.csdn.net/weixin_43713105/article/details/106808261?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.channel_param2.inner joinhttps://www.w3school.com.cn/sql/sql_join_i

2021-01-28 20:58:52 1438

原创 深圳工行科技菁英面经

1、自我介绍2、观点,5条理由。智能语音客服的观点是利大于弊还是弊大于利。

2022-01-01 13:28:41 1116

原创 浦发信用卡面经

一面:1、自我介绍。2、时事热点分享。二面:无领导小组形式。材料是互联网平台之间屏蔽链接行为。1、阅读材料。2、个人观点1min3、小组讨论15min(包括代表汇报3min)。

2022-01-01 13:26:34 317

原创 牛客网产品经理一面经验

1、自我介绍5min2、讨论,总结。话题:AI面试。小组群面。

2022-01-01 13:22:54 242

原创 SQL笔试题目分享(二)

1.在电商中,流量漏斗是最基础的监控漏斗,因此希望你能够基于我提供的数据表和字段构建一个流量转化漏斗。可能会用到的数据表如下:曝光表exhibit:info_id(商品id),dt (日期),token(用户唯一标示)详情表visit:info_id(商品id),dt (日期),token(用户唯一标示)支付表pay:info_id(商品id),dt (日期),token(用户唯一标示),parent_order_id(订单唯一标示)请输出包含如下报表SQL:日期(2...

2021-10-28 12:13:26 384

原创 SQL笔试题目分享(一)

3、SQL 数据分析 某宝有一张订单表 ordr_list,共有三列:ordr_id(订单 id)-- bigint,uid(买家 id)-- bigint,create_time(下单时间)-- datetime,对于同一个买家,每个订单 的下单时间均不同。 写 SQL 求得每个用户最早下单的订单 id,每个买家一行;输出两列:uid(买家 id),ordr_id(最早下单的订单 id)-- 3、select uid,order_id from (select uid,order_id,row_

2021-10-28 12:08:55 813 1

原创 西山居数据分析2022笔试题目-excel部分

一、专业技能1、Excel技能用到的函数:vlookupindex+matchsumproductcountifsumifs第一列:分数第二列:队伍id第三列:队伍内排名第四列第五列第六列第七列

2021-10-28 12:01:17 1239

原创 便利蜂2022数据分析秋招一面凉经

1、看板相关。1.1 构建看板的主要指标有哪些?1.2 最重要的两个指标?2、异常分析2.1 假设以周为例,本周相比上周某一个指标上涨50%,怎么分析?2.2 如果用模型来监测异常,怎么做?用时间序列的线性回归模型。首先,模型构建。检验x和y之间是否存在线性相关关系。第二,计算残差,将原始值转化为残差,残差服从正态分布。第三,计算真实值减去预测值。标准化残差,(diff-均值)/标准差。看这个标准化后的数在几个标准差之内,判断是否异常。通常可以与1.96比较。3、

2021-10-28 11:48:24 451

原创 2022秋招蚂蚁金服面试

一、一分钟自我介绍。二、简历相关问题。1、实习中主要做的事情,从三方面来回答,工作内容、为谁工作、主要指标。对这部分人做了什么?结果:提升转化率、留存。2、ABtest的流程、原理、参数设置、主要关注的统计效果。分享了一个AB测试的项目3、我用到的主要工具、语言?分两块。一是hive sql用来取数;二是python、excel,用来数据可视化。4、sql问题4.1 数据库底层知识:主键是什么?主键是指,表中经常有一个列或者多列的组合,其值能够唯一地标识表中的每一

2021-10-28 11:28:37 1328

原创 SQL题目-次日留存率

题目解答-- 第一步 求日期间隔select a.user_id,a.log_date as log_d,date_diff(a.log_date,b.log_date) as day_difffrom userlogs aleft join userlogs bon a.user_id=b.user_id--第二步 算留存率 select log_d,count(distinct case when day_diff =1 then user_id else null en.

2021-09-21 12:32:08 1208 2

原创 MYSQL中substring_index()用法

牛客网题目统计每种性别的人数_牛客题霸_牛客网描述题目:作为牛客网的数据分析师,现在运营举办了一场比赛,收到了一些参赛申请,表数据记录形式如下所示,现在运营想要统计每个性别的用户分别有多少参赛者,请取出相应结果示例:user_submit查询:select SUBSTRING_INDEX(profile,',',-1) as gender,count(device_id)from user_submit a group by SUBSTRING_INDEX(profile,

2021-09-16 18:13:08 20087

原创 唯品会秋招数据分析笔试2022

有一份交易表sales,表的结构如下:字段 字段名称 示例 user_id 客户号(用户唯一标识) 123 phone 手机号码 13900000000 add_day 日期 2020-01-01 amount 销售额(元) 100 请根据以上信息(1)请计算2020年1月每天累计销售额。如:1月1日销售额为10万,1月2日销售额为50万,则1月1日累计销售额10万,1月2日累计销售额60...

2021-09-15 16:15:44 413

原创 字节数据分析2022秋招

数据科学家-商业战略一、自我介绍二、挖简历异常分析的case分享,详细追问有没有过B端分析的数据经验主要关注的指标有哪些?为什么转组?有什么不同?sql题1)用开窗函数2)时间函数select month(from_unixtime(unix_timestamp('20210801','yyyymmdd'),'yyyy-mm-dd'))...

2021-09-15 13:10:11 183

原创 2022秋招-京东-数据分析师笔试-编程题

一、题目描述有若干个数形成一个可重集合,它们中很多都想做一个中庸的数,即既不是集合中最大的(或之一),也不是集合中最小的(或之一)。显然,不可能满足所有数。好在还是有一些数并不介意这一点。你需要从这些数中选出一个可重的子集,该子集中介意成为最值的数都得到满足(指不能成为子集中的最值)。请计算可以取的最大可重子集的大小。输入描述第一行一个整数 n,1 <= n <= 100000后面 n 行,每行两个整数 x, y,x <= 1000000000,y 为 0 或 1。x 表

2021-08-21 22:04:48 2002

原创 斗鱼-暑期-数据分析面经-已offer

一面20210630自我介绍实习内容深挖负责什么项目,介绍一下反问什么组:增长分析-策略分析二面20210701自我介绍实习内容深挖ab实验的全过程指标异常分析hr面20210702是否想在武汉长期发展已拒,斗鱼特别希望人长期在武汉发展,不过组里的hc并不充分,hr无法保证。原因如下:1、比较倾向于在北方发展。2、转正hc并不充分。3、相对于一线大厂,斗鱼还是小了一些。...

2021-08-01 17:55:25 200

原创 异常值的识别与处理

参考链接:https://blog.csdn.net/weixin_39548776/article/details/112486403https://blog.csdn.net/xzfreewind/article/details/77014587

2021-07-06 18:03:03 125

原创 Python纵向合并多个excel文件

一、背景在学校里,我们往往会学习很多高深的模型和方法,面试中的考察也屡见不鲜,而到了实际工作中使用频率却相对较低,成天和office厮混。这就是所谓的“面试造火箭,工作拧螺丝”现象。此时,不要灰心,不要难过,记住:我有工资的。言归正传,用的较多的是excel文件。有时需要批量合并多个格式相同、仅仅是数据不同的文件,如果一直用鼠标点点点,不光浪费时间、消磨热情不说,而且还可能遇到excel文件太大,电脑崩溃的情况,只想go die。假如Excel欺骗了你,不要悲伤,不要心急,这就是你学..

2021-07-02 16:22:22 5413 4

原创 Python安装第三方库

pycharm安装参考链接:https://zhuanlan.zhihu.com/p/129651314cmd安装参考链接:https://blog.csdn.net/dss875914213/article/details/86500146

2021-07-02 16:20:08 113

原创 did双重差分法介绍

学习链接:https://zhuanlan.zhihu.com/p/48952513https://zhuanlan.zhihu.com/p/103412389

2021-04-09 18:04:32 1050

原创 阿里暑期数分面经-凉经

阿里一面ab实验是如何分桶的?依稀记得被怼的很惨阿里二面一面和二面差了10天。还以为自己挂了。给不懂数学和统计的人介绍分位数。二分位数。就是中位数。四分位数,就是刚才二分位数的二分位。假设检验的应用我如果这么说了可能表现更好一些吧。呜呜呜。ab实验的分组。对产品ux的迭代做ab实验。这时候做的假设检验就是假设对照组和实验组的实验效果没有差别。假设两个组之间的实验效果无差别。备择假设就是有差别。内连接和外连接的区别内连接就是取交集。外连接包括左外连接和右外连接...

2021-03-26 10:50:13 221

原创 数据挖掘与数据化运营实战 #读书笔记

数据挖掘与数据化运营实战 #读书笔记电子书链接:链接: https://pan.baidu.com/s/1l2hpC3V3bM8C3cfq--kOrw 提取码: yq27 复制这段内容后打开百度网盘手机App,操作更方便哦笔记链接:https://share.mubu.com/doc/Nv4ZpjiqwL...

2021-03-19 18:50:36 311 1

原创 携程2021暑期实习算法题

携程2021暑期实习算法题目给定非负整数d,判断是否存在整数a、b、c,使得d=a*a+b*b+c*c

2021-03-18 21:10:01 92

原创 统计学-假设检验部分 贾俊平 #读书笔记

贾俊平-统计学-假设检验笔记链接:https://share.mubu.com/doc/23rRpdVegf网课链接:链接: https://pan.baidu.com/s/1e5yWRndcaOHQ5-b4Z8e9Rg 提取码: ubyu 复制这段内容后打开百度网盘手机App,操作更方便哦电子书链接:链接: https://pan.baidu.com/s/1hzy-o1pFwpg1aCa8xhE1VQ 提取码: wjz8 复制这段内容后打开百度网盘手机App,操作更方便哦.

2021-03-18 11:26:04 309

原创 如何用数据分析思维找对象?没有对象的数据分析师不是好的打工人!

背景:众所周知,现在年轻人的单身率居高不下,天上掉下来一块砖头能砸到三四个单身狗,其中还有一个母胎solo。小编在看了一本数据分析相关的书之后,发现了找对象的秘籍和应用案例,简直拯救万千少男少女于单身的无底洞!要问这本书是什么?哒哒,就是它:《数据化管理:洞悉零售及电子商务运营》。有关这本书的读书笔记可见本博主上一篇博文。笔记链接:https://share.mubu.com/doc/zDQIvco_kf思维导图:结语:好的,看完了吗?(无辜的眼神)不准眼高手低。

2021-03-10 19:17:50 174

原创 数据化管理:洞悉零售及电子商务运营 #读书笔记

笔记链接:https://share.mubu.com/doc/bfFQo8glWf书籍链接:链接: https://pan.baidu.com/s/1qtAALAOexpzgqCtBhrXeaA 提取码: xvg4 复制这段内容后打开百度网盘手机App,操作更方便哦思维导图:彩蛋,如何找到女朋友?如何找到自己喜欢的女朋友?以战略的高度、策略的思维进行分析 必须要有可操作性 结合本书内容来思考一个合格的数据分析师,怎么能没有女朋友?现在,此时此刻,就用数据分析思维,

2021-03-10 18:56:08 604

原创 谁说菜鸟不会数据分析-入门篇 #读书笔记

谁说菜鸟不会数据分析-入门篇 #读书笔记笔记链接:https://share.mubu.com/doc/DUrEpY8GpL书籍链接: https://pan.baidu.com/s/1sP7kBQJvd2eEP0XEL6uteg 提取码: yknc 复制这段内容后打开百度网盘手机App,操作更方便哦...

2021-03-09 15:49:05 411

原创 快手内容运营-数据分析面试

一面 20201111一共有三面。三个部分一、自我介绍照着简历叙述即可。会针对简历中所体现的他感兴趣的部分提问。问了Python爬虫使用的多吗?回答:是的。问了sql使用的多吗?我说是自学的。二、题目(一)sql题目。快手使用的明细数据表。表格样式。uid 用户 pid 视频 date 时间 uid用户在date时间观看了pid视频。001 xyz 20201030 001 xyz 202010

2021-01-19 17:30:00 7955

原创 sql笔试题目

1.在电商中,流量漏斗是最基础的监控漏斗,因此希望你能够基于我提供的数据表和字段构建一个流量转化漏斗。可能会用到的数据表如下:曝光表exhibit:info_id(商品id),dt (日期),token(用户唯一标示)详情表visit:info_id(商品id),dt (日期),token(用户唯一标示)支付表pay:info_id(商品id),dt (日期),token(用户唯一标示),parent_order_id(订单唯一标示)请输出包含如下报表SQL:日期...

2020-11-11 16:14:55 359

原创 建议收藏,10个Windows系统装机必备软件,相见恨晚!

目录(一)录屏软件EV录屏(二)文字识别天若OCR文字识别高级完美版(三)截图悬浮软件SETUNA(四)文本编辑器sublime text(五)播放器爱奇艺万能播放器(六)思维导图类幕布(七)读英文文献神器知云文献翻译(八)电脑文件搜索神器everything(九)浏览器火狐浏览器(十)PDF阅读器福昕俗话说:工欲善其事必先利其器。一台属于自己的电脑,肯定有个人使用痕迹,用的好了就得心应手,流畅如飞。这10个软件,在学习、工

2020-11-08 22:41:32 2710

原创 我的mysql学习历程

目录零、学习过程一、书MySQL必知必会来源:功能:二、视频链接:资料来源:全部资料:软件:my words:三、刷题链接:my words:四、小结零、学习过程书为参考备用,看视频(下软件,跟着敲代码),刷题。一、书MySQL必知必会来源:链接: https://pan.baidu.com/s/1vb7wNDIBdyEcU3KCmjCQ6Q 提取码: bzds 复制这段内容后打开百度网盘手机App,操作更方便哦.

2020-11-08 21:02:02 318

原创 sqlzoo 刷题答案

网址:https://sqlzoo.net/wiki/More_JOIN_operations1.List the films where theyris 1962 [Showid,title]SELECT id, title FROM movie WHERE yr=19622.Give year of 'Citizen Kane'.select yr from movie where title='citizen kane';3.List all of t...

2020-11-08 20:37:43 206

原创 在公众平台1年内发出20+篇推文之后,数据分析小白学到了什么?

目录前言Python:re:selenium:自动登录自动下载selenium基础知识爬虫xpathPDF处理pandas--表格数据处理Stata:爬虫:merge--表格数据处理总结前言从2019年5月起,我开始在公众平台下学习软件。到2020年7月卸任,一年多的时间,我从对代码模糊向往的小白,变成了别人口中会写(一点点)代码的大神(不是)。感触很深,人走得太快,也要偶尔等一等自己的灵魂,回头看看走过的路,所以下面做一下总结。.

2020-11-07 14:38:46 264

原创 python更改文件名

一、文件重命名import osxlsbpath=r"F:\data"os.chdir(xlsbpath) #更改当前路径filelist = os.listdir(xlsbpath) # 该文件夹下所有的文件(包括文件夹)print(filelist) #文件夹中所有文件名old="last.xlsb" #旧文件名new="to.xlsb" #新文件名os.rename(old,new) #重命名直接修改文件名二、复制后命名#先复制再改名#pip install sh

2020-08-12 22:36:06 17357 1

原创 python返回上一个交易日

一、周一到周五微交易日,其他不处理#返回上一个交易日lastworkday,根据周一到周五为工作日(不考虑他,采用下一个方法)import time,datetime #时间date=datetime.datetime.today() #今天#print(date.today())w=date.weekday()+1#print(w) #周日到周六对应1-7if w==1: #如果是周一,则返回上周五 lastworkday=(date+datetime.timedelta(days=-

2020-08-12 22:28:50 3980 1

原创 python中时间戳和日期的转换

#时间戳和日期的转换import time,datetimeprint(datetime.datetime.today())print(time.time())print(time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(1494133686)))结果

2020-08-12 22:22:30 214

原创 python爬取公众号历史文章

文章来源学习网上以及自己修改。参考链接:https://blog.csdn.net/d1240673769/article/details/75907152目的'''爬取公众号的历史文章信息:标题、链接、发布时间步骤:登录某一公众平台(随意一个),在新建图文的超链接里搜索公众号,选择第一个对应的公众号,爬取这个公众号所有的历史消息。'''准备工作import osos.chdir(r'G:\公众号文章')from selenium import webdriver

2020-08-12 22:18:46 998

原创 python删除列表中空字符

一、目的近期,处理数据中遇到了删除列表中空字符的需求。# -*- coding:utf-8 -*-'''目的:删除None和'''''二、数据table1=[['地区', None, None, '公司名称', '', '注册资本', '', '成立时间', '银监会批复时间'], [None, None, None, None, None, '(亿元)', None, None, None], ['', '福建', '', '福建省闽投资产管理有限公司', '15', None,

2020-08-01 12:08:49 2041

原创 养家之人:原来和平如此珍贵!Stata豆瓣影评爬取并画词云图

《养家之人》20年后约定在海边相见。--那时候我都认不出你了。--你可以把蓝宝石高价卖给我。今天看了《养家之人》,十分触动。所以爬了下豆瓣影评并且画了个词云图来看看。*豆瓣影评*一、单个网页获取时间、链接、标题*infix读入clearcap mkdir "G:/豆瓣影评" //创建目标文件夹cd "G:/豆瓣影评" //更改当前工作路径到此文件夹copy "https://movie.douban.com/subject/26...

2020-07-31 00:23:46 1252 1

原创 来搞一个小爬虫~基金经理人信息!

'''爬取天天基金网站,所有基金经理人以及所管的基金的信息。网址:http://fund.eastmoney.com/Data/FundDataPortfolio_Interface.aspx?dt=14&mc=returnjson&ft=all&pn=50&pi=1&sc=abbname&st=asc关键字:get方法。流程:先获取第一层的namenumber,然后对于每一个namenumber爬取第二层的fund的信息。结果文件:g:\\fund.

2020-07-10 22:14:23 1446 3

原创 2020年上半年过去了,来给日记画个词云图呀~

作为一个常年写日记的人,从笔记本、手机、电脑各处都要写呀写。今天一看,7月份了,今年的上半年结束了,突发奇想对我上半年的日记来做个词云图吧~~~废话不多说,直接来。一、准备工作把日记word文档转换为txt文本文档,以备之后进行分析。直接打开word文档,点击“文件”“另存为”,类型选择“txt”即可。寻找一张作为词云图背景的图片。图片需要基本轮廓。通常下载的图片为矩形,进行抠图处理即可。二、代码实操简介'''图形可视化:读入中文文档,进行分词,剔除停用词,

2020-07-02 00:15:05 448

stopwords.txt

用于中文分词的停用词列表。 在我的python专栏的文章《2020年上半年过去了,来给日记画个词云图呀~》https://blog.csdn.net/crack6677/article/details/107074014中用到的就是这个停用词列表文档。

2020-07-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除