自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(138)
  • 收藏
  • 关注

原创 写在秋招第一场眼泪

记录下今天的伤心,哭了一场之后,放松了许多~~~

2019-09-11 12:32:01 515

原创 招银科技面试

1、自我介绍2、用过什么数据库?熟悉程度如何?3、排序算法,写快排代码(我直接描述的)4、一个基本有序的序列,哪种排序方式最好?(插入或者交换吧)5、量特别大的数据集,10亿,一次不能全部放在内存里,如何选出出现频次最高的数据?(网上看了一个Map-Reduce,堆排序什么的)6、电话面试的时候问了索引,你没答上来,现在知道了吗?索引的缺点是啥?7、重载和重写是为了实现什么...

2019-09-09 15:18:12 7927

原创 实习归来

本周结束实习生涯,开始正视秋招回到教研室,我记忆开始恍惚了。。。我这几个月的实习究竟是真实的还是梦一场?哈哈。。。恍惚间感觉一切回到春招实习的阶段,教研室所有小伙伴每天的生活三点一线:宿舍-食堂-教研室。每天的工作重点:改简历-投简历-笔试-面试。有时候我想要逃避的生活正是这群热血青年每天迎头赶上的生活。给自己打一点点鸡血,我可以,我可以,我可以!!!...

2019-09-05 11:47:20 449

原创 巧用excel公式提取网址中的域名---超级好用

巧用excel公式提取网址中的域名-超级好用经常会整理很多网址,需要按照他们的域名归类,下面是公式在a1列是我们要整理的网址 b列我们输入公式=MID(A1,SEARCH("/",A1,SEARCH("/",A1)+1)+1,SEARCH("/",A1,SEARCH("/",A1,SEARCH("/",A1,SEARCH("/",A1)+1))+1)-SEARCH("/",A1,SE...

2019-07-12 11:58:41 6783

原创 宽表

宽表从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余,与之相对应的好处就是查询性能的提高与便捷。这种宽表的设计广泛应用于数据挖掘模型训练前的数据准备,通过把相关字段放在同一张表中,可以大大提高数据挖掘模型训练过程中迭代计算时的效率问题。...

2019-06-21 09:57:33 3228

转载 Griddle 框架--面向商品推荐的级联框架

前言当我们讨论推荐系统的时候, 我们一般是说广告推荐. 对于广告推荐, 业界最领先的架构是采用两层架构. 使用一个双塔结构做召回, 再用一个 FNN 模型做排序.但是在业界广告推荐并不是推荐系统的全部, 还有一类非常重要的推荐系统是商品推荐. 所谓的商品推荐, 是指为互联网产品的内容和商品做展示推荐. 这类推荐对比广告推荐, 有个几个特点. 在产品形态上会更多变, 在目标导向上会考虑用...

2019-06-19 11:48:11 462

原创 NVL(expr1, expr2)

NVL(expr1, expr2):1、空值转换函数;2、类似于mysql-nullif(expr1, expr2),sqlserver-ifnull(expr1, expr2)。备注:1、如果expr1为NULL,返回值为 expr2,否则返回expr1。2、适用于数字型、字符型和日期型,但是 expr1和expr2的数据类型必须为同类型。...

2019-06-17 10:29:37 514

原创 hive执行报错的解决方式--bug(1)

Query ID = 11102129_20190605160101_98bcf445-eea6-437a-9073-e2394663d618.Total jobs = 1.Launching Job 1 out of 1.Number of reduce tasks not specified. Estimated from input data size: 1099.In order...

2019-06-05 17:33:14 2765 2

原创 什么是Banner图?

banner是网络广告中最常见的广告形式。一般翻译为网幅广告、旗帜广告、横幅广告等,尺寸是468*60像素,一般使用GIF格式的图像文件,可以是静态图形,也可用多帧图像拼接为动画图像。一般用户可以使用Fireworks MX 来设计一张GIF动画Banner.Banner制作你一定见过网页中会动的广告Banner。变换的图片很能吸引浏览者的注意。它实际上是一个动态的GIF图形文件,也就是一个...

2019-05-31 11:38:05 12369

转载 RFM模型分析

作者:空白白白白链接:https://www.zhihu.com/question/49439948/answer/254004098来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。这是一个人人都可以上手的模型,不管你是运营、销售、财务、市场等等,RFM模型是一个很通用,又有一套科学理论的商业模型。这是一篇我花了五小时的教程(真的是写到崩溃,幸好我熬...

2019-05-25 14:26:48 2000 1

转载 CTR预估中的贝叶斯平滑方法(一)原理及实验介绍

1. 背景介绍广告形式:互联网广告可以分为以下三种:1)展示广告(display ad)2)搜索广告(sponsored search ad)3)上下文广告(contextual ad)竞价模式:对于在线广告,主要有以下几种竞价模式:1)pay-per-impression(按展示付费):广告商按照广告被展示的次数付费,这是一种最普遍的竞价模型。缺点在于没有考...

2019-05-24 20:11:57 920

转载 CTR预估中的贝叶斯平滑方法(二)参数估计和代码实现

1. 前言前面博客介绍了CTR预估中的贝叶斯平滑方法的原理http://www.cnblogs.com/bentuwuying/p/6389222.html。这篇博客主要是介绍如何对贝叶斯平滑的参数进行估计,以及具体的代码实现。首先,我们回顾一下前文中介绍的似然函数,也就是我们需要进行最大化的目标函数:下面我们就基于这个目标函数介绍怎样估计参数。2. 参数估计的几种方...

2019-05-24 20:11:18 485

原创 APP冷启动和热启动之间的区别

冷启动:指app被后台杀死后,在这个状态打开app,这种启动方式叫做冷启动。热启动:指app没有被后台杀死,仍然在后台运行,通常我们再次去打开这个app,这种启动方式叫热启动。...

2019-05-24 15:09:24 20408

转载 常见的广告收费模式

常见广告收费模式大全  一个网络媒体(网站)会包含有数十个甚至成千上万个页面,网络广告所投放的位置和价格 就牵涉到特定的页面以及浏览人数的多寡。这好比平面媒体(如报纸)的“版位”、“发行 量”,或者电波媒体(如电视)的“时段”、“收视率”的概念。网络媒体常见的广告收费模式有以下几种:[编辑]CPM:按展示付费  CPM—英文全称Cost Per Mille或者是Cost Pe...

2019-05-23 21:24:43 3632

转载 初识DeepLink

Deeplink,简单讲,就是你在手机上点击一个链接之后,可以直接链接到app内部的某个页面,而不是app正常打开时显示的首页。什么是DEEPLINK?通过字面意思我们可以理解到Deeplink是App应用中的深度链接,如果把App看做一个网站,那么Deeplink就是网站中的一个深入页面,比如产品专题页面,活动促销页面等。Deeplink在App市场推广运营中起到很好的作用,APP运营人...

2019-05-23 14:24:26 207

原创 实习体验

来到这里的第七个工作日,感受了互联网企业的生机,也开始思考着人生。 若说进入职场的时间,也许我远远超过周围的这群小伙伴。但是论及职业规划,可能如今的我已经错失了最佳发展时期。抓住最后的小尾巴,努力的挣扎着、努力的汲取营养。 希望在这里的每一天都是充实、开心的,加油,姑娘,你可以的~~~...

2019-05-20 20:17:08 308 1

原创 目标群体指数TGI

目标群体指数(Target Group Index,TGI) 目录 [隐藏] 1什么是目标群体指数 2目标群体指数的计算 [编辑]什么是目标群体指数  目标群体指数是一个“倾向性指数”,是指某一子群、某一指标的比例,与总群同一指标比例之比,再乘以标准数100所得的值。目标群体指数可反映目标群体在特定研究范围(如地理区域、人口统计领域、媒体...

2019-05-20 16:44:05 3841

转载 count(1)、count(*)与count(列名)的执行区别

执行效果:1.count(1) and count(*)当表的数据量大些时,对表作分析之后,使用count(1)还要比使用count(*)用时多了!从执行计划来看,count(1)和count(*)的效果是一样的。 但是在表做过分析之后,count(1)会比count(*)的用时少些(1w以内数据量),不过差不了多少。如果count(1)是聚索引,id,那肯定是count...

2019-05-17 11:39:21 144

转载 R语言︱情感分析—基于监督算法R语言实现(二)

监督算法型主要分别以下几个步骤:构建训练+测试集+特征提取(TFIDF指标)+算法模型+K层交叉验证。可与博客对着看:R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)————————————————————————————————————————————————基于监督算法的情感分析存在着以下几个问题:(1)准确率而言,基于算法的方法还有待提高,而目前的算法模型准...

2019-05-16 14:51:02 878

转载 《七天数据埋点之旅》第四天 埋点设计(下)

0x00 前言在上节中我们介绍了埋点设计时四种主要思维方式,本节我们挑选典型的疑难埋点场景进行埋点设计。通过本节的阅读,你将获得以下典型场景埋点设计的认知: 刷新流 列表式 点击相关 联动演化 0x01 刷新流刷新流又称服务流,是在新闻资讯类APP中常见的交互形式,随着用户不断的滑动,内容不听的更新,根据刷新的方式有分为全部刷新和增量刷新,而增量刷新...

2019-05-14 21:08:30 806

转载 《七天数据埋点之旅》第三天 埋点设计(上)

0x00 前言在前两篇《初识埋点》和《埋点之前》的基础上,我们应该有了对埋点的基本认识、知道了具体的开发流程。本篇在前面铺垫的基础上进入具体的埋点设计环节。通过本篇的阅读,你将获得以下五个埋点设计思维的认知。 漏斗思维 层次思维 扩展思维 分类思维 0x01 漏斗思维漏斗思维即分阶段思维,是从流水线的角度考虑问题,追踪整个链条,具体有以下两种形...

2019-05-14 21:07:49 2370

转载 《七天数据埋点之旅》第二天:埋点之前

0x00 前言上一篇我们初识了埋点,介绍什么是埋点、埋点的用途和埋点分类,那是不是马上就可以开始设计埋点了,答案是否定的。在埋点设计之前还有很多工作要做。通过本篇的阅读,你将对埋点之前的准备工作和埋点的流程有更加清晰的认识,本篇按顺序介绍如下: 了解产品 梳理旧需求 梳理旧埋点 熟悉埋点流程 0x01 了解产品所谓磨刀不误砍柴工,...

2019-05-14 21:06:47 767

转载 《七天数据埋点之旅》第一天:初识埋点

0x00 前言本篇为《七天数据埋点之旅》的第一篇,通过阅读本篇,你将获得以下三方面的知识: 什么是埋点? 埋点的用途? 埋点的分类? 0x01 什么是埋点数据埋点是数据采集的一种重要方式,主要用来记录和收集终端用户的操作行为,其基本原理是在App/H5/PC等终端部署采集的SDK代码,当用户的行为满足某种条件的时候,比如进入某个页面、点击某个按钮等,会自...

2019-05-14 20:58:28 2659 1

转载 MySQL中concat函数

MySQL中concat函数使用方法:concat(str1,str2,…)返回结果为连接参数产生的字符串。如有任何一个参数为NULL,则返回值为NULL。mysql>selectconcat('11','22','33');+------------------------+|concat('11','22','33')|+--------------...

2019-05-14 19:03:51 137

转载 埋点的3种方式概述

埋点的3种方式概述1、第三方SDK(又可称前端数据采集)通过这种 SDK 只能够采集到一些基本的用户行为数据,比如设备的基本信息,用户执行的基本操作等。但是服务端、数据库中的数据并没有采集客户端 SDK 还有一个问题就是经常觉得统计的不准,和自己的业务数据库数据对不上,出现丢数据的情况。这是前端数据采集的先天缺陷,因为网络异常,或者统计口径不一致,都会导致数据对不上2、使用业务数据库做统...

2019-05-14 17:58:17 4055

转载 [Hive基础]-- like和rlike区别

[Hive基础]-- like和rlike区别like与rlike有什么区别呀?后面我百度查了一下,大概归纳如下,希望对大家有帮助:1、定义 (1)like的内容不是正则,而是通配符。像mysql中的"like",但是建议使用高级函数"instr"效率更高。 (2)rlike的内容可以是正则,正则的写法与java一样。需要转义,例如'\m'需要使用...

2019-05-14 17:47:01 3735

转载 MySQL模糊查询使用INSTR替代LIKE

使用内部函数INSTR,代替传统的LIKE方式查询,并且速度更快。INSTR()函数返回字符串中子字符串第一次出现的位置。如果在str中找不到子字符串,则INSTR()函数返回零(0)。下面说明了INSTR函数的语法。INSTR(str,substr);1INSTR函数接受两个参数:str 是要搜索的字符串。substr 是要搜索的子字符串。MySQL INSTR函数...

2019-05-14 16:15:08 676

转载 MySQL日期加减

1、MySQL 为日期增加一个时间间隔:date_add()set @dt = now();select date_add(@dt, interval 1 day); # 加1天select date_add(@dt, interval 1 hour); # 加1小时select date_add(@dt, interval 1 ...

2019-05-14 16:02:51 194

转载 广告曝光相关专业名词

广告行业中常说的 CPC,CPM,CPD,CPT,CPA,CPS 等词的意思是什么?|广告入门广告广告主:投放广告的金主,有钱的。流量主:有流量,接广告变现的。广告行业内存在的几种方式主要是CPA,CPC,CPM,CPT,CPS几种。CPA:为每一次的用户行为付费。CPA,它的含义是指按照用户的行为进行计费,这个行为有很多种比如“一个公众号关注1.5元”,再比...

2019-05-14 09:02:18 1341

转载 RFM分析(Recency,Frequency,Monetary)

通过RFM方法,我们根据用户的属性数据分析,对用户进行了归类。在推送、转化等很多过程中,可以更加精准化,不至于出现用户反感的情景,更重要的是,对产品转化等商业价值也有很大的帮助。应用背景:在产品迭代过程中,通常需要根据用户的属性进行归类,也就是通过分析数据,对用户进行归类,以便于在推送及转化过程中获得更大的收益。分析方法:RFM分析(Recency,Frequency,Mone...

2019-05-13 20:14:42 13052 1

转载 什么是数据分析的漏斗模型?

什么是数据分析的漏斗模型?漏斗模型关于漏斗模型,我认为本质是分解和量化。为什么这么说,这里以营销漏斗模型举栗。百科给出的解释:营销漏斗模型指的是营销过程中,将非潜在客户逐步变为客户的转化量化模型。营销漏斗模型的价值在于量化了营销过程各个环节的效率,帮助找到薄弱环节。也就是说营销的环节指的是从获取用户到最终转化成购买这整个流程中的一个个子环节,相邻环节的转化率则就是指用数据指标...

2019-05-13 17:32:03 572

原创 春招实习尘埃落定

在周一敲定实习以后,意味着研二的最后一次以实习生身份参加的春招告一段落。从3月份回校之后,我后知后觉的加入大部队开始投递各种公司的暑期实习开始,面壁被拒,各种心情down到极点。。。BAT都投递了,但是只有百度给了我宝贵的一面,划水的阿里和腾讯做了笔试之后,就进入了遥遥无期的等待。在巨头倒下的时候,我开始有点觉得大公司貌似并不缺我这种小虾米。真的是虾米一样的存在,在世间浮浮沉沉。其实...

2019-05-09 10:16:49 249

转载 从广告图到广告落地页

作为产品经理在页面信息结构,用户体验及文案设计上也需要掌握这些技能,毕竟点击及转化也是产品经理需要关注的指标。一、两步营销法第一步,通过广告吸引潜在顾客的关注大家投放网络广告的思路一般都是通过广告吸引用户点击,然后引导用户购买,最后希望用户反复购买,成为常客。但在这个过程中大部分的公司及营销人员都会采用一步营销法,即通过广告直接销售产品,类似广撒网的形式,不管哪个群体,争取大的...

2019-05-06 10:38:06 1293

转载 如何判断百度query需求来评判网页质量好坏

用户为满足自己某种需求而来到搜索引擎的,判断用户的需求是做好网站的开始。只有准确地判断出用户需求,了解用户搜索的目的,才能合理地衡量出一个网站结果的质量好,做好搜索的同时,也得注重网站的内容。下面53课件网就如何判断百度query需求来网页质量好坏来分析以下几点建议。 一、如何判断query需求 多数Query,本身表述清楚,含义明确,以其表达出来的意思为...

2019-05-05 20:27:25 774

原创 绘制中国地图

#绘制中国地图install.packages('XML')install.packages('rjson')install.packages("httr")devtools::install_github("lchiffon/REmap")devtools::install_github("lchiffon/baidumap")library(devtools)library(...

2019-05-05 11:35:36 1278

转载 概率论 基本概率模型、分布、期望和方差

基本概念等可能概型(古典概型)特点试验的样本空间只包含有限个元素; 试验中每个基本事件发生的可能性相同。公式设试验的样本空间为S={e1,e2,e3,…,en}{e1,e2,e3,…,en},若事件A包含k个基本事件,即A={ei1}⋃{ei1}⋃…{eik}{ei1}⋃{ei1}⋃…{eik},这里i1,i2,…,iki1,i2,…,ik是1,2,…,n1,2,…,n中k个不...

2019-05-05 11:08:07 5893 1

原创 投递记录

用户行为研究部_数据分析产品经理(实习)所属部门:百度 工作地点:北京市 招聘人数:若干 公司:百度 职位类别:产品 发布时间:2019-02-20工作职责:-负责百度公司各产品的用户体验分析工作,通过数据分析用户体验痛点,提出有效的产品优化建议-建设用户体验分析模型,客观准确的衡量产品的用户体验-支持不同产品的评估分析...

2019-04-30 15:24:12 351

转载 ArcGis10.4下载及破解安装

第一步为安装licence manager打开\ArcGIS10.4\LicenseManager中的Setup.exe接受,next安装位置默认为C盘,由于LicenseManager本身并不大,可以安装在C盘。如果对电脑C盘内存剩余大小无要求的同学可以直接安装。但是本人的电脑软件实在是太多了,于是自己建了个文件夹,安装到了其他盘。然后next-install即可...

2019-04-25 10:52:40 27898 10

原创 地理加权回归

gwr.sel <- function(formula, data = list(), coords, adapt=FALSE, gweight=gwr.Gauss, method="cv", verbose=TRUE, longlat=NULL, RMSE=FALSE, weights, tol=.Ma...

2019-04-25 10:07:30 3156

原创 数据规范化的方法

数据挖掘之数据规范化  数据规范化处理是数据挖掘的一项基本操作。现实中,数据中不同特征的量纲可能不一致,数值间的差别可能很大,不进行处理可能会影响到数据分析的结果,因此,需要对数据按照一定比例进行缩放,使之落在一个特定的区域,便于进行综合分析。特别是基于距离的挖掘方法,在建模前一定要对数据进行规范化处理,如SVM,KNN,K-means,聚类等方法数据规范化处理处理主要有以下三种...

2019-04-22 18:56:38 4190

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除