5 livan1234

尚未进行身份认证

我要认证

用技术力量探索行为密码,让大数据助跑每个人, 个人公众号:livandata 代码位于GitHub:https://github.com/livan123

等级
TA的排名 1w+

深度学习与推荐系统千字文——Attention机制

缘起注意力机制模仿了人类观察事物的过程,将其应用到深度学习中,人观察事物会分为两个过程:扫描全局,获取重点关注区域;对重点关注区域深化研究,并抑制其他无用信息。如上图,查看整个图形分两步:扫描重点文字,重点观看文字。注意力机制沿用了这一思路:先通过一个深度学习框架,实现扫描重点信息的功能,将重点信息存储在一个中间网络中,然后再通过另一个深度学习框架解读并深化中间网络中的信息。这其中,最普遍的框架为:Encoder-Decoder框架。注意力机制价值...

2020-07-15 00:33:16

推荐系统与深度学习千字文——FFM模型原理

上一篇我们讲解了FM模型:推荐系统与深度学习(一)——FM模型原理从FM的公式我们可以看出: FM中每个特征所对应的向量是唯一的: Vi是Xi的向量化表达,多个特征相乘的时候,只需要将Vi相乘,这一模型的优势在于考虑高维特征组合的情况下最小化运算量,但是问题也是有的:这一模型没有考虑各个特征之间的关系,而不同特征之间的关系恰巧是不一样的。例如: Publisher与Advertisor可能是正相关/强相关,Publisher与Gend...

2020-07-15 00:30:42

深度学习与推荐系统千字文——FM模型

前言简单的机器学习模型构建往往假设各个特征之间相互独立,并基于特征独立进行模型训练,例如:LR、SVM;但是实际场景中特征往往存在相互关联的,比如:女性更喜欢化妆品类广告,男性更喜欢球类装备广告:女性—化妆品,男性—球类设备两者之间的关联性较高。因此,关联特征需要考虑引入到模型建设中。关联特征在one-hot变化中是按照笛卡尔积的形式呈现的,容易引发高维灾难,比如性别和品类的关联特征如下:(男/球类)的向量为(女/球类,女/化妆品,男/球类,男/化妆品),on...

2020-07-15 00:27:45

web爬虫学习(六)——CSS反爬加密彻底破解

笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata0 惯性嘚瑟刚开始搞爬虫的时候听到有人说爬虫是一场攻坚战,听的时候也没感觉到特别,但是经过了一段时间的练习之后,深以为然,每个网站不一样,每次爬取都是重新开始,所以,爬之...

2020-04-10 10:05:44

假期过后,你的元气值恢复了吗?

清明三天假期眨眼就划过了,你的元气值恢复了吗,还是依然感觉疲惫?(关注公众号:livandata,回复:元气值,即可获取本文案例的代码)随着工作年限的增长,这一感觉似乎越来越明显,似乎一周七天里面最累的是周一——黑眼圈、惺忪眼、哈气连天,不自觉会想起曾经那个三天网吧,三天课堂的少年。那么,如何才能预测出一个人的工作恢复能力呢?笔者借着小伙伴的调研,做了简单的探索。有兴趣的小伙伴可以简单...

2020-04-07 23:50:57

如何预测“他”什么时候住酒店?

看到这个题目,大家是否会有一些小小的想法?别闹~笔者是一个正经人,讨论的也是一个技术问题,哈哈~每个人的行为都是有迹可循的,这些蛛丝马迹可以作为预测的数据支持,有没有想过一个人什么时候住酒店能够被预测出来?笔者作为一个从事机器学习方面的程序员,对这一问题表示肯定,因为,如果不信就没有工作了。笔者以为:所谓预测即为通过历史上遗留下来的蛛丝马迹:行为、订单甚至大厅门口的摄像头,判断某个...

2020-03-29 23:49:33

一文系统搞懂协同推荐算法(二)

笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值,找寻数据的秘密,笔者认为,数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata不知大家对推荐算法有没有一个系统的了解,推荐本身的逻辑很简单,就是需要找到用户喜...

2020-02-16 16:55:22

一文系统搞懂协同推荐算法(一)

推荐系统的重要性已经不需要过多的强调了,随处一搜索就能看到各领域的大佬告诉你推荐系统的构建方法,面试的时候不讲几个协同都不好意思说自己懂算法,各个资料都会对协同的每一个细节详细描述,不知大家看完之后有没有一个感触:各个知识点都了解了,就是串不起了,而且也多少会有些疑惑,就这么简单?被全宇宙的人推崇的推荐算法就是简单的几个表的来回计算吗?那平时我们应用的机器学习的各种算法都去哪里了?1、协同推荐...

2020-02-15 22:04:00

数据处理奇技巧——python篇

1、数据读取前五行方法:1)pandas读取时限定行数:此方法只将前5行读入到内存中,所以比较快速。import pandas as pddata = pd.read_csv('sub_customer.csv',nrows=5)2)head函数:也是pandas中的用法,不过这个用法需要将大量数据存入到内存中,然后才会读其中的前5行。import pandas as pd...

2020-01-04 20:49:33

数据处理奇技巧——hive篇

1、pmod(int a, int b):返回a除以b的余数的绝对值;cast(aaa as int):将string转化成int;cast(aaa as decimal(10, 2)):将string转化成float,保留两位小数;2、trim(String A):去除A两侧的空格;ltrim(String A):去除左边空格;rtrim(String A):去除右边空格...

2020-01-04 20:45:12

产品运营都必须知道的数据指标们

文章转载自公众号PB产品,作者 Soso 数据指标,在大多数时候确实可以衡量一个产品的好坏表现,不仅如此还可以帮助我们找到问题点,避免拍脑袋式的思考模式。近期经常碰到有些同事来问关于数据指标类的问题,因此本期期刊首先向大家介绍一下一些基础的数据指标的知识点。我们基本可以把用户行为指标分解成以下几种类型:点击浏览类指标用户活跃类指标最终转化类指...

2019-09-06 23:54:58

网站分析19——数据可视化及数据报告规范

数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata数据分析的一个总体步骤如下,可以看到,数据可视化非常重要。第一种为柱状图:第二种为曲线图:第三种为饼图:第四种为散点图/气泡图:第五种为雷达图:...

2019-07-21 11:39:02

网站分析18——网站竞品分析

数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata如何利用appstore来看你的创意是否可行?app的竞品分析可以在各大商城里查看他的下载量;主要查看的指标为:下载量、用户评价、应用详情页是否清晰;apple会每周更新精品推...

2019-07-20 23:15:53

网站分析17——数据分析的生命周期以及用户画像进行个性化运营

数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata1、数据分析的生命周期为:2、如果有逼格的提出一个问题:一般是基于场景的,比如:运营中常有的情况是pv下降,如果直接问:为什么我的pv下降了?估计没有人能回答,作为运营人员...

2019-07-20 23:13:48

网站分析16——移动产品数据分析的五大维度

数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata1、用户规模和质量分析:1)活跃用户指标用户启动app的次数和时长的指标。活跃用户数可以分为:日活、周活或者月活等。2)新增用户指标安装app之后首次激活用户的一个指标...

2019-07-20 23:02:07

网站分析15——数据分析常用数据指标

数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata除了前面的运营指标外,数据分析还有一些整体的分析指标,请了解:运营指标:https://blog.csdn.net/livan1234/article/details/96600265...

2019-07-20 17:09:03

网站分析14——网站分析的思路、方法和模型

数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata1、常见的网站分析需求为:1)用户价值衡量:FRM模型+马尔可夫链最近购买日、购买频率、购买金额;网站运营人员通常会将浏览网站的用户划分等级,因此需要建立一套顾客价值分析体系,...

2019-07-20 17:00:30

网站分析13——AARRR模型和留存率

数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata运营模型中的经典模型:1、AARRR模型:Acquisition(获客):获取客户的指标。Activation(活跃):活跃度。提高活跃度的方法:获客渠道与产品定位相匹配,...

2019-07-20 16:45:42

网站分析12——收益控制流的指标

数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata1、总收益2、流量类收益3、销售类收益订单包括所有的状态,比如:退换货等~4、会员类收益5、促销类收益我的公众号为:livandata...

2019-07-20 16:40:55

网站分析11——成本控制类指标

数据的价值不仅仅只体现在企业中,个人也可以体会到数据的魅力,用技术力量探索行为密码,让大数据助跑每一个人,欢迎直筒们关注我的公众号,大家一起讨论数据中的那些有趣的事情。我的公众号为:livandata成本是公司不得不考量的部分,常见的指标有:1、总成本以亚马逊为例,虽然他不盈利,但是总成本非常低,维护这个企业的现金流足够,所以市值非常高。2、流量类成本CPM:每...

2019-07-20 16:35:27

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 技术圈认证
    技术圈认证
    用户完成年度认证,即可获得
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。