自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (1)
  • 收藏
  • 关注

原创 排序、搜索和计数

排序,搜索和计数文章目录排序,搜索和计数排序numpy.sort()numpy.argsort()numpy.lexsort()numpy.partition()numpy.argpartition()搜索numpy.argmax()numpy.argmin()numppy.nonzero()numpy.where()numpy.searchsorted()计数numpy.count_nonzero()排序numpy.sort()numpy.sort(a[, axis=-1, kind='quic

2020-10-31 23:18:17 125

原创 GBDT+LR

1. GBDT+LR简介前面介绍的协同过滤和矩阵分解存在的劣势就是仅利用了用户与物品相互行为信息进行推荐, 忽视了用户自身特征, 物品自身特征以及上下文信息等,导致生成的结果往往会比较片面。 而这次介绍的这个模型是2014年由Facebook提出的GBDT+LR模型, 该模型利用GBDT自动进行特征筛选和组合, 进而生成新的离散特征向量, 再把该特征向量当做LR模型的输入, 来产生最后的预测结果, 该模型能够综合利用用户、物品和上下文等多种不同的特征, 生成较为全面的推荐结果, 在CTR点击率预估场景下使

2020-10-29 21:07:06 123

原创 数学函数和逻辑函数

文章目录向量化和广播数学函数算数运算numpy.addnumpy.subtractnumpy.multiplynumpy.dividenumpy.floor_dividenumpy.powernumpy.sqrtnumpy.square三角函数numpy.sinnumpy.cosnumpy.tannumpy.arcsinnumpy.arccosnumpy.arctan指数和对数numpy.expnumpy.lognumpy.exp2numpy.log2numpy.log10加法函数、乘法函数numpy.su

2020-10-27 23:24:49 322

原创 Task 4 Wide&Deep

文章目录1. 点击率预估简介2. FM它不香吗3. Wide & Deep模型的“记忆能力”与“泛化能力”4. 操作流程5. 代码实战1. 点击率预估简介点击率预估是用来解决什么问题?点击率预估是对每次广告点击情况作出预测,可以输出点击或者不点击,也可以输出该次点击的概率,后者有时候也称为pClick.点击率预估模型需要做什么?通过上述点击率预估的基本概念,我们会发现其实点击率预估问题就是一个二分类的问题,在机器学习中可以使用逻辑回归作为模型的输出,其输出的就是一个概率值,我们可以将机器

2020-10-27 23:14:36 104

原创 Task 3 数组操作

数组操作更改形状在对数组进行操作时,为了满足格式和计算的要求通常会改变其形状。numpy.ndarray.shape表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即 ndim 属性(秩)。【例】通过修改 shap 属性来改变数组的形状。import numpy as npx = np.array([1, 2, 9, 4, 5, 6, 7, 8])print(x.shape) # (8,)x.shape = [2, 4]print(x)# [[1 2 9 4]#

2020-10-25 20:45:06 72

原创 Task3 矩阵分解

1. 隐语义模型与矩阵分解协同过滤算法的特点就是完全没有利用到物品本身或者是用户自身的属性, 仅仅利用了用户与物品的交互信息就可以实现推荐,是一个可解释性很强, 非常直观的模型, 但是也存在一些问题, 第一个就是处理稀疏矩阵的能力比较弱, 所以为了使得协同过滤更好处理稀疏矩阵问题, 增强泛化能力, 从协同过滤中衍生出矩阵分解模型(Matrix Factorization,MF)或者叫隐语义模型, 两者差不多说的一个意思, 就是在协同过滤共现矩阵的基础上, 使用更稠密的隐向量表示用户和物品, 挖掘用户和物

2020-10-24 23:28:06 224

原创 Task 2 协同过滤

Task 2 协同过滤文章目录Task 2 协同过滤1. 协同过滤算法介绍2. 相似度度量方法3. 基于用户的协同过滤(UserCF)4. 基于物品的协同过滤5. 算法评估6. 协同过滤算法的权重改进7. 协同过滤算法的问题分析1. 协同过滤算法介绍基本思想:根据用户之前的喜好以及其他兴趣相近的用户的选择来给用户推荐物品(基于对用户历史行为数据的挖掘发现用户的喜好偏向,并预测用户可能喜好的产品进行推荐),一般是仅仅基于用户的行为数据(评价、购买、下载等), 而不依赖于项的任何附加信息(物品自身特征)

2020-10-22 15:47:31 62

原创 Task 2 索引、切片和迭代

Task 2 索引、切片和迭代文章目录Task 2 索引、切片和迭代副本和视图索引与切片1. 整数索引2. 切片索引3. dots索引4. 整数数组索引5. 布尔索引数组迭代练习副本和视图在 Numpy 中,尤其是在做数组运算或数组操作时,返回结果不是数组的 副本 就是 视图。所有赋值运算不会为数组和数组中的任何元素创建副本。numpy.ndarray.copy() 函数创建一个副本。 对副本数据进行修改,不会影响到原始数据,它们物理内存不在同一位置。import numpy as npx

2020-10-22 13:59:13 100

原创 Task 2 协同过滤

Task 2 协同过滤文章目录Task 2 协同过滤1. 协同过滤算法介绍2. 相似度度量方法3. 基于用户的协同过滤(UserCF)4. 基于物品的协同过滤5. 算法评估6. 协同过滤算法的权重改进7. 协同过滤算法的问题分析1. 协同过滤算法介绍基本思想:根据用户之前的喜好以及其他兴趣相近的用户的选择来给用户推荐物品(基于对用户历史行为数据的挖掘发现用户的喜好偏向,并预测用户可能喜好的产品进行推荐),一般是仅仅基于用户的行为数据(评价、购买、下载等), 而不依赖于项的任何附加信息(物品自身特征)

2020-10-20 19:45:43 131 1

原创 Task 1 推荐系统简介

推荐系统简介文章目录推荐系统简介推荐系统简介常用评测指标召回1. 召回层在推荐系统架构中的位置及作用2. 多路召回策略3. Embedding召回推荐系统简介What用户:推荐系统是一种帮助用户快速发现有用信息的工具公司:推荐系统是一种增加公司产品与用户接触,购买等行为概率的工具Why用户:在用户需求并不十分明确的情况下进行信息的过滤,与搜索系统相比,推荐系统更多的利用用户的各类历史信息猜测其可能喜欢的内容公司:解决产品能够最大限度地吸引用户,留存用户,增长用户黏性,提高用户转

2020-10-19 19:49:03 87

原创 Task 01 数据类型及数组创建

Task 01 数据类型及数组创建文章目录Task 01 数据类型及数组创建常量numpy.nannumpy.infnumpy.pinumpy.e数据类型创建数据类型数据类型信息时间日期和时间增量datetime64datetime64 和 timedelta64 运算数组的创建1. 根据现有数据创建ndarray2. 依据 ones 和 zeros 填充方式3. 利用数值范围创建ndarray4. 结构数组的创建数组属性常量numpy.nan表示空值。nan = NaN = NAN两个n

2020-10-19 15:54:07 414 1

原创 算法复习III 查找

文章目录一.查找表考虑的基本数据结构算法应用LeetCode 349 Intersection Of Two Arrays 1题目描述分析实现LeetCode 350 Intersection Of Two Arrays 2题目描述分析实现LeetCode 242 Intersection Of Two Arrays 2题目描述分析实现LeetCode 202 Happy number题目描述分析实现tipsLeetCode 290 Word Pattern题目描述分析实现tipsLeetCode 205

2020-08-25 23:34:34 521

原创 算法复习II 动态规划

算法复习II 动态规划本文目录文章目录算法复习II 动态规划动态规划介绍1. 设计思想2. 算法步骤3. 动态规划模板步骤算法应用1. [5. 最长回文字符串](https://leetcode-cn.com/problems/longest-palindromic-substring/)2. [72. 编辑距离](https://leetcode-cn.com/problems/edit-distance/)动态规划介绍1. 设计思想动态规划法江待求解问题分解为若干个相互重叠的子问题,每个子

2020-08-22 01:19:42 86

原创 分而治之好——算法复习I 分治算法

分而治之好——算法复习I 分治算法文章目录分而治之好——算法复习I 分治算法分治算法介绍1. 设计思想2. 算法步骤3. 平衡子问题算法应用1. [50. Pow(x, n)](https://leetcode-cn.com/problems/powx-n/)2. [53. 最大子段和](https://leetcode-cn.com/problems/maximum-subarray/)3. [169. 多数元素](https://leetcode-cn.com/problems/majority-el

2020-08-18 10:02:51 192

原创 Task 6 基于Bert的文本分类

Task 6 基于Bert的文本分类学习目标了解Transformer的原理和基于预训练语言模型(Bert)的词表示学会Bert的使用,具体包括pretrain和finetuneTransformer原理Transformer是在"Attention is All You Need"中提出的,模型的编码部分是一组编码器的堆叠(论文中依次堆叠六个编码器),模型的解码部分是由相同数量的解码器的堆叠。我们重点关注编码部分。他们结构完全相同,但是并不共享参数,每一个编码器都可以拆解成两部分。在对输

2020-08-03 21:52:27 464

原创 通过you-get在哔哩哔哩下载视频报错处理

通过you-get在哔哩哔哩下载视频报错处理1. ‘seid’ 不是内部或外部命令,也不是可运行的程序或批处理文件。解决方案:发现URL中有 seid此URL为https://www.bilibili.com/video/av70546450?from=search&seid=17641267420827381771更改URL为https://www.bilibili.com/...

2019-12-12 21:13:20 10991 5

转载 每日一练 指针数组

指针数组定义 int p[n];[]优先级高,先与p结合成为一个数组,再由int说明这是一个整型指针数组,它有n个指针类型的数组元素。这里执行p+1时,则p指向下一个数组元素,这样赋值是错误的:p=a;因为p是个不可知的表示,只存在p[0]、p[1]、p[2]…p[n-1],而且它们分别是指针变量可以用来存放变量地址。但可以这样 p=a; 这里p表示指针数组第一个元素的值,a的首地址的值。如...

2018-12-18 23:27:49 121

原创 蓝桥杯每周一题3‘ X星球居民

X星球居民小区的楼房全是一样的,并且按矩阵样式排列。其楼房的编号为1,2,3…当排满一行时,从下一行相邻的楼往反方向排号。比如:当小区排号宽度为6时,开始情形如下:1 2 3 4 5 612 11 10 9 8 713 14 15 …我们的问题是:已知了两个楼号m和n,需要求出它们之间的最短移动距离(不能斜线方向移动)输入为3个整数w m n,空格分开,都在1到100...

2018-12-17 12:44:16 431

2022李永乐线代讲义练习题答案.pdf

2022李永乐线代讲义练习题答案

2021-09-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除