自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

欢迎来到小丁的技术空间

小丁目前研二,研究方向为推荐系统,该博客主要记录平时写代码,学习遇到的一些问题的总结,欢迎一起交流

  • 博客(203)
  • 资源 (5)
  • 收藏
  • 关注

原创 SQL面试必会50题(含答案和学习链接)

最近在刷 sql 题,刷完了网上的 SQL 面试必会 50 题,现把我的答案和思路整理如下,供大家参考。这是目录一、创建四张表二、SQL面试必会50题(不含答案)三、SQL面试必会50题(含答案)四、学习资料一、创建四张表如图,以上学生表、成绩表、课程表、教师表是我们所有题目的基础表,创建的语句如下:--学生表CREATE TABLE `Student`(`s_id` VARCHAR(20),`s_name` VARCHAR(20) NOT NULL DEFAULT '',`s_bir.

2020-09-07 23:32:06 23507 17

原创 基本机器学习sklearn接口

下面列举了常见的机器学习算法的sklearn接口。1、LinearRegressionfrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LinearRegression #线性回归iris = load_iris() #加载数据集X,y = iris.data,iris.target #(150,4.

2020-07-07 15:13:10 1193

原创 Sklearn简单学习笔记

下面是学习了莫烦大佬 sklearn 教程的笔记,是供我自己查阅的,不是很详细,介意的勿看~ 莫烦大佬的教程链接在最后一点学习资料里面。这是目录一、下载与安装二、选择合适的机器学习方法三、通用的学习模式四、sklearn 的 datasets 数据库五、常用属性和功能六、预处理数据七、交叉验证八、保存模型九、学习资料一、下载与安装使用命令:pip install -U scikit-learn 或者 conda install scikit-learn二、选择合适的机器学习方法三、通用的学习.

2020-07-03 00:41:59 485

原创 Matplotlib学习笔记

文章目录1、引入包2、基本用法3、Figure4、修改图片的横纵坐标值5、修改坐标轴的位置6、显示图例7、添加注解8、调整刻度背景9、画散点图10、画柱状图11、绘制等高线12、打印图像13、3D数据图14、多个图15、图中图16、参考链接1、引入包import numpy as npimport matplotlib.pyplot as pltimport matplotlib.gridspec as gridspec2、基本用法def show1(): """ 基本用法

2020-06-12 17:10:20 694

原创 LibRec 学习笔记(十二):SBPR 的训练 Loss 为什么越来越大,没有收敛的迹象?

简单记录刚刚在使用 librec 时发现的一个小点,发现越训练,loss值越大???训练的数据集是 filmtrust ,训练的效果如下图所示,loss值一直在上升,肯定是有问题的!说明:上图的 loss 是每一次迭代的 loss 总值delta_loss 是上一次迭代的 loss 值 - 本次迭代 loss 值在网上查了下才发现可能是学习率太大的原因去查了资料才发现是...

2020-04-24 21:35:13 2405 6

原创 LibRec 学习笔记(十一):更新 LibRec 3.0 版本的 code snippet(含过滤模块)

下面是代码:package librec.qiqi;import java.io.IOException;import java.util.ArrayList;import java.util.List;import org.apache.commons.logging.Log;import org.apache.commons.logging.LogFactory;impor...

2020-04-19 15:58:42 1101 10

原创 推荐系统常见问题(七):惊讶!为什么训练集比例越大,效果越差?

一、苦恼的一周最近做实验,被一个问题苦恼了一周。本来想要验证算法在40%、60%、80%数据集比例情况下的不同实验效果。结果发现,训练集比例越大,效果竟然越差!!!这和我以往的–训练集越多,训练效果越好的认知完全相违背!!!然后我开始一个个的排除这样情况的原因:先看看是不是我训练集和测试集的弄反了,结果没有反;再看看我的实验方法是不是哪里有错误,结果找不出错误;然后我又在想我划分数据集...

2020-04-02 19:03:26 6543 8

原创 推荐系统常见问题(六):CTR 预估和推荐系统有什么区别???

在学习推荐系统的时候,一方面搞不清楚推荐系统和机器学习的差别,一方面搞不清楚 CTR 预估和推荐系统的差别。。。这学的也太费劲了。。。下面的答案来自知乎,这是链接,我从中选取了自认为说的比较有道理的几个答案。答案一正好在计算广告和推荐系统两个领域都有从业经验,就答一下这个问题。题目问的是CTR和推荐算法的“本质”区别,那么我们就得往“本质”上说,什么算法原理上的区别,系统设计上的区别,...

2020-04-02 00:19:55 3091

原创 推荐系统常见问题(五):推荐系统中的目标函数有哪些类型?

一直以来对于机器学习和推荐系统是有什么区别,有什么联系???搞不懂!尤其是机器学习中有目标函数,优化方法一说,而推荐系统中也有这一说,这两东西难道是一个东西???到现在都有些迷迷糊糊的。所以下面是自己的粗浅看法,并不一定对,之后知识有更新了,再来链接里更新~一、机器学习中的目标函数我们都知道在机器学习中 目标函数 = 经验风险 + 结构风险经验风险:即代价函数,是整个训练集上所有样本误差...

2020-04-01 22:37:01 1508

原创 LibRec 学习笔记(十):代码走读 MostPopularRecommender

最近做实验,瞄了一眼MostPopularRecommender推荐的结果,与我想象中的结果不一样,我想象的是这个算法给每个人推荐一模一样的列表,但是这里显示的结果并不是这样,遂仔细研究了下,以下是我粗浅的分析。这是目录一、算法思想二、MostPopularRecommender 代码走读三、MostPolularTestCase 代码走读四、推荐的时候,是否需要剔除用户已经消费过的物品?...

2020-04-01 17:58:01 940

原创 LibRec 学习笔记(九):如何利用已有轮子 LibRec 库实现自己的推荐算法?

在 LibRec 中实现自己的算法,首先需要按照自己算法所属的类别去继承相应的抽象类,并按要求去实现相应的抽象方法,也可以按自己的需要去重写抽象类中的方法。目前...

2020-04-01 16:25:05 1958 7

原创 推荐系统常见问题(四):如果物品没有在训练集中出现过,而在测试集中出现,如何计算RMSE?

这个问题是别人问我的一个问题,想想也是一个常见问题,所以更新上来。原问题:训练集与测试集划分后有可能某个物品只出现在测试集中,这种情况在训练时得不到该物品的潜在特征向量就无法得到用户对该物品的评级预测,这时该怎么计算RMSE?答:首先是可以得到该物品的特征向量的,同时也可以得到用户对该物品的评级预测的。矩阵分解方法的目的是为了矩阵分数补全,通过将用户-物品-评分矩阵分解成用户矩阵 P ...

2020-03-21 18:46:26 1596

原创 推荐系统常见问题(三):TopN 推荐是对训练集中的用户进行推荐,还是对测试集中的用户进行推荐?

从我学习推荐系统以来,一直有个疑问深深的困扰着我,那就是到底是对训练集中的用户进行推荐,还是对测试集中的用户进行推荐呢?之所以一直苦思冥想是因为我认为这关系着我做的实验的的评估效果怎么样,比如 Precision 和 Recall。目录一、误区产生的原因 ?二、我现在终于释怀了 !三、为什么我不对评分预测任务感到迷糊 ?四、我选择 TopN 推荐!一、误区产生的原因 ?以下是我自己的苦思...

2020-03-17 18:36:29 3991 29

原创 LibRec 学习笔记(八):如何固定每次算法运行的推荐结果?

固定每次算法运行的推荐结果是非常有必要的,这样可以方便其他人进行复现。目录一、算法的哪些部分发生变化可能会产生不一样的推荐结果?二、在 LibRec 中的解决办法一、算法的哪些部分发生变化可能会产生不一样的推荐结果?数据集划分部分,比如下面的代码是按给定比例将数据集划分为测试集和训练集,如果采用的写法如下,那么一般会造成划分训练集和测试集数据的随机性,因此可能会导致不一样的推荐结果。...

2020-03-17 16:54:19 529

原创 服务器使用笔记(六):登录远程服务器

如果对方给了自己一个 IP 地址和端口号,以及登陆用户名和密码,这时如何登陆远程服务器呢?目录一、正常情况下登陆远程服务器二、需要先连接内网才能连接远程服务器一、正常情况下登陆远程服务器一般是使用 ssh 工具进行登陆,这里推荐下载使用 putty,附上链接,下载对应版本即可,图示是我下载的版本打开 putty,默认会出现以下界面,输入 IP 地址和端口号点击 open 选项即可...

2020-03-10 21:23:41 919

原创 推荐系统论文集合(一):矩阵分解家族

下面根据矩阵分解的发展路线,列出相关文献(会持续进行更新):SVD奇异值分解,主要作用是降维,适用于图像压缩,还有推荐系统。NMF (1999)Lee et al. Learning the parts of objects by non-negative matrix factorization. Nature 401.6755 (1999): 788. paperFunkSVD ...

2020-03-08 15:46:27 1418

原创 LibRec 学习笔记(七):代码走读 SBPR 算法

目录SBPR源码注释解释1、SBPRRecommender.java 中 setup() 基类里有什么?解释2:SBPR 中的训练方式解释3:SBPR 中的预测方法下面是在 LibRec 库里面关于复现 SBPR 算法的代码,现加上注释发出来:SBPR源码注释package net.librec.recommender.context.ranking;import com.google.c...

2020-02-23 21:28:01 1824 7

原创 服务器使用笔记(五):我常用的 docker 命令

此文章记录我常用的 docker 命令,方便我随时翻阅:1、查看所有的 docker 信息docker ps -a2、查看已经开启服务的 docker 信息docker ps3、关闭指定 docker 容器docker stop 容器名|容器ID4、开启指定 docker 容器docker start 容器名|容器IDdocker attach 容器名|容器IDservice ...

2020-02-18 17:47:54 267

原创 服务器使用笔记(三):登录远程服务器时出现错误 ssh_exchange_identification: read: Connection reset

我是使用 ssh 命令进行远程登陆服务器的,并且由于访问的是校内的服务器,我使用的校内 VPN 进行访问。但是当我每次通过远程命令把校内服务器进行重启之后,我一般再次登陆都会出现ssh_exchange_identification: read: Connection reset这个错误。后来发现我只要把连接 VPN 的工具 Easyconnect 重新删除并且使用记录也删除之后,然后再重新下...

2020-02-18 14:30:34 3513 6

原创 服务器使用笔记(一):bash 脚本快速批量开启指定 docker 容器

我所在的实验室有 4 台 GPU 服务器,为了让大家方便使用,实验室给每个同学都分配了一个 docker 账号,当然,不是所有的 docker 都会被开启服务,因为资源有限,必须要限制大家对资源的使用。所以实验室决定让大家每周填表申请使用服务器,填了申请的,就把相应的 docker 打开。这样一个差事最后落在了我的头上…手动一个一个分配的状态持续了一年,今天我才知道是可以直接写个脚本帮助我加快这...

2020-02-15 00:42:50 382

原创 LibRec 学习笔记(六):手把手教你如何看懂 API 帮助文档

对于小白来说,快速学习并且使用一个新接触的库|框架|项目是非常有难度的,比如我们这里的 LibRec 开源库。在我们想要把它用于自己项目的时候,或多或少想要知道某个类是做什么用的,里面有什么方法以及如何去使用。那碰到这种情况,我们普遍的做法除了在搜索引擎里找寻答案,还有一种最简单且直接的方法:直接查询该库|框架|项目的API帮助文档。一、API首先解释第一个问题:什么是 API? 百度百科...

2020-02-14 01:45:59 2177 3

原创 LibRec 学习笔记(五):使用 LibRec 快速复现 BPR 算法以及对比它的改进算法

这是目录一、BPR 的介绍二、近年来在 BPR 上的经典改进算法1、WBPR2、GBPR3、SBPR4、AoBPR5、MBPR三、实验比较BPR算法以及它的改进算法1、使用数据集Filmtrust进行实验2、使用数据集 Epinions 进行实验一、BPR 的介绍BPR,UAI,2009,来自 Rendle 的论文 BPR: Bayesian Personalized Ranking from...

2020-02-09 22:43:18 2887 4

原创 【工具使用】在线使用Matlab

才发现可以使用Matlab工具去进行画图,画出的图会很好看。Matlab是有软件的,但是非常的大,这里记录一个在线画图的网址,Matlab在线画图工具

2020-02-09 15:24:50 4805

原创 LibRec 学习笔记(四):LibRec 中的默认配置项里面的参数是什么意思?

我们知道在 librec 中有许多已经实现的推荐算法,因为每种推荐算法的参数不一定一样,而又有大部分参数是一样的,比如都会涉及到划分数据集的方式、评估方式等等。所以 librec 项目为了方便,把大部分推荐算法都有的参数配置都固定到 librec-default.properties 这个文件中,那么这些参数就成为了默认的配置项,下面有例举出来并且配上相关解释:dfs.data.dir=../d...

2020-01-30 23:56:59 1449

原创 LibRec 学习笔记(三):LibRec 如何使用命令行和参数或者配置文件运行指定推荐算法?

首先,这个是官方关于这个内容的文档,如果觉得看不懂,或者有些地方运行不成功,可以看我这篇手把手演示 librec 如何使用命令行和参数或者配置文件运行指定推荐算法的文章。以下内容分为三大部分:第一部分首先演示如何使用命令行运行指定推荐算法;第二部分仔细解释了 librec 命令中所有参数的意思;以及第三部分小结如何使用命令行和参数或者配置文件运行指定算法。一、第一部分:演示如何使用命令行运行指...

2020-01-30 22:03:44 2186

原创 LibRec 学习笔记(二):如何成功运行 LibRec 官方提供的code snippet?

首先,Librec官方针对librec-core 2.0 提供的code snippet链接在此,该代码只适用于2.0。我这里直接使用的是librec-core 3.0,官方提供的针对3.0 提供的code snippet链接在此,代码如下:public static void main(String[] args) throws Exception { //...

2020-01-30 01:41:11 1979 8

原创 LibRec 学习笔记(一):如何在自己的项目中导入第三方包:LibRec ?

如果需要使用第三方包,librec,一般有以下两种常用做法(若想导入其他第三方包,做法类似):一、直接使用官方提供的maven依赖代码进行下载使用:这是网址依赖代码:<dependency>​ <groupId>net.librec</groupId>​ <artifactId>librec-core</artifactI...

2020-01-29 00:02:55 3940 12

原创 推荐系统常见问题(一):数据集按照用户行为比例进行划分的问题?

问题:数据集按照用户行为比例进行划分的问题?推荐系统若按照每个用户的交易记录按比例进行数据集的划分,比如每个用户留下80%的数据作为训练集,20%的数据作为测试集,那么对于一个有5个交易记录的用户来说,训练集应该有4个,测试集应该有1个,但是有时候不是这样的情况?我觉得还是取决于自己的代码怎么写,一般会有以下两种写代码的方式:比如如果是直接计数的代码,直接把用户交易数据的前80%个数据留下...

2020-01-14 15:52:29 1658

原创 推荐系统常见问题(二):可以使用评分预测方法去做TopN推荐吗?

问题:可以使用评分预测方法去做TopN推荐吗?专业回答:是可以的,但是效果可能没有直接使用排序方法进行推荐的好,并且有官方文档的说法是“Ranking recommended rating procedures using the rating method, you may get results, but it is not correct. ”一家之言:这个问题我以前也疑惑过,我当时认为...

2020-01-14 15:09:02 2031 5

原创 【工具使用】Git、GitHub常用操作总结

之前一直分不清楚Git和GitHub的区别,最近仔细的学习了一下:Git是分布式版本控制工具,而GitHub是托管代码的地方,我们可以使用Git工具将自己的代码上传到远程服务器,也就是GitHub上面进行托管。Git软件下载:官网地址,如果下载不下来,可以访问腾讯软件中心进行下载。Git分享教程:推荐廖雪峰的Git学习教程如何解决GitHub上加载Jupyter文件缓慢问题?可...

2019-12-26 13:48:45 181

原创 服务器使用笔记(二):登录远程服务器时出现错误WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!

出现这个错误的原因是我把服务器重新换了系统,之后ssh就连接不上了。正确的处理做法是找到上图圈出来的路径,比如我是C:\Users\Lenovo/.ssh/known_hosts,把known_hosts中存有你这个IP地址(比如我这里是222.201.187.238)的记录都删除掉。之后重新登录就可以了。...

2019-12-20 10:58:24 283

原创 【工具使用】记录检索EI或者SCI网址

EI : https://www.engineeringvillage.com/search/quick.url?usageZone=evlogo&usageOrigin=headerSCI : https://apps.webofknowledge.com/UA_GeneralSearch_input.do?product=UA&search_mode=GeneralSearc...

2019-11-25 10:37:26 761

原创 【工具使用】无法登陆bing搜索引擎

今天访问bing打不开了,现在找到了解决方法如下:1、进入以下目录:C:\Windows\System32\drivers\etc2、打开hosts.ics,以管理员身份在最后一行添加 : 204.79.197.200 cn.bing.com...

2019-11-20 10:04:29 3652

原创 【工具使用】jupyter notebook打开特定目录文件

直接使用anaconda promote输入命令:jupyter notebook ***后面的*** 代表想要打开的路径地址比如 jupyter notebook D:\Download

2019-11-05 10:21:47 2603

原创 【记录网址】有很多推荐系统数据集的GitHub

链接在此

2019-10-31 10:48:34 738

原创 服务器使用笔记(四):后台如何直接运行服务器代码?

最近用服务器跑实验碰上了一些很头疼的问题:我要跑的实验很多,我需要打开很多个服务器的终端窗口去运行不同的实验;每次自己的电脑要开着才能继续跑实验,关闭了,就连接不上远程服务器了。基于这两点痛点,目前找到了一个解决的方法,即使用tmux命令。Linux服务下载tmux命令:apt-get install tmux;启动tmux命令:tmux new -s roclinux,进入一个新...

2019-10-17 12:12:25 590 1

原创 【代码问题集锦】RuntimeWarning: overflow encountered in exp

此文章链接:https://www.cnblogs.com/zhhy236400/p/9873322.html

2019-10-16 22:21:04 4003

原创 【工具使用】Spyder代码补全问题

我的Spyder突然不能够进行自动补全了,试了以下几种方法:1、如下图操作但是没有任何用;2、在anaconda控制台输入pip list,查看安装了哪些包,如果存在enum34,则删除 pip uninstall enum34.重启spyder对我的Spyder也没有什么用3、在anaconda控制台,输入pip install rope,如果是Python3,输入pip insta...

2019-10-16 20:28:23 2241 2

原创 【工具使用】设置Spyder的缓冲区域大小

每次想要看完整的输出内容,而sypder的输出框不能够完全显示出来,所以可以设置它的缓冲区域大小设置上面这个地方,然后重启运行就OK

2019-09-30 11:56:04 1685

原创 【代码问题集锦】服务器运行代码出现ModuleNotFoundError: No module named 'Utility'

代码在本地的IDE上运行没有出错,但是在服务器端出现了ModuleNotFoundError: No module named 'Utility’错误,后来发现原因是因为我的代码里面引入了其他文件的包,是import那个语句出现错误。错误的原因是因为路径的原因,服务器端的路径和我们本地的路径不一样显示,所以解决这个问题,可以在自己代码的顶端加入以下代码import sysimport os...

2019-09-30 11:53:56 2899

最近看的关于推荐系统方面的论文小结.pptx

最近看的关于推荐系统方面的论文,共14篇。

2019-09-07

reuters.pkl

reuters.pkl

2019-08-04

推荐系统实践

项亮的《推荐系统实践》~

2018-11-14

哈夫曼树课程设计

有学弟来要我去年做的课程设计,所以把东西整理好了,也给大家参考参考。

2016-12-23

蓝桥杯试题及测试

2016-12-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除