自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 收藏
  • 关注

原创 tensorboard使用方法

在命令行输入:tensorboard --logdir "D:\学习\研二下\暑期实习\代跑代码\esmm\train_logs"注意:logdir后不要加等号,直接用空格,地址要用双引号,否则会报“No dashboards are active for the current data set.”错误...

2020-06-16 20:05:36 270

原创 【leetcode阶段总结】旋转排序数组

33. 搜索旋转排序数组假设按照升序排序的数组在预先未知的某个点上进行了旋转。( 例如,数组[0,1,2,4,5,6,7]可能变为[4,5,6,7,0,1,2])。搜索一个给定的目标值,如果数组中存在这个目标值,则返回它的索引,否则返回-1。你可以假设数组中不存在重复的元素。你的算法时间复杂度必须是O(logn) 级别二分法,只要注意二分的范围即可。...

2020-02-25 14:56:46 346

原创 【leetcode阶段总结】柱状图问题

84. 柱状图中最大的矩形给定 n 个非负整数,用来表示柱状图中各个柱子的高度。每个柱子彼此相邻,且宽度为 1 。求在该柱状图中,能够勾勒出来的矩形的最大面积。图中阴影部分为所能勾勒出的最大矩形面积,其面积为 10 个单位。示例:输入: [2,1,5,6,2,3]输出: 10来源:力扣(LeetCode)链接:https://leetcode-cn.com/problem...

2020-02-17 10:54:46 414

原创 leetcode阶段总结——解数独&n皇后

37. 解数独51. N皇后这两种题目都是比较典型的回溯法,从思路上来说并没有特别复杂的地方,但写法比较繁琐,而且重复的地方很多,所以适合用子函数的方法来写。另外,解数独是二维回溯,所以判断终止条件时要格外注意一下。解数独class Solution: def solveSudoku(self, board: List[List[str]]) -> None: ...

2020-01-11 11:04:04 218

原创 leetcode阶段总结——基本计算器

计算器类型的题,基本就是挨个遍历字符串,遇到数字就累加,遇到符号就见招拆招。栈用于保存中间结果或括号。224. 基本计算器class Solution: def calculate(self, s: str) -> int: result = 0 num = 0 sign = 1 stack = [] ...

2020-01-08 22:13:21 162

原创 leetcode阶段总结——二叉树的前序/中序/后序遍历的迭代/递归实现(python)

如题,talk is cheap##中序遍历class Solution1: def inorderTraversal(self, root: TreeNode) -> List[int]: if not root: return [] return self.inorderTraversal(root.left) +...

2020-01-08 22:10:31 262

原创 leetcode阶段总结——字符串匹配

前300道中有两道相关,都属于出现频率较高的困难题,思路有相似之处。10. 正则表达式匹配给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。'.' 匹配任意单个字符'*' 匹配零个或多个前面的那一个元素所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。说明: s 可能为空,且只包含从 a-z 的小写字母。...

2020-01-08 20:43:36 351

原创 leetcode阶段总结——拓扑排序

leetcode中经常出现的题型之一。其中,拓扑排序的概念可以参考这里,这里主要总结一下前300题中出现的几个关于拓扑排序的题,以待之后复习的时候查找。leetcode207课程表现在你总共有 n 门课需要选,记为 0 到 n-1。在选修某些课程之前需要一些先修课程。 例如,想要学习课程 0 ,你需要先完成课程 1 ,我们用一个匹配来表示他们: [0,1]给定课程总量以及它们的先决...

2019-12-29 11:25:35 369

原创 leetcode阶段总结——求众数

相关题目169.多数元素229.求众数 II摩尔投票法摩尔投票法基于这样一个事实,当一个数的重复次数超过数组长度的一半,每次将两个不相同的数删除,最终剩下的就是要找的数。为了解释清楚这个问题,首先来看leetcode的第169题。给定一个大小为 n 的数组,找到其中的多数元素。多数元素是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。你可以假设数组是非空的,并且给定的数组总...

2019-12-09 20:34:54 124

原创 leetcode阶段总结——分割字符串类型

字符串系列问题分割回文串回文串系列的一个通用解法是动态规划,在是否需要输出回文串分割内容的不同要求下,写法也不同。给定一个字符串 s,将 s 分割成一些子串,使每个子串都是回文串。返回 s 所有可能的分割方案。示例:输入: "aab"输出:[["aa","b"],["a","a","b"]]class Solution: def partition(s...

2019-12-07 10:52:22 846

原创 leetcode系列题:买卖股票的最佳时机

历史题目及代码汇总初级:一次交易给定一个数组,它的第 i 个元素是一支给定股票第 i 天的价格。如果你最多只允许完成一笔交易(即买入和卖出一支股票),设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例 1:输入: [7,1,5,3,6,4]输出: 5解释: 在第 2 天(股票价格 = 1)的时候买入,在第 5 天(股票价格 = 6)的时候卖出,最大...

2019-12-01 20:50:24 186

原创 剑指offer面试题19:正则表达式匹配

题目请实现一个函数用来匹配包括'.'和'*'的正则表达式。 模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。 例如,字符串"aaa"与模式"a.a"和"abaca"匹配,但是与"aa.a"和"ab*a"均不匹配思路这个题就是情况多,需要考虑全面。在参考了网上的代码之后,我分情况整理了一下代码的实现...

2019-08-14 11:21:25 96

原创 【推荐系统学习总结】当我们谈论embedding时我们在谈论什么

参考了下列文章:https://mp.weixin.qq.com/s?__biz=MzI1MzY0MzE4Mg==&mid=2247483890&idx=1&sn=bd96178202507f9358b17f7c6aa91443&chksm=e9d01133dea7982568ae47e215c670bb86f144d2b47161af5b370471a5fd2...

2019-08-03 16:36:10 603

原创 论文笔记:Ad Click Prediction: a View from the Trenches

参考列表:https://blog.csdn.net/fangqingan_java/article/details/51020653https://www.cnblogs.com/yaoyaohust/p/10733050.htmlhttps://blog.csdn.net/u011239443/article/details/80528717工程实践视角下的广告点击率预估摘...

2019-07-21 10:18:19 612

原创 论文笔记:Collaborative Filtering with Temporal Dynamics

参考列表:https://wenku.baidu.com/view/e4c5bb4811661ed9ad51f01dc281e53a5902513b.htmlhttps://www.cnblogs.com/imczxj/p/3949222.htmlhttps://blog.csdn.net/zhaoxinfan/article/details/12580135摘要用户的偏好通常...

2019-07-19 21:45:15 1881

原创 论文笔记:Performance of recommender algorithms on top-N recommendation tasks

摘要尽管现在很多研究将RMSE做为推荐算法的优化目标,但我们要知道,这一目标是不切实际的。现实生活中,更加常用的是TopN推荐。而实验表明,TopN推荐的指标(准确率、召回率)和RMSE有时并不一致。最后,我们给出了两种协同过滤方法的改进,它们的RMSE都没有那么好,但是在TopN推荐中做的很好。绪论文章的主要工作包括:1.展示了误差度量(如RMSE)和精度度量(如准确率和召回率)...

2019-07-18 20:53:09 1011

原创 论文笔记:Limits of predictability in human mobility

相遇预测方面的神文,没有找到其他阅读这篇论文的笔记,于是自己做了一个摘要通过探究用户的移动轨迹,我们发现有93%的可预测性。虽然轨迹内部有各种各样的不同,我们发现可预测性并没有多少变动,而这和用户覆盖的距离无关。正文数据集3个月,50000人,每个人都访问过超过两个地区,平均电话频率大于半小时一次。可预测性度量熵。这里采用了三种熵的表示形式:随机熵用户去过多少...

2019-07-18 14:45:52 920

原创 论文笔记:Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model

先给出参考列表https://blog.csdn.net/qq_35771020/article/details/88026045https://blog.csdn.net/fangqingan_java/article/details/50762296https://blog.csdn.net/weixin_43249938/article/details/84393467摘要...

2019-07-17 22:35:39 470

原创 论文笔记:Restricted Boltzmann Machines for Collaborative Filtering

阅读时参考以下博文:https://blog.csdn.net/xceman1997/article/details/9901395#commentsedit摘要目前存在的大多数协同过滤算法都不能解决大量数据集对应的矩阵运算,本文中展示了两层的无向图模型,即RBM,可以用来建模表格数据,比如用户评级。我们给出了高效的算法,证明了它在很大的数据集上可以运行。同时,还证明了它比SVD的性能...

2019-07-17 16:41:27 425

原创 论文笔记:The Wisdom of The Few

阅读这篇论文时,参考了下面几篇博文:https://blog.csdn.net/Lyteins/article/details/85047553https://blog.csdn.net/tinkle181129/article/details/51234261https://blog.csdn.net/iteye_12567/article/details/81934870htt...

2019-07-16 16:58:26 267

原创 论文笔记:Deep neural networks for YouTube recommendations

阅读过程中,参考了以下几篇文章:https://mp.weixin.qq.com/s?__biz=MzIzMzYwNzY2NQ==&mid=2247484600&idx=1&sn=2f423a43e1087f04c8244a43b60b5029&chksm=e8825c26dff5d530e8333ca3a00b38db816b79d9c47264782e483...

2019-07-15 22:59:27 201

原创 【推荐系统实践】读书总结

零零散散地看完了全书,确实很有启发性,对小白非常友好。里面的代码有点鸡肋,不过可以在github或者其它网站的找来看。下载了别人的代码之后发现比自己的写的好得多,所以我的就不贴出来贻笑大方了。下面总结一下我看整本书的笔记。什么是推荐系统?信息过载/没有明确需求的情况下,为用户提供感兴趣信息的一种思路。推荐系统通过一定的方式,将用户和物品联系起来。从后面的内容中我们可以看...

2019-07-05 11:07:04 170 2

原创 【读书笔记】推荐系统实践·第四章·利用用户标签数据

代码方面,主要实现了4.3和4.2.2的一个验证统计,4.4的代码本来准备写一下的,后来因为杂碎的统计工作太多就放弃了。代码和笔记的word版放在https://github.com/littlelittlefei/recommendsystem推荐的另一种重要方式是通过一些特征联系用户和物品,给用户推荐那些具有用户喜欢的特征的物品。这里的特征有不同的表现方式,比如可以表现为物品的属性集合(比...

2019-06-30 19:06:30 398

原创 【读书笔记】推荐系统实践·第三章·推荐系统冷启动问题

第三章没有太多代码方面的介绍,基本都是原理。其中有一个LDA模型,书里没有详细介绍,自己查了一下。笔记的word版、之前和以后的代码放在https://github.com/littlelittlefei/recommendsystem。计算机小白,代码比较幼稚。关于LDA的内容大量参考了https://blog.csdn.net/chenshulong/article/details/7...

2019-06-28 20:34:47 441

原创 【读书笔记】推荐系统实践·第二章·利用用户行为数据

最近开始看项亮老师的推荐系统实践,顺便做了一下笔记,没有很多东西,就是大概记录了一些比较关键的内容。然后认真读过这本书的小伙伴应该都发现了,本书的讲解虽然很好,但给出的代码都是片段,而且存在一些错误。所以我在看书时顺便复现了书中的代码,放在https://github.com/littlelittlefei/recommendsystem。代码比较幼稚,自己也在努力改进。用户行为数据简介...

2019-06-27 20:50:39 626

原创 win64版本下安装Tensorlayer

这几天读一个源代码里用到了tensorlayer,查了一下据说是tensorflow的打包版,还是ACM年度最佳开源软件,遂安装之。遇到了下面几个问题。1.根据官网给的中文API,在命令行里用下面的代码安装:pip install git+https://github.com/zsdonghao/tensorlayer.git然后它就开始clone。我下去取了个快递喝了个水遛了个弯回...

2019-05-11 12:07:19 1080

原创 win10,python3.6环境下lightgbm安装失败

LGBoost算法近年来风头极盛,甚至有赶超XGBoost之势,玩过kaggle的小伙伴对此一定不陌生。对应的python算法包是lightgbm,安装方式非常简单,在命令行里输入 pip install lightgbm即可。尝试报错:原因:网络不好。多试几次就行了 ,我第5次的时候成功了...

2019-04-23 22:09:06 1715

原创 【先定一个小目标】数据挖掘学习进度总结

1 数据可视化 pandas df.head() 看前几行df.value_counts() 看总体分布df.info()/df.describe() 看缺失值、整体情况df.plot(kind = 'scatter', x =column1,y = column2) 看两列散点图关联Series.unique() 去重,将两个变量合并看他们的独立值变化情况似乎是一种很有...

2019-04-10 21:41:40 159

原创 Kaggle从入门到放弃——amazonaccess-master优胜方案解读

项目链接:https://www.kaggle.com/c/amazon-employee-access-challenge解决方案:https://github.com/pyduan/amazonaccess参考资料:https://blog.csdn.net/qq_25300563/article/details/50944957可能有用的分析:https://bl...

2019-04-07 11:03:12 594

原创 Kaggle从入门到放弃——CrowdFlower优胜方案解读

一、问题引入项目链接:https://www.kaggle.com/c/crowdflower-search-relevance解决方案:https://github.com/ChenglongChen/Kaggle_CrowdFlower问题描述:求解两个字段【搜索关键词】和【完整的产品说明和HTML格式标记】之间的相关度,实际上是解决一个搜索算法的问题,决定当一个用户搜...

2019-03-17 10:42:23 1352 5

原创 【数据可视化入门】从鸢尾花数据集说起

demo全部来自kaggle上这篇著名的文章https://www.kaggle.com/benhamner/python-data-visualizations写的相当好,真正是是四两拨千斤了,里面有的功能我自己也实现过,但是远远没有人家用的函数简洁和优雅。下面的代码仅仅是原文的一个汇总和加了一点点中文注释,由于被空行隔开的每一个代码段都会返回一张图片,写到一起只是方便汇总,建议由jupyt...

2019-02-19 22:28:04 2304

原创 【Kaggle入门练习赛】数字识别_续

首先,参考了kaggle上点赞数最高的那个kernelhttps://www.kaggle.com/yassineghouzam/introduction-to-cnn-keras-0-997-top-6,比起前一版的代码主要做了三个改动。1.数据增强:通过对原始数据加噪获得更多的训练集2.学习率退火:每3代若精确率没有提升,则学习率减半3.BatchNormalization:对数据...

2019-02-18 22:46:18 244

原创 【Kaggle入门练习赛】泰坦尼克之灾_续

在情人节这个喜大普奔的日子里,终于找到了之前结果一直提不上去的原因……当然这个原因也不是自己想出来的。在泰坦尼克之灾这个题的处理中,比较关键的两点都包含在名字这个字段中,反应出来的一是社会地位,而是家庭联系。之前做的时候直接把这个字段丢弃了,然后在如何填补年龄那里一直纠结。总结一下:1.XGBoosthttps://www.missshi.cn/api/view/blog/5a06...

2019-02-14 19:47:32 271

原创 【Kaggle入门练习赛】数字识别

本题中,输入是非常规范的矩阵,因此我看到的解法中都没有对输入做多少预处理,直接调轮子。思路主要参考https://blog.csdn.net/weixin_39655021/article/details/86748135,在数据预处理的写法上有修改。在调用CNN时,原文的keras应该是依赖于Theano的,写法上和依赖于tensorflow的框架略有不兼容,因此百度后也做了一些修改,只涉及...

2019-02-04 16:25:29 408

原创 【Kaggle入门练习赛】2007房价预测

读完了下面这篇文章https://blog.csdn.net/u012063773/article/details/79349256文章写得非常非常好,不过我并没有完全看懂。。。。。。。。。附上所有代码,以及,这些代码全部是抄这篇文章的,我自己加入了一些注释。因为数据分析、数据处理、数据挖掘都写到了一起,所以会有一丢丢长。按理说,数据分析这一块应该用Jupyter Notebook...

2019-02-02 11:16:54 395 3

原创 【Kaggle入门练习赛】泰坦尼克之灾

首先要说明的是,学习的思路全部来自于这篇文章https://blog.csdn.net/han_xiaoyang/article/details/49797143写的超级好!!疯狂打call!!我自己横向地总结了以下内容如下:第零部分 数据可视化工具:import matplotlib.pyplot as plt用到的方法:图片句柄:fig = plt.figure(...

2019-01-23 16:25:12 580

原创 【ML学习笔记】特征工程到底是什么?

学习思路主要参考这篇文章http://www.cnblogs.com/jasonfreak/p/5448385.html,侵删只是花了半天的时间把文章中的程序重新敲了一遍,程序不长,遇到的一些问题和想法都记在了注释里,下面直接上代码。#特征工程的基本步骤#需要安装numpy、scipy、sklearn这三个包#下面的很多语句都没有改变任何变量的内容,如果要看结果,应当取其返回值...

2019-01-20 10:20:11 184

原创 《python核心编程》读书笔记 第五章 GUI

这一章读的不是很仔细,因为感觉很多工具性的东西都可以用的时候再查。下面仅附上代码。#==============================================================================##5-1# #最简单的第一个程序:显示一个窗口,里面显示文本# import tkinter# top=tkinter.Tk()# label...

2019-01-03 20:52:55 170

原创 《python核心编程》读书笔记 第四章 多线程编程

一、当我们谈论多线程时我们在谈论什么在多线程(MT)出现之前,计算机内部是串行的,也就是说,无论是需要按照顺序执行的任务还是相互独立的任务,都要按照一个一个来的顺序执行。这种执行方法会带来两个问题。一是执行效率会比较低,二是如果我们遇到了这样的任务:本质上是异步的;需要多个并发活动;每个活动的处理顺序可能是不确定的,或者说是随机的、不可预测的。这种编程任务可以被组织或划分成多个执行流,其中...

2018-12-31 11:41:24 242

原创 《python核心编程》读书笔记 第二章 网络编程

一、服务器/客户端的概念想象客户端/服务器架构如何工作的一个方法就是,在你的脑海中创建一个画面,那就是一个银行出纳员,他既不吃不睡,也不休息,服务一个又一个的排队客户,似乎永远不会结束。这个队列可能很长,也可能空无一人,但在任何给定的某个时刻,都可能会出现一个客户。当然,在几年前这样的出纳员完全是一种幻想,但是现在的自动取款机(ATM)似乎比较接近这种模型。出纳员就是一个运行在无限循环中的...

2018-12-29 20:40:08 257

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除