自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

韦人人韦

Zero to One

  • 博客(43)
  • 收藏
  • 关注

原创 git 远程项目 常用操作

记录一些常用的操作。以下操作均在gitbash里完成。在使用Git提交前,必须配置用户名和邮箱,这些信息会永久保存到历史记录中。git config --global user.name “Test”git config --global user.email [email protected]初始操作生成密钥ssh-keygen -t rsa -C "your_email@example....

2019-05-19 22:31:19 490

原创 tf.concat中axis的含义与使用

tensorflow中tf.concat的axis的使用我一直理解的比较模糊,这次做个笔记理下自己的思路。import tensorflow as tftf.enable_eager_execution()import numpy as np先生成两个矩阵m1, 和m2, 大小为两行三列m1 = np.random.rand(2,3) # m1.shape (2,3)m1>&...

2018-12-12 14:53:41 10807 6

原创 EST,EDT和GMT时区转换

最近在清洗数据时需要转换时区,将EST和EDT时区的时间转换为GMT时间。EST: Eastern Standard Time 东部(美国)标准时间EDT: Eastern Daylight Time 东部(美国)夏令时时间ET: Eastern Time 东部(美国)时间GMT: Greenwich Mean Time 格林尼治标准时间其中,EST和EDT是ET在不同时间段的两种说法...

2018-12-07 09:52:57 36860 2

原创 BPR 贝叶斯个性化排序

显式反馈:用户对物品的评分,如电影评分隐式反馈:用户对物品的交互行为,如浏览,购买等,现实中绝大部分数据属于隐式反馈,可以从日志中获取。BPR是基于用户的隐式反馈,为用户提供物品的推荐,并且是直接对排序进行优化。定义UUU代表所有的用户user集合;III代表所有的物品item集合;SSS代表所有用户的隐式反馈,S⊆U×IS \subseteq U \times IS⊆U×I. 如下...

2018-11-21 22:44:23 4547 5

原创 推荐系统36式笔记(一)

为知识付费:https://time.geekbang.org/column/intro/74本文仅为个人学习笔记。推荐系统:是一种信息过滤系统,预测用户(User)对物品(Item)的评分和偏好。推荐系统的问题模式分为评分预测和行为预测。评分预测假如用户消费完一个物品之后会给出一个打分,比如通常是 1~5分,那么我们要做的就是建立一个模型,利用用户历史上打过分的物品,预测用户对...

2018-11-21 22:39:17 3257

原创 windows下搭建spark环境出现ChangeFileModeByMask error (3): ???????????

按照这篇文章搭建spark环境时,处理winutil.exe时遇到了ChangeFileModeByMask error (3): ??? 这个问题。解决办法在C盘创建tmp/hive文件夹(关键),然后输入命令行:F:\Program Files\hadoop\bin\winutils.exe chmod 777 C:/tmp/hive即可。...

2018-11-12 19:37:47 4541 5

原创 VScode + LaTex + TexLive 搭建

分别下载并安装VScode, TexLiveVScode下载与安装:https://code.visualstudio.com/TexLive下载(清华大学镜像):https://mirrors.tuna.tsinghua.edu.cn/CTAN/systems/texlive/Images/TexLive安装教程:https://blog.csdn.net/so_geili/art...

2018-10-11 23:33:53 23861 2

原创 ALS 交替最小二乘

ALS算法是矩阵分解的一种,用于评分预测。矩阵分解假设我们有一批用户数据,其中包含m个User和n个Item, 用户和物品的关系是一个三元组,<user, item, rating>, 即用户对物品的评分,因此我们得到矩阵Rm×nR_{m\times n}Rm×n​, 其中的元素ruir_{ui}rui​表示第u个用户对第i个item的评分。评分矩阵通常规模很大,并且通常是稀疏...

2018-10-11 23:31:30 3357 1

原创 SVM 支持向量机

通俗来讲,它是一种二分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。SVMSVM的目标函数基本型min12w2min \frac{1}{2}w^2min21​w2s.t.yi(wTxi+b)≥1,i=1,2,...,ms.t. y_i(w^Tx_i+b)\ge1, i=1,2,...,ms.t.yi​(wTxi​+...

2018-10-11 23:28:23 294

原创 Hexo Next 解决 Busuanzi 统计浏览失效

由于busuanzi(不蒜子)的网址更新,导致了使用Hexo Next主题时统计浏览数失效.不蒜子官网:http://ibruce.info/2015/04/04/busuanzi/解决方法:到hexo的themes文件夹下, 进入\themes\next\layout_third-party\analytics打开: busuanzi-counter.swig将src=“https:...

2018-10-11 23:25:31 4189 1

原创 随机森林和决策树

决策树本质是一颗由多个判断节点组成的树。决策树算法的核心是通过对数据的学习,选定判断节点,构造一颗合适的决策树。树模型不需要做归一化:归一化的目的是为了加快梯度下降法的收敛速度,但是决策树模型不需要计算梯度树模型只考虑特征的划分界限,而不需要考虑特征的值范围决策树的关键是选择最优划分属性。一个属性会有多个取值,根据这个属性的不同取值将输入的数据划分为多个样本集合,一个取值...

2018-09-13 14:26:51 24523 1

原创 线性回归和逻辑回归的比较

线性回归用一组变量的(特征)的线性组合,来建立与结果之间的关系。模型表达:y(x,w)=w0+w1x1+...+wnxny(x,w)=w0+w1x1+...+wnxny(x, w)=w_0+w_1x_1+...+w_nx_n逻辑回归逻辑回归用于分类,而不是回归。在线性回归模型中,输出一般是连续的, 对于每一个输入的x,都有一个对应的输出y。因此模型的定义域和值域都可以是无穷...

2018-09-12 20:48:31 25415 2

原创 L1和L2正则化

L0范数,L1范数,L2范数L0范数是指向量中非0元素的个数。如果我们用L0范数来规则化一个参数矩阵W的话(正则项),就是希望W的大部分元素都是0。换句话说,让参数W是稀疏的。L1范数是指向量中各个元素绝对值之和,也有个美称叫“稀疏规则算子”(Lasso regularization)。为什么要稀疏?特征选择(Feature Selection):稀疏规则化它能实现特征...

2018-09-12 20:37:25 654

原创 因子分解机 FM和FFM

因子分解机 Factorization Machine因子分解机主要是考虑了特征之间的关联。FM主要是为了解决数据稀疏的情况下,(而SVM无法解决稀疏问题),特征怎样组合的问题。数据稀疏是指数据的维度很大,但是其中为0的维度很多。推荐系统是常见应用场景,原因是推荐系统中类别属性(如商品id)比较多,每一种类别属性经过onehot处理后会产生大量值为0的特征,导致样本变得稀疏,而FM就可...

2018-09-12 20:32:22 12457 5

原创 Hive入门及常用指令

Hive最近在公司实习,对hive进行了学习,做了些整理的笔记。基础命令show databases; # 查看某个数据库use 数据库; # 进入某个数据库show tables; # 展示所有表desc 表名; # 显示表结构show partitions 表名; # 显示表名的分区show create table_name; ...

2018-06-12 16:46:25 53916 12

原创 机器学习入门及相关资料

Machine learning 本文仅为个人笔记,错误之处恳请批评指正。 —— David 这篇介绍不涉及任何公式推导,仅提供一些思路以及相应的资料,感兴趣的可以自行查找资料学习。书籍推荐理论类:机器学习,周志华;统计学习方法,李航;深度学习,Ian...

2018-05-28 22:05:23 578

原创 Ubuntu Tmux 启用鼠标滚动

Ubuntu Tmux 启用鼠标滚动在Ubuntu上使用Tmux是一件非常舒服的事,但有时使用鼠标滚轮时,和平时使用终端的习惯不怎么一致,因此可以设置启用鼠标滚轮。 具体方式: 按完前缀ctrl+B后,再按分号:进入命令行模式, 输入以下命令:set -g mouse on就启用了鼠标滚轮,可以通过鼠标直接选择不同的窗口,也可以上下直接翻页。Tip 但在以上设置下,会发

2018-01-11 10:49:02 49801 7

原创 Python 正则表达式 匹配邮箱地址

import repat = r'^(\w)+(\.\w+)*@(\w)+((\.\w+)+)$' email_address = '[email protected]'matched_address = re.match(pat, email_address)print(matched_address.group())pat = r’^(\w)+(.\w+)*@(\w)+((.\w+)+)

2017-12-21 16:09:19 7280

原创 mongo输入带'.'的字典

mongodb默认是不允许存储键中带’.’的字典, pymongo中实现的两种解决方案: 1. 将字典键中的’.’用’_’等其他符号替代; 2. 但是当字典包含多层嵌套字典,我觉得通过替换过于麻烦,所以我使用了另一种方案: collection.insert(docs, check_keys=False) 即通过设置check_keys来使得mongo不检查’.’, 但是这个方案只限于临时

2017-12-18 10:56:45 970

原创 MongoDB 学习

记录下我在学习mongoDB时遇到的一些问题与解决方案问题: windows下启动mongoDB后显示等待连接端口,并且停止在这一步:2017-09-17T11:57:32.398+0800 I CONTROL [initandlisten]2017-09-17T11:57:32.398+0800 I CONTROL [initandlisten] ** WARNING: Access co

2017-09-17 12:05:33 581

原创 Splunk-SDK-Python学习

Splunk最近在公司实习用到了splunk,需要调用splunk sdk进行一些简单的开发,目前把我这个星期的一些体会记录下。什么是splunk简单来说,Splunk是一个托管的日志文件管理工具,它的主要功能包括: · 日志聚合功能 · 搜索功能 · 提取意义 · 对结果进行分组,联合,拆分和格式化 · 可视化功能 · 电子邮件提醒功能 而目前我通过splunk s

2017-09-16 13:19:37 5526 1

原创 Leetcode-House Robber-Python

House Robber打家劫舍。问题本质就是从数组中找出一个或多个不相邻的数,使其和最大。 You are a professional robber planning to rob houses along a street. Each house has a certain amount of money stashed, the only constraint stopping you

2017-09-01 18:24:48 477

原创 Leetcode-Best Time to Buy and Sell Stock-Python

Best Time to Buy and Sell Stock买卖股票的最佳时机,返回最大收益。 Say you have an array for which the ith element is the price of a given stock on day i.If you were only permitted to complete at most one transaction (

2017-08-31 22:17:21 355

原创 Leetcode-Climbing Stairs-Python

Climbing Stairs爬梯子问题。给定一个n级台阶,每次可以走一个台阶或者两个台阶,一共有多少种走法? Description解题思路: 很常见的一种递推题型,要求n级台阶的走法,即可以分解为求n-1级台阶加上n-2级台阶的走法,climbNum[n]=climbNum[n-1]+climbNum[n-2]。所以问题实质上就是求解斐波那契数列。但由于采用递推方式会产生大量重复的计算,因此

2017-08-30 12:01:54 635

原创 Leetcode-Intersection of Two Arrays-Python

Intersection of Two Arrays查找两个数组的共有元素。 Given two arrays, write a function to compute their intersection. Example: Given nums1 = [1, 2, 2, 1], nums2 = [2, 2], return [2]. Description解题思路: 本来是想做关于排序

2017-08-29 11:05:21 299

原创 Leetcode-Valid Anagram-Python

Valid Anagram给定两个字符串,判断其中一个字符串是否是另一个字符串的异序组合。 Given two strings s and t, write a function to determine if t is an anagram of s.For example, s = “anagram”, t = “nagaram”, return true. s = “rat”, t =

2017-08-28 10:51:53 429

转载 MySql中添加用户,新建数据库,用户授权,删除用户,修改密码

原文:http://blog.csdn.net/h1017597898/article/details/9815987MySQL中添加用户,新建数据库,用户授权,删除用户,修改密码(注意每行后边都跟个;表示一个命令语句结束):1.新建用户登录MYSQL:  @>mysql -u root -p  @>密码创建用户:  mysql> insert into mysql.user(Host,Us

2017-08-27 10:28:59 4639

原创 Leetcode-Reverse Linked List-Python

Reverse Linked List反转单链表。 Descriptioniterative:# Definition for singly-linked list.# class ListNode(object):# def __init__(self, x):# self.val = x# self.next = Noneclass Soluti

2017-08-26 18:09:38 712

原创 Leetcode-Intersection of Two Linked Lists-Python

Intersection of Two Linked Lists寻找两个无环链表的交点。 Description解题思路: 1. 如果两个链长度相同的话,那么对应的一个个比下去就能找到; 2. 如果两个链长度不相同,分别计算出两个链表的长度,计算出长度差值,然后让长度更长的那个链表从头节点先遍历长度差的步数,这样以后两个链表按尾部对齐。接着长链表和短链表同步往下走,遇到的第一个相同的节点就是最

2017-08-24 12:39:00 255

原创 Leetcode-Linked List Cycle-Python

Linked List Cycle判断单链表是否存在环。 Description解题思路: 一个单链表如果不存在环,则最后一个元素的下一个节点必然为null. 如果单链表存在环,则: 设置两个指针,一个慢指针和一个快指针。将链表的环想象成是一个圆形操场,两个人在同一起跑线开始绕着操场无限循环跑,那么快的人必然会再一次和慢的人相遇,即快指针的元素和慢指针的元素相同时,即说明存在环。 在代码中

2017-08-23 11:48:57 342

原创 Leetcode-Remove Duplicates from Sorted List-Python

Remove Duplicates from Sorted List从排序链表中删除重复元素。 Description解题思路: 依次比较相邻的两个链表元素,若值相等,则将前一个节点的next引用为后一个节点的后一个节点。使用cur来依次向下遍历元素,最后返回head。# Definition for singly-linked list.# class ListNode(object):#

2017-08-22 12:24:06 205

原创 Leetcode-Merge Two Sorted Lists-Python

Merge Two Sorted Lists合并两个有序链表。 Description解题思路: 此题比较简单,采用迭代的方式。由于链表已经是有序的,所以依次比较两个链表当前元素的大小,然后将较小的元素加入到新的链表中。# Definition for singly-linked list.# class ListNode(object):# def __init__(self, x

2017-08-21 19:29:46 244

原创 Leetcode-Count and Say-Python

Count and Sayleetcode关于这题的说明比较含糊: The count-and-say sequence is the sequence of integers with the first five terms as following:1112112111112211 is read off as “one 1” or 11. 11 is read off as

2017-08-18 19:02:30 513

原创 Leetcode-Implement strStr()-Python

Implement strStr()从字符串中找出给定子字符串的索引,若不存在则返回-1。 Description解题思路: 用python解决这道题很简单,因为python字符串自带的find的方法可以直接实现。 def strStr(self, haystack, needle): """ :type haystack: str :typ

2017-08-17 19:39:51 647

原创 Leetcode-Valid Parentheses-Python

Valid Parentheses验证有效括号对:给定一个只包含括号类型的字符串,判断该字符串的括号是否有效闭合。Description Given a string containing just the characters ‘(‘, ‘)’, ‘{‘, ‘}’, ‘[’ and ‘]’, determine if the input string is valid. The bracket

2017-08-16 10:57:27 326

原创 Django搭建个人博客

最近学着用Django搭建了个个人博客,目前域名正在备案中,现在把我这最近半个月的摸爬滚打经历记录下。Django入门Python核心编程追梦人物的 Django博客教程菜鸟Django教程自强学堂Django教程第一阶段:我首先看了Python核心编程中的Django章节,刚开始看的有些云里雾里。于是我去菜鸟教程那里按着Django教程的步骤搭建了下,菜鸟教程Django部分比较简单,之

2017-08-15 19:12:09 20743 6

原创 Leetcode-Longest Common Prefix-Python

Longest Common Prefix最长相同前缀:给定一个字符串数组,找出其中最长的共同前缀。这里leetcode并没有说明共同前缀是指两两之间的前缀还是所有字符串的前缀,实际题意是指采用所有字符串的共同前缀。 Description解题思路: 若字符串数组为空则返回空字符串; 否则从所有字符串中找出最短的字符串,依次将最短字符串的每个元素和所有字符串对应位置上的元素进行比较,...

2017-08-15 18:45:57 328

原创 Leetcode-Roman to Integer-Python

Roman to Integer将罗马数字转换为阿拉伯数字。 Descriptionleetcode没有说明具体的转换规则,我是按照罗马数字规则设置的。解题思路: 一个保存罗马数字映射的字典:roman = {'M': 1000,'D': 500 ,'C': 100,'L': 50,'X': 10,'V': 5,'I': 1}规则: - 如果一个元素值比右边元素大,则加上这个元素; - 如果

2017-08-14 11:44:06 316

原创 Leetcode-Maximum Subarray-Python

Maximum Subarray最大子串和问题:从一个数组中找出一个字串使其和最大。 Descriptiontips: 子串是指数组中连续的若干个元素,而子序列只要求各元素的顺序与其在数组中一致,而没有连续的要求。解题思路: 自己没有想出来,直接借鉴了网上的动态规划思路,我觉得下面是一些解决的关键点: - 对于array[1…n],如果array[i…j]就是满足和最大的子串,那么对于任何

2017-08-13 18:40:40 315

原创 Leetcode-Search Insert Position-Python

Search Insert Position给定一个有序的无重复元素的序列,和一个目标元素,求出该元素在数组中的下标,若数组中不存在该元素,则返回其在数组中的顺序下标。 Description解题思路: 直接采用暴力查询。首先判断目标元素是否在数组中,若存在,则直接返回下标。 若不存在,将目标元素与数组中的最大最小值比较;如果介于最大最小值之间,则与数组中的任意两个相邻元素进行比较。def s

2017-08-12 11:31:00 251

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除