自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

世靖的码场

AC for AK

  • 博客(237)
  • 资源 (3)
  • 收藏
  • 关注

原创 Ubuntu 虚拟机重新分配磁盘空间 爬坑指南

光在外面分配了硬盘空间给虚拟机是不行的,还要进去操作一下,这里下个图形界面的工具,方便操作。sudo apt-get install gparted启动的时候报错,说a start job is running for dev-disk。。。。然后要等一分半,在里面运行程序的时候,也一言不合就给我kill了。因为没有修改swap的UUID,导致了下图的报错。这里说明swap分区没激活,所以一运行大...

2018-04-04 10:19:41 11320

原创 XGBoost 论文翻译+个人注释

最近研究机器学习理论,学习了一下陈天奇博士的论文,做了一点简单的翻译和批注,在这里记录一下。本文将按照论文的顺序来介绍xgb,其中穿插我自己的理解和我对于论文原文的中文翻译,以及一些公式的截图。原文翻译将使用红色来标注,其余的皆为我自己理解的内容,涉及参数调整的我会加粗。=================================================== 论文题目...

2018-03-20 00:49:23 19399 6

原创 Hadoop MapReduce 学习笔记

本文的部分图片、文字来自于HKU COMP7305 Cluster and Cloud Computing,Professor: C.L.Wanghadoop官方文档:http://hadoop.apache.org/docs/r2.7.5/拓扑结构和硬件配置先讲一下Hadoop之前的底层的结构,我们是4人一组,每个人一台机器,装上Xen,然后用Xen开两个VM,就是一共8个VM,配置上格式跟下图...

2018-03-10 21:56:31 732

原创 西瓜书 习题11.1 编程实现Relief算法 特征选择、正则化总结

Relief算法的数据以及代码:https://github.com/qdbszsj/Relief西瓜书第十一章,主要讲了一下特征选择的方法,通常来说,有很多冗余特征,如果能把这些特征从我们的数据集中筛选出去,那么可以极大地提高我们的程序运行效率,当然有的时候我们还需要人为保留或者创造一些冗余特征,当且仅当这些冗余特征恰好对应了完成任务所需要的“中间概念”。比如要求一个立方体的体积时,输入数据

2018-01-25 14:34:57 1759

原创 西瓜书 习题10.1 KNN

代码和数据:https://github.com/qdbszsj/KNN这里编程实现了一下KNN,K-Nearest Neighbor。KNN的好处是可以“懒惰学习”,只要存好数据,来一个测一个,调整一下K就好,或者是把每个维度的权值调整一下,意思就是在距离上做点文章。然后这一章里的PCA(principal component analysis),主成分分析,是一种降维方法,说白了就

2018-01-24 20:57:57 1589 4

原创 西瓜书 习题9.4 K-means

第九章讲了很多聚类方法,以及聚类的好坏的度量方式,Kmeans比较容易实现,比较常用的一种方法。通常来讲,我们希望聚类的结果,类内相似度高,类间差异度大。数据以及代码: https://github.com/qdbszsj/Kmeansimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt

2018-01-24 16:52:16 1954

原创 西瓜书 第八章习题 集成学习总结(Adaboost、GradientBoost、Bagging、RandomForest)

数据及代码在git上:https://github.com/qdbszsj/Ensemble-learning这里用sklearn实现的代码,4种常用的集成学习的方法,手写有点麻烦,这里重点不是代码,是学习总结。集成学习(ensemble-learning)通过将多个学习器进行结合,常常可以获得比单一学习器更显著的泛化性能,我们的目标是基于一个大数据集产生若干“好而不同”的学习器,然后用这

2018-01-23 15:02:02 2028

原创 西瓜书 习题7.3 朴素贝叶斯分类器+拉普拉斯修正

Naive Bayes Classifier with Laplacian correction数据和代码在我的git上,原创代码:https://github.com/qdbszsj/NBC朴素贝叶斯分类器,用的贝叶斯定理(这不是废话),举个例子,说白了就是:绿瓜是好瓜的概率=所有好瓜里的绿瓜个数/所有绿瓜个数。假如一个瓜是绿的,还很清脆,那么这个瓜是好瓜的概率就是P(绿瓜是

2018-01-22 16:44:05 3885

原创 西瓜书 习题6.2 用线性核、高斯核训练SVM

SVM手动实现底层代码有些麻烦,这里借助sklearn实现了一下,数据以及代码地址:https://github.com/qdbszsj/SVMimport pandas as pdimport numpy as npdataset = pd.read_csv('/home/parker/watermelonData/watermelon3_0a.csv', delimiter=",

2018-01-22 00:10:40 7373

原创 西瓜书5.5 编程实现BP神经网络——标准BP算法、累积BP算法

这里照着书上的公式,实现了一下标准BP算法,和累积BP算法,BP是error Back Propagation的意思,误差逆传播。BP网络通常是指用BP算法训练的多层前馈神经网络。代码是照着书本公式自己写的,没有参考网上的其他版本。数据和代码地址:https://github.com/qdbszsj/BP具体的理论证明和公式推导,见西瓜书P101-104。这里重点说一下我的数据处理和一些代

2018-01-19 22:09:29 16331 6

原创 西瓜书 习题4.4 编程实现基尼指数决策树

数据及代码地址:https://github.com/qdbszsj/decisionTreeGini这里的代码在信息熵决策树的基础上稍加修改就可以,之前是根据熵增的最大值来确定用哪个属性划分,现在是根据基尼指数(表现数据集D的纯度)的最小值来建树。这里网上的很多人说建出来的树长得和书上的不一样!一样TM就怪了,书上P81页的树那是根据entropy建的,我们建出来的树是根据Gini index的

2018-01-18 15:51:13 4216 2

原创 西瓜书 习题4.3 编程实现信息熵决策树、绘制决策树、解决matplotlib中文乱码问题

就照着西瓜书P74的伪代码,把这段代码翻译成python就好了,这里决策树的实现没有参考其他人的代码,是我纯原创的。项目github地址:https://github.com/qdbszsj/Decision-Tree-based-on-information-entropy这里要先说一下我的数据结构,D是一个list,里面是数据集的行索引,一共17个数据,那么D里的list元素取值范围就是从0到

2018-01-17 10:38:34 5517 1

原创 西瓜书 习题3.5 编程实现LDA

参照西瓜书的课后习题3.5的要求,参考了一些资料,简单地实现了一下LDA。数据还是西瓜数据3.0a代码和数据,都挂在了我的git上:https://github.com/qdbszsj/LDA首先第一部分还是画一个散点图,这个跟上一个习题是一样的,此处不详细表述了。然后是先用sklearn偷懒实现一下LDA,这里要注意下模型参数的选择,对于小数据一般选择lsqr,这里给出了官方的r

2018-01-15 23:49:33 4020 1

原创 西瓜书 习题3.3 编程实现对数几率回归,梯度下降法

最近入坑上道了,跟着周志华老师的《机器学习》,先搞个课后题练练手。我电脑是Win10的,硬件配置不输Mac Pro,但是之前跑Kaggle上的泰坦尼克,装python的各种package装的我心累,于是这次我直接用VMware开了个Ubuntu在电脑里,给分配了4G的内存,平时就用Ubuntu了,通常遇到什么包没装上,用terminal就可以搞定了。然后我在Ubuntu里装了个pycharm,

2018-01-08 14:57:28 4121 1

原创 hiho 1642 三角形面积和 [Offer收割]编程练习赛37 Problem B

题目2 : 三角形面积和时间限制:10000ms单点时限:1000ms内存限制:256MB描述如下图所示,在X轴上方一共有N个等腰直角三角形。这些三角形的斜边与X轴重合,斜边的对顶点坐标是(Xi, Yi)。 (11,5) (4,4) /\ /\(7,3) \ /

2017-11-26 14:47:25 580

原创 hiho 1641 热门号码 [Offer收割]编程练习赛37 Problem A

题目1 : 热门号码时间限制:10000ms单点时限:1000ms内存限制:256MB描述 1 2 3 ABC DEF 4 5 6 GHI JKL MNO 7 8 9 PQRS TUV WXYZ * 0 #我们知

2017-11-26 14:42:32 798

原创 hiho 1638 小Hi的天平 [Offer收割]编程练习赛36 Problem B 并查集+图dfs乱搞

题目2 : 小Hi的天平时间限制:1000ms单点时限:1000ms内存限制:256MB描述小Hi给小Ho邮寄了一个天平。收到天平后,小Ho想知道天平在运输过程中是否损坏,为此它准备了A类物品和B类物品共n个(可能只有A类物品,也可能只有B类物品),但无法确定一个物品是哪一类。A类物品的质量都相同,B类物品的质量也相同,但A类物品与B类物

2017-11-19 15:17:47 528

原创 在安卓虚拟机上安装apk

1. Run the AVD2. Install the apk file :Press Windows+R and type in cmd to open the terminal .Find your Android SDK platform-tools file place and use the adb.exe to install the apk on the AVD.H

2017-11-13 15:46:03 2038

原创 hiho 1626 缩写命名 [Offer收割]编程练习赛35 Problem D 二分图匹配

#1626 : 缩写命名时间限制:10000ms单点时限:1000ms内存限制:256MB描述很多计算机科学工作者都喜欢给自己发明的系统或者方法起个拉风的名字。他们一般会用若干个单词描述这个系统,并且从这些单词中各取出一个字母组合在一起作为系统的名字。如果组合在一起的名字恰好是个有意义的单词,那就更COOL了。  例如 "FAWN:a

2017-11-12 16:53:44 393

原创 hiho 1625 重复字符串匹配 [Offer收割]编程练习赛35 Problem C KMP模板题

题目3 : 重复字符串匹配时间限制:10000ms单点时限:1000ms内存限制:256MB描述给定两个字符串A和B,请你求出字符串A最少重复几次才能使得B是A的子串。  例如A="hiho",B="hohihohi"。则A重复3次之后变为"hihohihohiho",这时B是A的子串。输入输入包含多组数据。  第一行

2017-11-12 14:58:46 576 1

原创 hiho 1624 最短游览路线 [Offer收割]编程练习赛35 Problem B

题目2 : 最短游览路线时间限制:10000ms单点时限:1000ms内存限制:256MB描述十一期间小Hi被朋友拉去某座名山旅游。这座山上一共有N个景点,编号1~N,通过M条单向缆车相连。  小Hi和朋友的出发点在1号景点。小Hi正在等待某公司的面试电话,所以他希望找一条路线,搭乘最少次数的缆车(至少一次),回到出发点。  你能

2017-11-12 14:52:19 501

原创 hiho 1623 有歧义的号码 [Offer收割]编程练习赛35 Problem A

题目1 : 有歧义的号码时间限制:10000ms单点时限:1000ms内存限制:256MB描述小Hi参加了一场大型马拉松运动会,他突然发现面前有一位参赛者背后的号码竟然和自己一样,也是666。仔细一看,原来那位参赛者把自己号码帖反(旋转180度)了,结果号码999看上去变成了号码666。  小Hi知道这次马拉松一共有N名参赛者,号码依

2017-11-12 14:50:11 644

原创 hiho 1620 股票价格3 [Offer收割]编程练习赛34 Problem B 单调栈

这个题想了好久才做出来,本来感觉要维护一个区间最值的数据结构,然后每次搜索的时候借助那个区间最值帮助剪枝,后来发现好多人都过了,我就觉得这题应该不用那么麻烦,果然,想了一会,维护一个单调栈,贪心就可以解决了。从右往左往栈里放点,从栈底到栈顶必须单调递减,如果有大元素值放入,那么把它底下的所有小于等于它的元素全部pop掉,再往里放,这样子O(n)解决。#include #include

2017-11-05 15:41:28 501

原创 hiho 1619 “共同富裕” [Offer收割]编程练习赛34 Problem A 数学

把n个x共同相对x以外的数减一需要n步,相对减k则需要k*n步,因此一个公式for循环就跑出来了。#include #include #include #include #include #include #include #include #include #include #include #include #include using namespace std

2017-11-05 15:30:45 334

原创 hiho 1617 方格取数 [Offer收割]编程练习赛33 Problem C DP

有两条路径,设上面的路径为路径1,下面的为路径2,路径1上的点为x1,y1,路径2上的点为x2,y2dp[i][j][k]表示x1,x2,step由step可以确定出y1和y2,这样可以缩小一维,本来暴力起来应该是200的四次方,16亿,肯定爆内存。然后对于每个状态,可以由step-1的四种状态(↓↓,↓→,→→,→↓)更新过来,更新过程中注意判断一下边界条件别RE就可以了,复杂度O(

2017-10-29 14:38:55 378

原创 hiho 1615 矩阵游戏II [Offer收割]编程练习赛33 Problem A 贪心暴力

把每列取反后所能获得的收益记录下来,然后排序,从高到低一对对的取,大于0就算上。#include #include #include #include #include #include #include #include #include #include #include #include #include using namespace std;int N;

2017-10-29 14:35:25 872

原创 hiho 1613 墨水滴 [Offer收割]编程练习赛32 Problem C 优先队列+BFS

这个题挺简单的,也挺有意思,我第一次做这种优先队列结合BFS的题目,给的数据量很大,暴力肯定TLE,但是我们可以用优先队列进行剪枝,先处理颜色深度高的点,就是这样吧,代码很短。#include #include #include #include #include #include #include #include #include #include #include

2017-10-22 15:06:57 503 2

原创 hiho 1612 候选人追踪 [Offer收割]编程练习赛32 Problem B 乱搞

这个题最后没过,全场只过了3个人,然后好多人包括我都是得了90分,我一直不知道问题在哪,哪组数据把我HACK了呢?求大犇指点一下小弟。。。说一下我的思路,先给输入数据按照时间排个序,然后,根据时间的流逝,维护一个MIN和MAX,分别代表集合S里的最小值,和不在集合里的人的最大值。最大值比较容易维护,直接max就行了,但是最小值,不太好搞,因为初值都是0,为了解决这个问题,我用了一个ticket

2017-10-22 14:53:20 492

原创 hiho 1611 气泡图 [Offer收割]编程练习赛32 Problem A 数学公式暴力

大圆套小圆,针对每个圆,找出包含它的那个面积最小的圆就行了,一共1000个,复杂度n方这个题我还WA了两发。。。我还以为是EPS的问题,最后发现那个max值设的太小了,之前就写了一串9,后来改成比输入值的max大就过了。。。#include #include #include #include #include #include #include #include #inc

2017-10-22 14:45:42 614 2

原创 Python import各种包遇到的问题

对于一般的包,直接File->Settings->Project Interpreter->点加号搜名字就行了但是在安装seaborn的时候,总是提示出错,问题可能在于seaborn要依赖于scipy,但是装seaborn的时候他不给你装scipy,只能手动去装,于是我就去一个网站下载了scipy:http://www.lfd.uci.edu/~gohlke/pythonlibs/#sci

2017-10-21 12:32:42 1563

原创 八皇后问题变种 硅谷AI硕士作业题 One assignment of the MSc in USC

前一阵子,一个在USC读书(master in AI)的哥们发来了他们一门课的作业题,让我帮着看看,我就试着写了一下,学习了学习,想看看美帝硅谷的CS学生都在学什么。题目是这样的:读入一个文件,which描述了一个N*N的矩阵,里面有些障碍物,然后要往里放皇后(国象的后),要使得他们之间互不能影响到。然后现在要求我们用三种方法解决这个问题:DFS、BFS、SA,分别是深搜、宽搜、模

2017-10-20 17:07:27 696

原创 正则表达式 在安卓editText的用法

这里我原本的意图是限制editText的输入,限制为两位小数,但是改到最后,这个小数还是可能存在前导0。如果不考虑开始的负号时,可以取消前导0,把第一位分类讨论就行了。但是如果要考虑到第一位的“-”我就不知道该怎么办了。我发现他在正则匹配的时候,你不能限定后面的内容一定存在,否则他就认为你当前这个不一定合法,比如[0-1]{1,1}[3-4]{1,1}这种写法根本就不会被editText认可,

2017-10-18 18:01:52 1604

原创 hiho 1607 H星人社交网络 [Offer收割]编程练习赛31 Problem A 二分乱搞

这个题,对于每个A[i],题目都给出了3个否定的区间,是不能交朋友的,本来我想用容斥,1+2+3-12-13-23+123这样子写了一发然后WA了,后来发现没那么麻烦,每个人的交友区间都能求出一个单一的区间来[v1,v2],v1的值可以由第一条规则的出来,v2的值就是第二第三条规则的临界值的min,然后如果自己在这个区间里,给去掉就行了。找的过程中用upper和lower bound非常方便。

2017-10-15 14:59:17 452

原创 HDU5119 2014北京区域赛H DP

给40个数,大小不超过100万,求异或和超过M的组合个数。do[i][j]表示前i个数异或和是j的组合个数然后就可以从i-1更新到i了,选第i个或者不选第i个,类似背包问题。#include#include#include#include#includeusing namespace std;int A[50];int N,M;const int MAXN=1<<20;

2017-10-15 14:51:40 512

原创 LeetCode-101-Symmetric Tree judge对称tree

save all the nodes including None in a 2-dimension list and judge the symmetry# Definition for a binary tree node.# class TreeNode(object):# def __init__(self, x):# self.val = x#

2017-10-08 19:51:36 259

原创 LeetCode-100-Same Tree 水题 判断二叉树相等

# Definition for a binary tree node.# class TreeNode(object):# def __init__(self, x):# self.val = x# self.left = None# self.right = Noneclass Solution(object): d

2017-10-06 19:04:55 279

原创 LeetCode-99-Recover Binary Search Tree 二叉树交换结点

题意:给一个有序的二叉树,已知有两个结点被swap了,让你恢复,要求空间复杂度为O1。题解:中序遍历,应该是递增的,当冲突时记录父子的结点。如果不出意外,会有两次冲突,如果只有一次冲突,那就交换这个父子就好。如果有两次冲突,就交换第一次的父亲和第二次的儿子。举例:1234567->7234561,这时交换72组合的7 with 61组合的11234567->2134567,没找到第

2017-10-06 18:55:30 370

原创 LeetCode-98-Validate Binary Search Tree dfs二叉树

# Definition for a binary tree node.# class TreeNode(object):# def __init__(self, x):# self.val = x# self.left = None# self.right = Noneclass Solution(object): d

2017-10-06 17:41:10 256

原创 LeetCode-97-Interleaving String DP 记忆化搜索

class Solution(object): dp=[] def isInterleave(self, s1, s2, s3): """ :type s1: str :type s2: str :type s3: str :rtype: bool """ self.dp

2017-10-06 17:28:57 223

原创 LeetCode-96-Unique Binary Search Trees DP

class Solution(object): def numTrees(self, n): """ :type n: int :rtype: int """ dp=[0 for x in range(n+1)] dp[0]=1 dp[1]=1 for i in

2017-10-06 17:10:29 234

编译原理 LR(0)项目集规范族的构造 LR(0)分析表+分析串的代码实现

编译原理作业:输出LR(0)分析表,并且可以判断一个语句是否符合文法。整个过程我是使用codeblocks的c++编写的,其中用了一下STL标准库中的队列、映射。这是实现功能的详细代码,有注释的伪代码以及测试用的相关样例数据。

2015-12-06

编译原理 NFA_DFA 画图 C#

编译原理老师布置的作业要求程序实现NFA_DFA,然后还要输出图像,这个程序是读取一个txt文档数据然后输出一个DFA图,生产txt文档的程序是用c++写的,在我上传的另一个资源里,这两个一起用会有奇效喔

2015-11-28

编译原理NFA-DFA转化原创代码以及算法详解

编译原理老师讲完NFA_DFA布置的作业,因为我是搞ACM的,这个题目用到的算法自己经常用,于是我就用bfs+dfs+状态压缩乱搞搞弄出个代码来,功能ok,100%原创,仅仅提供大家参考。这个是输出的表格部分,我们的程序还支持自动输出dfa的图形,我感觉画图比这个算法还难。。。在另一个资源里再下载。

2015-11-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除