自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ACM 【程式=演算法+資料結構】@蜡笔小轩V

“这么漂亮的女生追求你,你为什么把她拒了?” “妹纸再漂亮,也没有算法漂亮。走了,哥要通宵刷题去了。”

  • 博客(112)
  • 收藏
  • 关注

原创 StarSpace: Embed All The Things! 笔记

StarSpace是facebook开源的一个新的embedding工具包,卖点就是Embed All The Things,也就是名字里star (指’*’通配符) 的含义。 官网 https://github.com/facebookresearch/StarSpaceword2vec有一些后续优化的变种,比如fasttext、starspace。fasttext最大的优化还是加入了su...

2018-05-27 17:46:59 3465 1

原创 cv::pyrMeanShiftFiltering 和 cuda::meanShiftSegmentation源码阅读笔记

最近学了cuda,准备找个项目来练练手。先分析了一把代码,发现主要性能瓶颈在cv::pyrMeanShiftFiltering,原本打算自己撸一个gpu版的,没想到一搜发现已经有人写好了cuda::meanShiftSegmentation。那就改变计划,读读源码吧。mean shiftmean shift简单理解就是划一个圈圈,算出mean,然后往这个方向shift过去。

2017-12-23 01:57:16 2773

原创 AlphaGo Zero到底强在哪里?

当然,最好的材料还是看原版论文。原版论文都没看就别跟别人凑热闹,瞎逼逼了。AlphaGo之前的论文也需要仔细看看,不然可能不明白diff在什么地方。AlphaGo Zero《Mastering the Game of Go without Human Knowledge》AlphaGO Lee《Mastering the game of Go with deep neural networks and tree》

2017-10-22 00:18:49 3967

原创 [自动驾驶]CarND-Vehicle-Detection

听到Vehicle-Detection,我还以为是YOLO,SSD啥的,结果课程里用的是传统的HOG。Excuse me?就是各种论文里被用来踩一脚的SIFT、HOG?那也好吧,深刻体会体会传统方法有多弱鸡。HOGHOG之前简单了解过,不要既然要动手干活,还是得了解一些具体的计算细节。

2017-10-21 23:23:37 3385

原创 [自动驾驶]Advanced-Lane-Lines

前面有一个车道检测的项目,这个是高级版的。 计算机视觉 1. 摄像头:学习摄像头的物理知识,以及如何校准、反失真和转换图像角度。 2. 车道检测:研究可以应对弯道、恶劣天气和不同照明情况的先进车道检测技 术。 3. 实战项目:高级车道检测 在各种条件下检测车道线,包括不断变化的路面、弯道和变化的照明条件。使用 OpenCV、滤波器、多项式拟合和样条曲线(spline)实现

2017-10-07 15:00:45 2617 1

原创 [自动驾驶]LaneLines-P1

车道识别,基于传统的cv方法。之前刚好弄过一个《使用opencv实现通过摄像头自动输入阿里云身份宝验证码》,opencv弄起来驾轻就熟,直接搞起来吧!代码 https://github.com/udacity/CarND-LaneLines-P1

2017-10-03 05:53:19 2339

原创 Udacity 无人驾驶车工程师 博客笔记目录

现在人工智障很火啊,不过吹牛的多,接地气的少,技术还是不能脱离实际应用。无人车看上去是一个比较靠谱的人工智能落地点,而且有一定技术深度,更重要的是看上去比较好玩。Udacity有一个《无人驾驶车工程师》的课程,可惜要交钱,质量不错,墙裂推荐!

2017-10-03 05:16:33 8080 2

原创 [自动驾驶]Build a Traffic Sign Recognition Program

看《准确率98%的深度学习交通标志识别是如何做到的?》这篇文章的时候,发现了udacity的自动驾驶课程。可惜要收费,不过课程project在github上有,那直接做project就好了,不上课了。那先从Build a Traffic Sign Recognition Program开始吧。

2017-09-24 16:17:08 4658 19

原创 使用opencv实现通过摄像头自动输入阿里云身份宝验证码

最近工作中开始使用opencv来做一些跟图像相关的机器学习项目,开始对图像处理产生浓厚的兴趣。搜索资料的时候偶然看到有一些使用opencv读取摄像头的小demo,在输入烦人的阿里云数加身份宝验证码的时候,突发奇想,为何不用摄像头自动识别验证码,实现快速输入。当然,出于学习目的可以用摄像头来输入,如果是公司里,追求短平快和稳定,直接对手机截屏进行识别才是正路。说干就干,公司台式机没有摄像头,先买一个。

2017-07-08 18:56:26 3277 2

原创 边学深度边撸代码之快速Neural style艺术风格转换

主要参考资料: 两分钟demo:快速Neural style艺术风格转换 不过,上面的资料主要还是抛砖引玉用(或者说是推销mxnet啦),要了解细节最好还是得读读原版论文,甚至源代码。所以本篇笔记主要是记录一下Neural Style算法核心idea和代码实现细节。

2017-03-30 23:11:45 2496

原创 FastText

听闻FastText是word2vec的加速版,吓得我赶紧找点资料看看,免得被人给忽悠了。《PaperWeekly 第五期——从Word2Vec到FastText》 这篇文章不错,对word2vec不熟悉的可以先看看这篇。觉得不够清楚,那直接看fastText的github源代码吧 https://github.com/facebookresearch/fastTextPlease cite

2016-12-29 15:20:23 3865 2

原创 《DeepWalk: Online Learning of Social Representations》笔记

简单理解DeepWalk=deep learning(word2vec) + random walk。是把一个图的节点转换成二维坐标,保持坐标相近的点,在原始的图中关系也比较紧密(指边的连接关系)。我把这玩意称作Graph2Vec,差不多是这个意思吧。 处理图关系数据可以借鉴的一个挺有意思的思路。

2016-12-10 13:38:25 8815 1

原创 《Wide & Deep Learning for Recommender Systems 》笔记

看到Deep Learning能用在推荐一下子两眼放光。论文的场景是Google Play的推荐。效果有一点。TensorFlow也有现成的API,可以尝试一下,感觉有希望。

2016-09-19 02:06:44 21326 3

原创 深度学习斯坦福cs231n 课程笔记

前言对于深度学习,新手我推荐先看UFLDL,不做assignment的话,一两个晚上就可以看完。毕竟卷积、池化啥的并不是什么特别玄的东西。课程简明扼要,一针见血,把最基础、最重要的点都点出来 了。 cs231n这个是一个完整的课程,内容就多了点,虽然说课程是computer vision的,但80%还是深度学习的内容。图像的工作暂时用不上,我就先略过了。 突然发现这两个课程都是斯坦福的,牛校就是牛。

2016-07-03 01:57:59 17719 7

原创 蒙特卡罗树搜索+深度学习 -- AlphaGo原版论文阅读笔记

原版论文是《Mastering the game of Go with deep neural networks and tree search》,有时间的还是建议读一读,没时间的可以看看我这篇笔记凑活一下。网上有一些分析AlphaGo的文章,但最经典的肯定还是原文,还是踏踏实实搞懂AlphaGo的基本原理我们再来吹牛逼吧。需要的基础是机器学习基本理论+蒙特卡罗树搜索(MCTS)。

2016-03-23 01:01:30 33114 4

原创 [kaggle实战] Digit Recognizer -- 从KNN,LR,SVM,RF到深度学习

之前看了很多入门的资料,如果现在让我来写写,我觉得我会选择”数字识别(digit recognizer)”作为例子,足够有趣,而且能说明很多问题。kaggle是个实践的好地方,python是门方便的语言,sklearn是个不错的库,文档很适合学习。那就用sklearn来实践一下机器学习,加深理解吧!

2016-02-27 02:11:23 13799 14

原创 LR模型常见问题小议

经常说的2/8原则,LR肯定就是能解决80%问题中那20%的工具。所以LR还是值得好好研究的。发现以前对LR重视不够,总想着赶紧把其他算法也学了,才能拉小跟同事之间机器学习的gap。其实LR用得还是挺多的,而且效果还是不错的。一些高大上的算法,在公司这种大数据面前不一定跑得动,即使跑得动,效果也不一定好,而且还有可解释性和工程维护方面复杂度的问题。这倒是挺残酷的现实。

2016-01-10 23:33:04 6815

原创 windows安装mactype启用mac字体渲染

无图无真相,先上效果图。 之前发现同样的图表,看同事的mac渲染出来的因为字体效果不同,看上去高大上好多啊,一开始以为是mac字体的原因,以为把mac的字体装到windows下就好了,一查发现不是。其实是字体渲染的原因。装个mactype就好了。下载地址自己搜一下就好了,很傻瓜。然后chrome是我常用的浏览器,想开启mactype解决chrome 标题、菜单无法渲染: 在快捷方式的 ‘目标

2015-12-19 00:55:38 5108

原创 [Kaggle]图片去噪题解阅读笔记

《基于R语言的图像处理&机器学习:kaggle图像背景去污比赛系列教程》原文在这里 * Image Processing + Machine Learning in R: Denoising Dirty Documents Tutorial Series 要站在巨人的肩膀前进啊。拜读一下,吸收经验。

2015-12-09 00:13:00 2742

原创 UFLDL_Tutorial 笔记(deep learning绝佳的入门资料 )

推荐一个deep learning绝佳的入门资料 * UFLDL(Unsupervised Feature Learning and Deep Learning)教程 http://deeplearning.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B

2015-11-30 00:15:35 16916 8

原创 机器学习简明手册

机器学习简明手册 面向读者:有一定机器学习基础的。不是新手入门手册。实用导向的,所以不会扣细节和具体式子,只给出算法idea。能当作复习提纲,或者学习的roadmap吧。参考资料主要有《机器学习实战》(简称《实战》),《统计机器学习》,李航著(简称《统计》),cs229。

2015-09-26 19:12:02 3076 1

原创 cs229 斯坦福机器学习笔记(二)-- LR回顾与svm算法idea理解

LR回顾LR是机器学习入门的第一道坎,总结一下,Linear Regression 和logistic Regression都是属于GLM,套了logistic之后,输出结果就变成一个概率了,loss function和 likelihood function取反是类似的东西,都可以作为优化的目标。但我感觉 likelihood function从概率统计上来说,更有理论支持吧。loss

2015-06-14 23:11:55 11847

原创 auc指标含义的理解

机器学习实践中分类器常用的评价指标就是auc,不想搞懂,简单用的话,记住一句话就行auc取值范围[0.5,1],越大表示越好,小于0.5的把结果取反就行。想搞懂的,看An introduction to ROC analysis (Tom Fawcett)这篇论文把。我把这篇论文的要点整理了一下。引子假设有下面两个分类器,哪个好?

2015-01-25 15:50:17 37094 6

翻译 从几何角度看SVD

SVD算是大学线性代数的标配课程内容吧,但貌似没引起多少关注。实际上,SVD除了有很直观的几何解释,还相当有用。比如Netflix(一个在线电影租借公司)为提高电影推荐系统10%精确度悬赏一百万美刀奖金。这问题咋一看好像挺简单,实际上可是很有挑战性。参赛选手用的方法牛B哄哄,但核心就是SVD。 SVD把一个保存有我们感兴趣信息的大矩阵分解成小的、更有含义的小矩阵。这篇文章将介绍SVD的几何含义及一些应用。

2014-07-26 21:32:04 5973 5

原创 cs229 斯坦福机器学习笔记(一)-- 入门与LR模型

说到机器学习,很多人推荐的学习资料就是斯坦福Andrew Ng的cs229,有相关的视频和讲义。不过好的资料 != 好入门的资料,Andrew Ng在coursera有另外一个机器学习课程,更适合入门。这篇笔记是对这两个机器学习课程的笔记

2014-06-29 11:39:04 33630 7

原创 wep加密破解原理简述 & 实战

IV 初始向量,随机生成。PASSWORD用户密码。我们的破解目标KSA 和 PRGA 简单理解为一个加密函数就行。DATA 为我们要传输的数据CRC-32为DATA的校验码为明文的完整性校验值PRGA=RC4(KSA) http://zhaoxiaobu.blog.51cto.com/878176/254633http://www.2cto.com/k

2013-08-05 19:46:12 8282

原创 为什么搜索引擎能索引到需要注册才能访问的论坛帖子

之前去当TA的时候,有人问了谷歌演讲的工程师这个问题。其实人家负责的不是这个模块,也不一定清楚的。那位工程师提到可以自动注册帐号实现登陆再抓取。当然,这在理论上是可行的,不过实际中不可操作。毕竟:论坛是要防一些无聊的人弄机器人自动注册然后发广告。有些会加上验证问题,邀请码,新手论坛规则测试什么的。有些帖子除了要注册,而且还要积分达到一定程度才能看的。我觉得是论坛程序本身来提供搜索引擎优

2012-04-26 11:23:03 2987

原创 Android4.0 x86试玩

去下个iso,然后直接上虚拟机跑。虚拟机我用virtualbox,在ubuntu系统下的。官网:http://www.android-x86.org上面有安装指南比较蛋疼的是android通常没有ethernet上网设置,只有wifi,虚拟机去哪找wifi啊,瞄了个咪。不过还好android是基于linux的,可以用终端搞定,我下的版本里面已经自带终端了。找了好久才

2012-04-18 16:08:48 2339 2

原创 破除校园网使用linux的一大障碍,802.1x拨号程序你自己也可以写

TAG 802.1x  iNode  h3c毕竟用win的人还是比较多,校园网拨号上网的客户端还是对win的支持比较好。不过iNode确实恶心,搞不明白一个拨号上网的东西为什么要做得体积这么大。如果想玩linux的话,上网是一大问题。以前也用过官方配的linux客户端,记得好像叫linux1x什么来着,调用了几个过期的库,虽然整了一把还是能装上。但初学者的话,能不能安装上去感觉是个问题。我比较

2012-04-06 00:54:51 6071 1

原创 Hadoop源码情景小析(1)fs -copyFromLocal

第一次读比较大型的源码。有看到列一大幅类图的,一看头就大。有看到简要分析主要数据结构的,因为源码这么多,总不能事无具细地全讲一遍吧。但少了程序运行的脉络,总让人疑惑系统到底怎么运转起来的。我想,对于初学者,还是从程序运行的线索入手,按功能弄清每个模块的代码,然后连点成线,成面,最终从宏观再整理清整个系统架构,这样还能顺便学习一下大型系统的实现。当然,对于架构大牛,或者java大牛,可能就不需要这么

2012-03-19 16:21:12 2632

原创 hadoop相关启动脚本分析 有助于troubleshoot,顺便学习shell

刚开始配置hadoop难免出错,学习一下启动的脚本对分析错误还是很有帮助的。而且可以顺便学习shell。我自己对shell命令还算比较熟,shell脚本基本看得懂,不过没具体去深究。所以下面提到的一些shell要点高手莫笑。Hadoop 0.20.203hadoop主要命令集散地hadoop-config.sh hadoop-

2012-03-17 14:00:17 3167 1

原创 介绍一个可玩性蛮高的东西-路由器(附RG100AA-A的一点资料)

路由器上装的是一个嵌入式的linux系统,所以基本可以当作linux来玩,可玩性比较高。不像手机的rom不太通用,不能乱刷。linux只要cpu兼容就可以刷,而且通过交叉编译生成其他平台的固件很方便,所以路由器的固件来源比较广。不过虽然同样是linux,电脑上的程序可不能直接传送到路由上运行,因为cpu架构不一样。不过只要有源码,就可以通过交叉编译生成相应平台的版本。通过玩路由

2012-01-18 03:18:32 9557 1

转载 【转】十大给力命令 Top Ten One-Liners from CommandLineFu Explained

// 这篇文章适合有点shell经验的人看,sudo!!      :w !sudo tee %    这两个不错,少走弯路。ssh-copy-id搭集群的时候有用过。python -m SimpleHTTPServer应急拷贝点文件用过And now the explanation of top one-liners from commandlinefu.#1. Run

2011-12-27 23:49:15 2437

原创 给钓鱼网站骗子一点颜色看看---一个简单的攻击程序

群里有人发了一个骗子的链接,不知是被盗号还是怎么。http://tuisend.china.com//cc/00AOLhttp://p.tl/4P9G链接在中华网域名下,跟“中国领事馆”的主题配合得很好,能骗到不少2B青年了。这个tuisend.china.com到底是啥?反正功能是可以提供url转向。猜想是个用来统计的接口什么的吧。“tuisend”?“推送”?

2011-12-25 01:59:38 24631 54

转载 有能力出國讀書的話還是去吧

轉某位同學的日誌,涉及一些不好聽的話,原作者還是不貼出來了吧。今天突然想写点什么,但是又很难完整地表达出来。主要是有些想法积累了很久,一边犹豫该不该说,一边权衡该如何说。 转自徐亚波老师在微博上的一条评论:“晚上参加一个学生创新大赛的评审,比较失望。PPT都是不错,但真正让人耳目一新的项目极少,即便是那些想法简单的B/S项目在产品层面也做的很粗糙。真正对应用感兴趣,大学

2011-12-24 21:41:00 3872

原创 [小实验]linux下正在写入的log文件被mv走了会怎样

某笔试题,当时基本是答对了吧,现在做下实验验证一下。题意就是软件在写一个log文件,比如log.txt,在linux下mv log.txt log2.txt后会怎样?写了个Python程序,有些细节要注意:输出有序数字,方便查看输出内容的时序。sleep一下,免得一下子log太多东西。要flush一下,不然会等缓冲区满了再写盘,影响实验。python没有自增impo

2011-12-20 18:34:27 3683

原创 4479. Gap

新手赛的题,据说是以前4+2的。老了,都没资格参加。在大牛的指点下,用STL的set解决,嚓,这样编程实现的话简单得多啊还好以前有看那本C++ primer,不熟的话,用stl也不是那么好写滴!主要注意:set不支持随机访问。所以就只能用自增,自减来移动指针了。find查找不到返回的是“超出末端的迭代器”。注意数据的一种“情况"要考虑周全。数据类型用int就够了。

2011-12-19 18:08:01 2046

转载 【转】进入2012 -- 回顾我走过的编程之路

//不过我觉得跟学院关系不大来源:陈梓瀚(vczh)的日志 (很荣幸被华南理工大学软件学院邀请撰写此文,关于毕业那会儿找工作的一些事情)前些日子被华南理工大学软件学院邀请回去参加一些活动,其中包括跟一些师弟师妹们进行座谈。期间就有一个人问,要怎么样才可以去微软。其实我从来没有想过这个问题,所以那个时候的答案自然就是微软的广告(编程好,数学好,态度好)了。09年大

2011-12-17 21:49:32 2757

原创 虚拟机的网络连接问题

玩虚拟机,以前总是搞不清共享上网的问题,这次整理一下吧。弄清楚,以后处理问题就比较顺手了。    这里讲一下virtualbox,vmware也差不多吧。以前习惯直接上网搜,不过找到的资料零零散散,而且质量一般般,不靠谱,还是到官网找找吧https://www.virtualbox.org/manual/ch06.html这里简单总结一下(host物理主机,guest虚拟的

2011-12-07 23:43:12 1505

原创 选择64位系统么?

换了ubuntu 64bit,因为打算学习一下chromium的源码,而要编译chromium需要4G+的虚拟内存。    CPU是支持64bit的,我之前想,CPU一个时钟周期处理64bit数据的话,理论上应该速度会快一倍啊。不过从之前安装win7 64bit和这次ubuntu 64bit来看,速度不见得快。而且这次换ubuntu反而慢很多,特别是内存,明显感觉很吃力。    开始怀疑系

2011-11-22 22:21:17 1450

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除