自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

不积跬步,无以至千里;不积小流,无以成江海

科学计算 金融工程 数据挖掘 算法和程序

  • 博客(78)
  • 资源 (3)
  • 收藏
  • 关注

原创 设计模式:单例模式

目的:Ensure a class only has one instance, and provide a global point of access to it.应用:

2014-10-19 17:42:34 1013

原创 设计模式: 观察者模式

下面是观察者模式的一个例子,源代码来自《设计模式精解-Gof 23种设计模式解析附C++实现源码》。源代码在每个观察者对象析构时有bug,会导致重复删除subject对象。

2014-10-18 22:39:48 1230

原创 sizeof

下面一段代码#include #include void func(char str[50]){ printf("A %d B %d\n",sizeof(str),strlen(str));}int main(void){ char stra[]="HelloWorld"; char *strb=stra; printf("C %d D %d\n",sizeof(

2013-06-13 23:40:20 1885

原创 小玩意系列:增强Windows运行栏的功能 (二)

源自:http://blog.csdn.net/zhaoyl03/article/details/8887724这一篇是技术文章,上接小玩意系列:增强Windows运行栏的功能 (一),主要讲如何批处理写注册表,从而实现SeventhSaint的install和uninstall功能。SeventhSaint的install过程,实际上是在注册表里添加xxx.exe项,并将默认键值改为可执

2013-05-05 20:07:31 1301

原创 小玩意系列:增强Windows运行栏的功能 (一)

源自:http://blog.csdn.net/zhaoyl03/article/details/8887157在 Windows “运行”栏里输入“ regedit” 会打开注册表,输入“control” 会打开控制面板,输入一个网页会用默认浏览器打开网页,输入“cmd”, 然后在命令提示符在输入“ipconfig",会显示计算机的ip设置。然而这些命令不大容易记,如果用简单的命令来代替这些

2013-05-05 19:17:28 1847

转载 批处理for命令详解

非常好的解释了批处理中for的用法,转起!转自:http://www.cnblogs.com/focusHr/archive/2009/02/05/1384751.html批处理for命令详解FOR这条命令基本上都被用来处理文本,但还有其他一些好用的功能!看看他的基本格式(这里我引用的是批处理中的格式,直接在命令行只需要一个%号)FOR 参数 %%变量名

2013-05-05 09:56:33 1095

原创 妙用Windows“运行”

1. 自动打开一个程序(需要先设置),参见 Windows操作系统“运行”功能另类妙用.2. 根据名称打开已有支持程序,参见Windows中 “开始”→“运行”妙用,用命令打开控制面板等3. 运行快捷命令,参见快捷命令4. 实用小工具(可以弄成siri)如果能写一个软件,输入,比如“IP“,返回ip地址;输入”用QQ聊天“,打开QQ,应该是很有趣的。源自:htt

2013-05-02 10:58:03 1409

原创 小玩意系列:Python调用Google翻译

出自:http://blog.csdn.net/zhaoyl03/article/details/8830806最近想动手做一个文档自动下载器,需要模拟浏览器的行为。虽然感觉思路上没有困难,但在技术细节上需要自己一步一步试探。在网上搜索相关内容的过程中,发现有人用Python调用Google翻译。我自己也试着实现这个小玩意,从而熟练和学习一些技术,如正则表达式匹配,模拟浏览器等。将这个小结果记

2013-04-21 14:14:42 11560 5

转载 Physicists Discover a Whopping 13 New Solutions to Three-Body Problem

转自:http://news.sciencemag.org/sciencenow/2013/03/physicists-discover-a-whopping.html物理家发现三体问题的13个新的周期解It's the sort of abstract puzzle that keeps a scientist awake at night: Can you predict ho

2013-04-19 09:32:30 1274

转载 Talking about the Computational Future at SXSW 2013

转自:http://blog.stephenwolfram.com/2013/03/talking-about-the-computational-future-at-sxsw-2013/Last week I gave a talk at SXSW 2013 in Austin about some of the things I’m thinking about these days—

2013-04-19 09:26:57 2647

原创 初窥Applet

下午在查Fourier近似时,在网页上看到一个小程序,给定一些函数,可以将傅里叶近似的结果用图像显示,可以和用户交互,如下图,一目了然(如果大学教育能多多地使用这种方式,那么学生会更能接受)。一时好奇,就想看看源代码,同时想把这个小程序保存在本地。网页的地址是http://www.jhu.edu/signals/fourier2/index.html,通过查看网页的源代码,发现

2013-04-16 21:50:26 1660

原创 ChiMerge 算法: 以鸢尾花数据集为例

ChiMerge 是监督的、自底向上的(即基于合并的)数据离散化方法。它依赖于卡方分析:具有最小卡方值的相邻区间合并在一起,直到满足确定的停止准则。基本思想:对于精确的离散化,相对类频率在一个区间内应当完全一致。因此,如果两个相邻的区间具有非常类似的类分布,则这两个区间可以合并;否则,它们应当保持分开。而低卡方值表明它们具有相似的类分布。参考:1. ChiMerge:Discretiz

2013-03-25 21:28:54 22910 9

原创 Tex中的正则表达式替换

本人在用Tex写论文时,碰到要将\textbf{NumEQ},\textbf{NumBC},\textbf{Err[k]}这样的字符串全部相应地转换成\verb|NumEQ|, \verb|NumBC|, \verb|Err[k]|。因为文章中有大量地方需要修改,手动修改机耗时又可能漏掉,最终采用正则表达式替换修改。对被替换的字符换描述为:\\textbf\{\(*\)\}

2013-03-18 14:20:15 6484

原创 海量数据处理(一)

本文参考了July的教你如何迅速秒杀掉:99%的海量数据处理面试题和quicktest的Python处理海量数据的实战研究。写这篇文章意义是:1)记录自己的经验;2)对大量小文件数据的排序使用了“先Hash,后堆排序”的策略。对小文件先Hash,后堆排列的代码来自July提供的网址,做了微小修改,加了自己的理解。场景:海量日志数据,提取出某日访问百度次数最多的K个IP想法:

2013-03-17 20:29:57 2888

转载 Python yield

参考:1. Python yield 用法2.Python yield 使用浅析yield 简单说来就是一个生成器,生成器是这样一个函数,它记住上一次返回时在函数体中的位置。对生成器函数的第二次(或第 n 次)调用跳转至该函数中间,而上次调用的所有局部变量都保持不变。yield 生成器的运行机制当你问生成器要一个数时,生成器会执行,直至出现 yield 语句

2013-03-17 16:13:57 1377

转载 Python 排序

整理自以下资料,供自己方便查阅.参考:1.python中List的sort方法(或者sorted内建函数)的用法2. Python字典按值排序、包含字典的列表按字典值排序的方法3. Sorting Mini-HOW TOpython列表排序 简单记一下python中List的sort方法(或者sorted内建函数)的用法。 关键字: python列表

2013-03-17 11:09:10 1511

原创 数据挖掘学习札记:KNN算法(三)

1. 如何确定近邻数k的值?答:可通过实验确定。从k=1开始,使用检验集估计分类器的错误率。每次k增加1,选取产生最小错误率的值。2. 在特征空间的维数和训练数据大时,如何对训练数据进行快速k近邻搜索?答:可使用特殊的结构存储训练数据,以减少距离计算次数,如kd树方法  。继续阅读:1.  从K近邻算法、距离度量谈到KD树、SIFT+BBF算法,如题所示,很全。

2013-03-15 19:56:01 3917

原创 数据挖掘学习札记:KNN算法(二)

在数据挖掘学习札记:KNN算法(一)里,使用sklearn模块对例子进行了求解,但是并不清楚k的取值。下面是我写的一个Python代码,程序采用“小题大做”的方式,一方面可以熟悉算法,另一方面练习Python编程,可以看到,当k取1,2,3,4,5时,knn算法预测未知电影的类型都是R,即Romance。说明:1. 距离使用欧氏距离;2. k近邻搜索使用线性扫描;3. 未知电影

2013-03-15 19:21:38 6615 1

原创 数据挖掘学习札记:KNN算法(一)

参考:1. KNN算法介绍,Python程序和一个简单算例2. k-nearest neighbor algorithm基本想法:在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别。俗话叫,“随大流”。算法描述:1. 依公式计算 Item 与 D1、D2 … …、Dj 之相似度。得到Sim(Item, D1)、S

2013-03-14 19:54:47 33516 3

原创 数据挖掘学习札记:ID3算法(一)

参考:1. Wiki上的 ID3 algorithm2. 百度文库里的一个PPT,有算例, 决策树ID3算法   3. 百度文库,PPT,很多算例,开始有信息理论,极力推荐阅读,ID3算法4. 用Python实现ID3和C4.5 决策树ID3和C4.5算法Python实现源码下面是整理的学习笔记。用途:The ID3 algorithm is use

2013-03-12 21:58:02 16239

原创 Ubuntu上搭建Hadoop环境(单机模式+伪分布模式)

Hadoop在处理海量数据分析方面具有独天优势。今天花了在自己的Linux上搭建了伪分布模式,期间经历很多曲折,现在将经验总结如下。首先,了解Hadoop的三种安装模式:1. 单机模式. 单机模式是Hadoop的默认模。当配置文件为空时,Hadoop完全运行在本地。因为不需要与其他节点交互,单机模式就不使用HDFS,也不加载任何Hadoop的守护进程。该模式主要用于开发调试MapR

2013-03-10 21:51:05 40159 7

翻译 使用Python实现Hadoop MapReduce程序

<!---->转自:使用Python实现Hadoop MapReduce程序英文原文:Writing an Hadoop MapReduce Program in Python根据上面两篇文章,下面是我在自己的ubuntu上的运行过程。文字基本采用博文使用Python实现Hadoop MapReduce程序,  打字很浪费时间滴。 在这个实例中,我将会向大家

2013-03-10 21:35:13 78978 11

原创 编程之美“字符串移位包含的问题”的另一种解法

编程之美是一本训练编程思维的好书,给程序设计者很多启发。其中第三章第一个问题是这样的:问题3.1:字符串移位包含的问题给定两个字符串s1和s2,要求判定s2是否弄够被s1做循环移位(rotate)得到的字符串包含。例如,给定s1=AABCD和s2=CDAA,返回true;给定s1=ABCD和s2=ACBD,返回false.书中给了两种方法。解法一对s1进行循环移位,再进行字符串

2013-03-10 20:44:17 3011

转载 数据库和数据仓库的区别

转自:http://www.kuqin.com/datawarehouse/20080505/7903.html       简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的。  数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。  数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。  数

2013-03-10 11:07:01 1255

转载 数学之美番外篇:平凡而又神奇的贝叶斯方法

注:这是非常棒的一篇将贝叶斯方法的科普文章,作者讲的非常仔细,亦有很多例子,非常值得推荐!!转自:http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/概率论只不过是把常识用数学公式表达了出来。——拉普拉斯记得读本科的时候,最喜欢到城里的计算机书店里面去闲逛,一逛就是好几个小时;有一次,在书店看

2013-03-10 10:14:30 1735 1

转载 BloomFilter(布隆过滤器)

布隆过滤器 (Bloom Filter)是由Burton Howard Bloom于1970年提出,它是一种space efficient的概率型数据结构,用于判断一个元素是否在集合中。在垃圾邮件过滤的黑白名单方法、爬虫(Crawler)的网址判重模块中等等经常被用到。哈希表也能用于判断元素是否在集合中,但是布隆过滤器只需要哈希表的1/8或1/4的空间复杂度就能完成同样的问题。布隆过滤器可以插入元

2013-03-09 11:43:41 1961

转载 Python与简单网络爬虫的编写

转自:http://xiaoxia.org/2012/11/02/python-cralwer/电影来了这个电影资源搜索网站火起来了,曾有一段时间因为太多人访问我的博客,访问量高于平常十多倍,Apache、PHP和MySQL这三个庞大的东西搭建的庞大的wordpress博客就直接挂掉了,直接挂掉了,挂掉了,了。。。从上一篇博文的评论中看出似乎很多同学都比较关注爬虫的源代码。我也给大

2013-03-03 22:32:02 10243 2

转载 用python 写爬虫,去爬csdn的内容,完美解决 403 Forbidden

转自:http://www.yihaomen.com/article/python/210.htmcsdn上偶尔还是有那么一两篇好文章的,如果遇到这样的好文章,你想直接把它弄到自己的网站里面,或者保存到本地处理,一般来说,两种方法:1. copy and paste,这个不用多介绍,会用电脑的人都会。2.自己写个爬虫,根据页面地址,自动爬出想要的内容。在这里采用python写爬虫。

2013-03-03 22:19:11 15540 1

转载 Python写爬虫——抓取网页并解析HTML

转自:http://www.lovelucy.info/python-crawl-pages.htmlCUHK上学期有门课叫做Semantic Web,课程project是要搜集整个系里面的教授信息,输入到一个系统里,能够完成诸如“如果选了A教授的课,因时间冲突,B教授的哪些课不能选”、“和A教授实验室相邻的实验室都是哪些教授的”这一类的查询。这就是所谓的“语义网”了啊。。。然而最坑爹的是

2013-03-03 20:50:28 34925 1

转载 Bruno Buchberger: A life devoted to symbolic computation

参见http://linkinghub.elsevier.com/retrieve/pii/S0747717105001306

2013-02-26 10:33:22 946

转载 Shanks transformation

转自:http://en.wikipedia.org/wiki/Shanks_transformationMotivationThe Shanks transformation is motivated by the observation that — for larger  — the partial sum  quite often behaves approximate

2013-02-24 16:01:27 2561

原创 制作网页访问者的地图

在自己的个人网页上添加一个访问者的地图,实时显示访问者的地理位置,是一件很Cool的事情。下图中,小红点代表访问者的地理位置,小黄点代表当前访问者的位置。如何制作自己的地图呢?1.在clustrmaps上填写网站的信息和接收密码的邮件;2. 用收到的密码和监视的网页地址登陆ClustrMaps管理;3.根据需求生成自己想要的HTML代码,将其添加到自己的个人主页上.

2013-01-22 20:31:45 2379 1

转载 在网页上嵌入搜索和访问计数器

1. 将下面HTML代码嵌入网页,可将百度放在网页上<iframe id="baiduframe" marginwidth="0" marginheight="0" scrolling="no" framespacing="0" vspace="0" hspace="0" frameborder="0" width="200" height="30" src="http://un

2013-01-21 14:48:46 2946

转载 OpenCL开发案例学习

OpenCL开发案例学习本文主要为开发者提供一些OpenCL程序的实现方法,帮助开发者更直观地了解如何使用OpenCL编写程序。【案例】基于OpenCL的并行HDR算法实现【案例】基于OpenCL的K-means算法的并行实现【案例】基于OpenCL的Adaboost并行人脸检测算法【案例】基于OpenCL的三维模型凸包生成算

2013-01-18 15:00:31 1181 1

转载 Clenshaw–Curtis quadrature

参见 http://en.wikipedia.org/wiki/Clenshaw%E2%80%93Curtis_quadrature

2013-01-14 11:52:53 2020

原创 Chebyshev 展开

Chebyshev展开是将有限区间上的光滑函数以Chebyshev多项式为基做展开。和Taylor展开不同的是,它对展开函数的光滑性要求较低,只需连续即可。著名的Chebfun系统基础之一就是Chebyshev展开。下面是Mathematica上的一个简单的Chebyshev展开,展开系数使用Gauss-Chebyshev积分计算,积分的代数精度是2*M+1,这里M是展开的阶数。(******

2013-01-13 15:31:19 4921

转载 Java的第一个程序

1. Windows7系统下JAVA运行环境下载、安装和设置2. Java第一个程序_HelloWorld(命令提示符窗口下)

2013-01-01 13:14:33 719

转载 优秀asp.net程序员修炼之路

转自:http://baike.baidu.com/view/6752.htm       “为人写程序”  初级的程序员或经验不足的程序员往往只意识到自己的程序是写给计算机的,而不会在意程序其实也是写给人的,或在意得不够、不全面。  写给机器的程序,往往追求的是运行正确、执行效率能满足要求。但程序员的任务仅仅就是把业务逻辑转成机器能编译的计算机语言吗?

2012-12-31 22:53:53 795

转载 UltraEdit中使用正则表达式替换

转自:http://78479.blog.51cto.com/68479/21762正则表达式 (UltraEdit Syntax):% 匹配行首 - 表明要搜索的字符串一定在行首. $ 匹配行尾 - 表明要搜索的字符串一定在行尾 ? 匹配除换行符外的任一单个字符. * 匹配任意个数的字符出现任意次数(不包括换行符) 匹配前导字符或者表达式出现一次或者更多次(不包括换行

2012-12-25 10:00:37 1094

转载 查尔斯·巴贝奇——计算机先驱者之父

2012-12-10 21:17:33 3422

SeventhSaint.zip

Seventhsaint是一个“增强windows运行栏功能的”小工具,用批处理和注册表实现,在Winbdows 7 企业版开发和测试。安装以后,在运行栏里输入“注册表”,会打开注册表;输入“ip”,会显示计算机的ip设置;输入“音乐”,会打开媒体播放器,输入“睡眠”,计算机会进入睡眠状态;输入关机,会60秒倒计时关机;输入“淘宝”,会打开淘宝网;输入“程序”,会打开程序安装和卸载功能;输入“计算器”,会打开计算器;输入“写字板”,会打开写字板,等等。另外,用户可以很容易地根据自己的喜好扩展功能,定制属于自己的“7号机器人”。有关Seventhsaint的技术文档,参见http://blog.csdn.net/zhaoyl03/article/details/8887157。

2013-05-05

SeventhSain

Seventhsaint是一个“增强windows运行栏功能的”小工具,用批处理和注册表实现,在Winbdows 7 企业版开发和测试。安装以后,在运行栏里输入“注册表”,会打开注册表;输入“ip”,会显示计算机的ip设置;输入“音乐”,会打开媒体播放器,输入“睡眠”,计算机会进入睡眠状态;输入关机,会60秒倒计时关机;输入“淘宝”,会打开淘宝网;输入“程序”,会打开程序安装和卸载功能;输入“计算器”,会打开计算器;输入“写字板”,会打开写字板,等等。另外,用户可以很容易地根据自己的喜好扩展功能,定制属于自己的“7号机器人”。有关Seventhsaint的技术文档,参见http://blog.csdn.net/zhaoyl03/article/details/8887157。

2013-05-05

SeventhSaint

用批处理实现的一个“增强Windows运行栏功能”小工具。在Windows 7 上开发和测试。安装以后,在“运行”栏里输入“睡眠”,计算机进入睡眠状态;输入“注册表”,会打开注册表;输入“ip”,会显示计算机的ip设置,输入“音乐”,会打开媒体播放器,输入“淘宝”,会打开淘宝网,等等。你可以根据自己的偏好扩展功能,定制属于自己的“7号机器人”,是它相应你的输入命令。

2013-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除