自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小紫的家园

除了代码,还有心情

  • 博客(32)
  • 资源 (5)
  • 收藏
  • 关注

原创 Python 快速排序

# -*-coding:utf-8'''快速排序'''def Partition(list, low, high): ''' 以列表中首个元素为基准,将列表中的元素按照与key的大小关系, 调整元素的位置,以使得: [ key] ''' key = list[low] while low < high:

2015-07-30 10:52:03 538

原创 Python 选择排序

# -*- coding:utf-8-*-'''选择排序在所有记录中选择最小的一个元素,与第一个记录交换,依次,在其余的记录中选择最小的元素与第二个元素交换'''def SellectSort(list): # list = [4,1,9,13,34,26,10,7,4] m = len(list) if m < 2: # 如果是空表或只有一个元素,返回

2015-07-29 20:20:16 519

原创 Python 希尔排序

# -*- coding:utf-8-*-'''希尔排序'''def ShellSort(list): # list = [4,1,9,13,34,26,10,7,4,3] m = len(list) # 元素数目 gap = m/2 # gap = 5,2,1... while gap > 0: # print gap

2015-07-29 17:22:57 1596

原创 python 插入排序

# -*-coding:utf-8def InsertSort(list): # list = [4,1,9,13,34,26,10,7,4] m = len(list) # 元素个数 for i in range(m): # 对每一个元素 min = i # 当前元素索引 for j in range(i+1,m): #

2015-07-29 10:10:23 636

原创 Python编写MapReduce程序

示例数据hello wordhello pythonmap函数:mapper.py #!/usr/bin/env python import sys for line in sys.stdin: line = line.strip() words = line.split()

2015-07-28 16:11:33 1277

原创 python将txt转换为csv

# -*-coding:utf-8-*-import sysimport csvimport osimport argparsereload(sys)sys.setdefaultencoding("utf-8")def main(): parser = argparse.ArgumentParser(description="Change the txt file to csv

2015-07-28 11:29:53 9856

原创 Apriori

# -*-coding:utf-8-*-'''Apriori'''import numpy as npdef loadDataSet(): return [[1,3,4],[2,3,5],[1,2,3,5],[2,5]] def createC1(dataSet): ''' 大小为1的所有候选项集合 ''' C1 = []

2015-07-18 09:05:28 401

原创 Kmeans

# -*-coding:utf-8import numpy as npdef loadDataSet(fileName): dataMat = [] f = open(fileName) for _line_ in f.readlines(): _curLine = _line_.strip().split('\t') _fitLin

2015-07-14 19:52:44 451

原创 回归 regression

# -*-coding:utf-8import numpy as npimport matplotlib.pyplot as pltdef loadDataSet(fileName): f = open(fileName) _numFeat = len(f.readline().split('\t')) - 1 # 训练数据的特征总数 dataMat = []

2015-07-11 09:50:54 654

原创 adaBoost

# -*-coding:utf-8-*-'''Adaboost'''from __future__ import division import numpy as npdef LoadSimpleData(): dataMat = np.matrix([[ 1. , 2.1], [ 2. , 1.1], [ 1.3, 1. ],

2015-07-09 21:39:12 453

原创 Logistic回归

# -*-coding:utf-8-*-''' 逻辑回归算法'''from __future__ import divisionimport numpy as npimport matplotlib.pyplot as pltimport randomdef loadDataSet(): ''' 训练数据 ---> 训练数据列表,分类标号向量

2015-07-01 21:53:29 429

原创 Python实现决策树算法

# -*-coding:utf-8-*-''' 决策树算法'''from __future__ import divisionimport matplotlib.pyplot as pltfrom math import logimport operatorimport pickledef createDataSet(): dataset = [[1,1,'yes

2015-06-30 21:00:48 945 1

原创 KNN算法

# -*- coding:utf-8-*-from __future__ import divisionimport matplotlib.pyplot as pltimport mpl_toolkits.mplot3dimport numpy as npimport operatorimport osdef createDataSet(): group = [[1.0,1

2015-06-29 21:05:53 399

原创 matplotlib画图异常--超出最大递归次数解决办法

最近在练习一个回归方程,使用python的matplotlib库画图,再将回归直线显示的过程中,出现异常: File "D:\Python27\lib\site-packages\matplotlib\units.py", line 148, in get_converter converter = self.get_converter(xravel[0]) File "D:\P

2015-06-13 10:39:58 1694 1

原创 为什么对带www和不带www的域名ping结果不一致

下午微博惊现神域名,bbbb.com。ping了一下ip地址,ping bbbb.com正在 Ping fw.ename.net [198.148.92.58] 具有 32 字节的数据:来自 198.148.92.58 的回复: 字节=32 时间=227ms TTL=48手抽筋又试了一下www.bbbb.com,ping www.bbbb.com正在 Ping

2015-06-03 17:14:18 6081 1

原创 Python实现朴素贝叶斯分类器

# -*-coding:utf-8-*-'''    朴素贝叶斯算法'''from __future__ import division global classNameclassName = "class"def calc_class(train, classValue):    # 计算分类的概率    _num_cls = 0 

2015-05-26 17:07:08 2070

原创 centos 编译安装redis-3.0.1

1. 下载redis redis官网提供的最新版是redis-3.0.1.tar.gz链接:http://download.redis.io/releases/redis-3.0.1.tar.gz2. 手动下载或者wget下载 wget http://download.redis.io/releases/redis-3.0.1.tar.gz3. 解压编译安装   手动下

2015-05-12 16:27:57 423

原创 Cetos编译安装MySQL5.6

卸载旧版本rpm -qa | grep mysql安装新版本1. 安装编译代码需要的包yum -y install make gcc-c++ cmake bison-devel ncurses-devel2. 下载MySQL5.6.16wget http://dev.mysql.com/get/Downloads/MySQL-5.6/mysql-5.6.16.tar.gz

2015-04-30 08:42:36 529

原创 Python的eclipse编辑环境配置

使用第三方的编辑器编写和调试python程序,最重要的一点是要让吃编辑器能自动找到我们在本机上安装的python解释器下面,按照步骤:0x01 安装Python程序、eclipsepython程序可到官网https://www.python.org/下载,目前最常用的版本是2.7.3,当然也一直在推广3.x,有兴趣的朋友可以试试。eclipse程序可到官网http://www.ec

2015-03-30 16:55:11 1340 1

转载 Windows 下的Python扩展库

转载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/点击打开链接Unofficial Windows Binaries for Python Extension Packagesby Christoph Gohlke, Laboratory for Fluorescence Dynamics, University of Califor

2015-03-26 09:32:35 8027

原创 新浪微博API认证并采集最新微博等信息

# -*-coding:utf-8-*-''' @ Weibo API公共接口 @ Date : 12/25/2014 '''from weibo import APIClientimport json,webbrowserimport sysreload(sys)sys.setdefaultencoding('utf8')# 定义全局变量APP_KEY = '

2015-03-24 10:15:35 711

原创 二分法从数组中查找指定元素

# -*- encoding: utf-8 -*-# 二分法从数组中查找指定元素def test(array,K): i = 0 l = 0 # 数组最左边记为 0 r = len(array) # 数组最右边 while(1+l != r): i = (l+r)/2 if (array[i] < K): l = i elif (array[i] > K):

2015-03-17 21:13:24 751

原创 pyspider的mysql数据存储接口

#!/usr/bin/env python# -*- encoding: utf-8 -*-# Created on 2015-03-12'''pyspider结果保存到数据库简单样例。使用方法: 1, 把本文件放到pyspider/pyspider/database/mysql/目录下命名为mysqldb.py; 2, 建立相应的表和库; 3, 在脚本文件里使用

2015-03-12 15:19:14 8382 2

原创 从本地mysql服务器导出导入csv文件

1. 从本地mysql数据库导出csv文件到本地文件:select * from table into outfile '***' fields terminated by ',' optionally enclosed by'' lines terminated by '/n';实例select bread,height,weight from cluster into outfile

2015-01-30 11:22:36 1061

原创 python实现调用搜狗号码通返回查询内容

# -*- coding: utf-8 -*- import urllib,urllib2import cookielib,re''' @搜狗号码通,返回所查号码的信息 @Time:2015/01/20'''class RedirectHandler(urllib2.HTTPRedirectHandler): def http_error_302(self,req,respons

2015-01-20 19:25:19 981

原创 使用sina公开接口查询ip地址信息

# -*- coding: utf-8 -*- import urllib2,json''' @Time : 2015-01-19 @Author : zilangboya @Version: 1.0'''# 使用sina的公开ip查询接口,返回ip所属国家、省、市# 以及服务商、ip段起始、结尾地址def ipool(ip): print "The ip look

2015-01-19 10:45:41 1178

原创 centos 更改用户名

系统原来的用户lou,改为scrapy,要改是个地方1.   # vim /etc/passwd修改其中的用户名部分、用户组部分、主目录部分2. # vim /etc/group修改用户名部分、用户组部分3.# vim /etc/gshadow4.# vim /etc/shadow用户名部分5.  修改主目录# mv /home/lou /home/scrapy

2015-01-04 19:15:24 2517

原创 复制Centos虚拟机网卡eth1和eth0

在centos虚拟机群安装过程中,复制已经配置好的centos系统会节省很多时间,然而在打开复制的centos系统时,会出现网络连接的问题,如图:下面是解决方法:1.  查看我们的系统网卡    # vim /etc/udev/rules.d/70-persistent-net.rules看到这里有新旧两个网卡,新网卡被识别为eth1:2. 将老网卡的行注释掉,然后

2015-01-04 17:35:03 628

原创 python 实现华安信达论坛自动登录

近期需要从论坛采集一些数据,就使用爬虫专属语言python写了一个小爬虫,实现自动登录,并到指定的板块采集帖子标题、作者等信息。实现自动登录的关键在于模拟浏览器向服务器发送数据包,用Fiddler抓包看一下,过程非常清晰:1. 论坛的登录页面链接 http://bbs.cisps.org/ucp.php?mode=login2. 研究Fiddler捕捉到的数据包,可以看到浏览器以Pos

2014-12-10 20:58:30 1992

原创 ASCII和Unicode编码详解

本文参考大量维基百科和网络大牛的文章,并结合实际例子,试图帮助大家理清计算机的编码问题,从而更加高效的编写程序。一.    知识补充1.1  位我们常说的位是指比特位,即bit,每一个bit位存储一个0或者1。所以,在计算机(二进制数系统)中,一个位(bit)就是指一个0或者1。我们说计算机的CPU一次能处理的最大位数就是指这个位。1.2  字节字节(Byte)是指一小组相邻的

2014-10-23 22:08:51 2690

原创 Linux无密码登录配置

在搭建Hadoop集群时,master与slave,slave与slave之间,

2014-09-26 16:49:01 571

原创 Centos 6.5自带JDK 升级

基于Centos6.5虚拟机搭建Hadoop伪分布集群,虚拟机中自带有

2014-09-25 17:13:43 2142

matplotlib-1.3.1.win-amd64-py2.7.exe

python 2.7 的64位 matplotlib库

2015-04-18

Python for eclipse

ecplise编辑器编写python程序需要的插件

2015-03-30

Python.UNIX和Linux系统管理指南

python linux unix 运维

2014-10-25

Linux高级程序设计 英文版

Linux高级程序设计英文版提供原始的内容讲解,

2014-10-25

Linux程序设计第四版

Linux程序设计殿堂级作品,英文原版,是linux程序开发必不可少的参考书籍!

2014-10-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除