- 博客(33)
- 资源 (5)
- 收藏
- 关注
原创 拉格朗日乘子法
拉格朗日乘子法拉格朗日乘子法是一种寻找多元函数在一组约束下的极值的方法。通过引入拉格朗日乘子,可将有ddd个变量和kkk个约束条件的最优化问题转换为具有d+kd+kd+k个变量的无约束优化问题求解等式约束先考虑一个等式约束的优化问题。假定xxx为ddd维向量,欲寻找xxx的某个取值x∗x^*x∗,使目标函数f(x)f(x)f(x)最小且同时满足g(x)=0g(...
2019-04-03 17:56:03 646
原创 python字典常用函数
getDocstring: D.get(k[,d]) -> D[k] if k in D, else d. d defaults to None.Type: builtin_function_or_method
2018-10-10 19:03:58 490 2
原创 机器学习算法之KNN
1、基本思想物以类聚、人以群分,一个实例与它周围的实例属于同一类的概率较大。2、算法给定一个训练数据集,对新输入的实例,在训练数据集中找到与该实例最邻近的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。3、代码实现这里,选用了欧氏距离,k的默认值为3,使用了sklearn提供的digits数据集来进行测试。'''Input: X_train: (M, N) matr...
2018-10-10 18:59:14 241
原创 Numpy常用函数
np.argsort对数组排序argsort 返回一个array,此array的每个元素均为非负整数,此array的第i个位置的元素的值表示待排序array的排第i个位置的index(升序排列)。x = np.array([4, 5, 2, 1, 9, 6])index = np.argsort(x)x[index[0]]# 1x[index[1]]# 2x[index[l...
2018-10-10 18:41:30 223
原创 Numpy中矩阵与向量的加法
在Numpy中,矩阵与向量相加时,矩阵的每一行与向量相加,即要求矩阵的列数与向量的维数相等。import numpy as npx = np.array([[1, 2, 3], [4, 5, 6]])# array([[1, 2, 3],# [4, 5, 6]])y = np.array([1, 2])# array([1, 2])z = np.array([1, 2,...
2018-10-10 18:16:24 16165
原创 sklearn常用函数
sklearn常用函数1、生成数据在学习机器学习算法的时候,我们经常需要数据来对算法进行验证。sklearn.datasets模块提供了一些函数,可以生成数据,使用这些数据,我们可以很方便的训练模型,并对其效果进行测试。load_digitsload_digits 生成的数据是手写字体识别的数据,X是1797*64的矩阵,y是1797维的向量。也就是说,X的每一行是一个手写字体的特征...
2018-10-10 14:26:22 3165 1
原创 selenium
from selenium import webdriverbrowser = webdriver.Chrome()# browser = webdriver.Firefox()browser.get("http://www.baidu.com")print(browser.page_source)ChromeDriver下载地址:https://pan.baidu.com/s/19...
2018-03-26 18:44:55 169
原创 python统计文本词频
import jiebafrom collections import Counterdata_ = jieba.cut(text)data = dict(Counter(data_))data2 = sorted(data.items(), key=lambda x: x[1], reverse=True)data2[:10]
2018-02-27 16:40:51 5483
原创 python提取文本关键字
import jieba.analysekwords = jieba.analyse.extract_tags(text, 200)
2018-02-27 16:39:07 5968
原创 python提取文本关键字
import jieba.analysekwords = jieba.analyse.extract_tags(text, 200)
2018-02-27 16:38:47 6569
原创 python指定文件编码格式
res = ['a', 'b', 'c', 'd']with open('职位名称.csv', 'w+', encoding='utf-8') as f: for i in res: f.write(i + '\n')
2018-02-27 14:29:11 1808
原创 python操作MongoDB数据库
from pymongo import MongoClientconn = MongoClient('127.0.0.1', 27017)db = conn.zhilian1my_set = db.table0res = my_set.distinct('职位名称')cursor = my_set.find()print(cursor.next())
2018-02-27 14:26:22 134
原创 MongoDB导入导出数据库
导出mongoexport -d zhilian1 -c table0 -o d:/table.json --type jsonmongoexport -d zhilian1 -c table0 -o d:/table.csv --type csv -f 职位类别, 职位月薪mongoexport -d dbname -c collectionname -o file --type ...
2018-02-26 18:38:40 201
原创 MongoDB启动
mongod --dbpath d:/data/db dbpath后面跟数据库的存储路径启动成功后,输入mongo即可进入mongo控制台
2018-02-24 12:59:44 207
原创 Matlab做分布拟合及绘制频率分布直方图
clcclearclose allx = randn(1000, 1);% 画频率分布直方图[counts,centers] = hist(x, 7);figurebar(centers, counts / sum(counts))% 分布参数拟合[mu,sigma]=normfit(x);% 画已知分布的概率密度曲线x1 = -4:0.1:4;y1 = pdf('...
2018-02-24 12:27:47 65064 3
原创 Python之装饰器
装饰器就是一个以函数作为参数并返回一个替换函数的可执行函数 即装饰器是一个函数,其参数为函数,返回值也为函数 可理解为对函数的功能进行拓展,所以叫装饰# outer为装饰器,效果为给被装饰函数返回值结果加负号def outer(fun): def inner(x): return -fun(x) return innerde...
2018-02-21 20:02:13 135
原创 Python函数之*args与**kwargs
函数定义中参数前的*表示的是将调用时的多个参数放入元组中,**则表示将调用函数时的关键字参数放入一个字典中def one(*args): print(args) print((type(args)))one(1, 2, 3, 'a')# (1, 2, 3, 'a')# <class 'tuple'>def two(**kwargs): print...
2018-02-21 19:45:51 145
原创 numpy之array展开
flatten()可以将二维的array展成一维的 a.flatten(order=’C’) Return a copy of the array collapsed into one dimension. order= 'C' means to flatten in row-major (C-style) order. order='F' means to flat...
2018-02-21 18:44:01 12615
原创 numpy之matrix和array的乘法区别
matrix和array的乘法有所区别1、arrayA * A是对应元素相乘,np.dot(A, A)是矩阵乘法2、matrixA * A是矩阵乘法,np.multiply(A, A)是对应元素相乘具体参考这篇博文[numpy]matrix和array的乘和加...
2018-02-21 15:00:33 705
原创 Python函数之map、reduce、filter
map map(func, *iterables) –> map objectseq1 = [1, 2, 3, 4]seq2 = [5, 6, 7, 8]m1 = map(lambda x: x ** 2, seq1)print(list(m1))# [1, 4, 9, 16]m2 = map(lambda x, y: x + y, seq1, seq2)pri...
2018-02-21 13:57:18 166
原创 Python字典常见函数
items()keys()values()get()pop()popitem()update()setdefault() D.items() -> a set-like object providing a view on D’s items D.get(k[,d]) -> D[k] if k in D, else d. d defaults ...
2018-02-21 13:27:16 262
原创 Python字典排序
x = { 'a': 1, 'b': 2, 'c': 5, 'd': 3}sorted(d.items(), key=lambda x: x[1])# [('a', 1), ('b', 2), ('d', 3), ('c', 5)]
2018-02-21 13:07:18 182
原创 numpy数组排序
获取最大最小值索引argsort(), 返回一个array, 其第i个位置的值为: 原数组从小到大排序,排第i个位置的值的索引import numpy as npx = np.array([1, 7, 3, 5, 2])x.argmax()# 1x.argmin()# 0index = x.argsort() # array([0, 4, 2, 3, 1], dtyp...
2018-02-20 22:27:20 1827
原创 将数据集分为训练集和测试集
在获得数据集后,我们需要将数据集分为训练集和测试集,分别进行模型的训练和对模型进行评估,sklearn提供了train_test_split来分割训练集和测试集from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test_s...
2018-02-20 21:13:53 15241 2
原创 读取sklearn中的数据集
在学习机器学习的时候,我们经常需要数据集来对算法的效果进行验证,sklearn库提供了部分数据集,我们可以很方便地使用from sklearn.datasets import load_digitsdigits = load_digits()dir(digits)# ['DESCR', 'data', 'images', 'target', 'target_names']data =...
2018-02-20 21:06:52 2549
原创 python读取mat文件
mat为Matlab保存数据的格式,使用python的scipy包也可以进行读取import scipy.io as siodef load_data(path): data_ = sio.loadmat(path) data = data_['data'] labels = data_['labels'].flatten() return data, la...
2018-02-20 20:27:11 1917
原创 plt绘图与Axes绘图
使用matplotlib.pyplot(plt)进行绘图时,有两种方法:直接使用plt里的函数使用面向对象的方法,先产生一个Axes对象,再对此对象进行操作,实现绘图第二种方法可以实现更多操作,具有更好的定制性使用plt绘图import numpy as npimport matplotlib.pyplot as pltplt.rcParams['font.sans...
2018-02-20 15:39:18 10588 1
原创 Matplotlib及Seaborn中文显示问题
在使用matplotlib及seaborn时,中文无法正常显示,显示结果为一个方框,解决方法:Matplotlibimport numpy as npimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] # 解决中文显示问题-设置字体为黑体plt.rcParams['axes.u...
2018-02-20 15:27:52 20459 3
原创 numpy基础(一)
这里主要介绍numpy包。ndarray(数组)N维数组对象ndarray,是numpy中最重要的一个对象。创建ndarray用array函数import numpy as nudata = np.array([[1, 2], [3, 4]])type(data)#<class 'numpy.ndarray'>data.dtype#dtype('int64')data.shape#(2,
2017-08-15 14:39:37 345
原创 Python基础(三)
这里主要将python的面向对象编程技术。类和对象类是对客观世界食物的抽象,而对象是类实例化后的实体。比如,水果是一个类,将其实例化为苹果,则苹果就是一个对象。类的定义class Fruit(): def __init__(self, name, color): self.name = name self.color = color def gr
2017-08-11 11:03:10 251
原创 python基础(二)
这里主要讲Python的语法,控制语句,函数,模块和包。语法基础控制语句判断语句ifif...elseif...elif...elsex = 1if x == 1: print('x=1')y = 2if y == 2: print('y==2')else: print('y!=2')z = 3if z == 3: print('z=3')elif
2017-08-10 11:48:07 169
原创 Python基础(一)
Python基础(一)前面已经说过,想要系统的学习Python,可以在廖雪峰Python教程进行学习,这里只介绍与数据分析有关的Python知识。数据类型Python是一种弱类型的编程语言,在声明变量的时候,并不需要指定变量类型,但这不代表Python没有数据类型。实际上,Python会根据变量的值,自动为变量选择合适的数据类型。 下面介绍集中常见的数据类型 数据类型 含义 int
2017-08-09 18:15:54 381
原创 数据分析
数据分析最近在学数据分析,这期间,看了不少书,也敲了很多代码,对数据分析有了比较深入的了解。想写点东西,和大家一起分享。编程语言 1.Python 2.R 3.Matlab 数据分析首推R和Python,这点大家已经达成了共识。为什么要把Matlab放这里面的?因为,Matlab是我数学系的一大神器,积分,微分,解微分方程,画图都很方便。Matlab还是很强大的,我觉得,如果它不是商业软件
2017-07-21 16:14:59 4689 1
信息安全RSA算法实验.rar
2019-11-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人