自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 Django

[@TOC]Django1.1 面向切面编程AOP为Aspect Oriented Programming的缩写,意为:面向切面编程,通过预编译方式和运行期动态代理实现程序功能的统一维护的一种技术。利用AOP可以对业务逻辑的各个部分进行隔离,从而使得业务逻辑各部分之间的耦合度降低,提高程序的可重用性,同时提高了开发的效率。在Web项目开发中,特别是进入移动互联网时代以来,基于AOP思想,对项目...

2021-05-27 21:13:08 226

原创 xlrd.biffh.XLRDError: Excel xlsx file; not supported

原因是最近xlrd更新到了2.0.1版本,只支持.xls文件。所以pandas.read_excel(‘xxx.xlsx’)会报错。可以安装旧版xlrd,直接在cmd中运行:pip install xlrd==1.2.0

2021-01-15 15:38:36 691

原创 import xx as xx,xx

import as as后多个单词import jieba.posseg as jp, jieba一开始看到这语句表示这啥意思啊,还有这种用法,还以为是两个别名。其实正确的理解应该是这样:import jieba.posseg as jpimport jieba其实还有很多类似这样的as 容易引起困惑,比如这样写:from django.db import models as dbmodels, backend, connection这句话拆开是这样的:from django.db imp

2020-08-19 10:39:23 867

原创 布隆过滤器安装

布隆过滤器安装布隆过滤器解释安装布隆过滤器解释1970年由布隆提出的布隆过滤器是一个随机映射函数,可用于快速检验一个元素是否在一个集合中。布隆过滤器的空间效率和查询速度远高于一般的查询算法(布隆过滤器的实现基于散列算法),因此它在内容查询上具有很大的优势。高速度查询的同时也带来一定的缺点,它存在一定的识别率和错误率(非常低)。可以说,布隆过滤器用错误率来换取时间和空间。安装我们需要一个叫作pybloom_live的库。在使用这个库的时候,它可能会提示我们下载庞大的VC运行库,提示如下。但我们完全

2020-08-18 16:02:26 231

原创 sql 连接 JOIN

JOIN: 如果表中有至少一个匹配,则返回行LEFT JOIN: 即使右表中没有匹配,也从左表返回所有的行RIGHT JOIN: 即使左表中没有匹配,也从右表返回所有的行FULL JOIN: 只要其中一个表中存在匹配,就返回行1.内连接相当于 where2.左连接左边有就行3.右连接右边有就行4.全连接有就行...

2020-01-16 15:38:15 546

转载 Python_静态属性、类方法、静态方法

插个眼!转载自这个博客1.静态属性我们知道类既有函数属性又有数据属性,实例只有数据属性,我们在使用实例调用类的函数属性并运行时,总要带上函数后面的括号才能运行,不然总是调用函数的内存地址,如下图所示:Python_静态属性、类方法、静态方法问题:那么我们如何能像调用数据属性一样调用函数属性呢?类中提供了@property关键字,可以看成@property是一个装饰器,装饰器的作用是调用类...

2020-01-16 10:53:56 259

原创 使用pytest时No model named XXXXX

目录一、问题描述二、解决方法一、问题描述如果将测试程序和应用程序代码放到不同文件夹下,在使用pytest导入包时,会存在No model named XXXXX的情况,这时候可以在测试代码中导入sys模块,看一下是否没有模块被加载到sys的path里。python导包默认是在sys的path里找。import sysprint(sys.path)问题一般都出在这里,为什么出现这个问题我...

2020-01-03 12:23:08 901 2

原创 dataframe写入mongoDB遇到的一些问题以及解决

目录一、问题If using all scalar values, you must pass an index.bson.errors.InvalidDocument: Cannot encode object.InvalidDocument: documents must have only string keys等等很多类似的错误二、问题分析Mongo需要接受字典格式...

2019-12-17 14:50:29 5500 2

原创 linux命令

文章目录1.简单命令文件系统命令3.文本操作命令1.简单命令type:命令类型help:内部命令帮助man:帮助手册manual 外部命令安装man yum install man man-pages -ywhereis : 定位命令位置file:文件类型echo:打印到标准输出$PATH: 环境变量:路径$LANG: 系统语言ps -fe: 进程列表hash ...

2019-10-25 18:52:35 94

原创 虚拟机安装Linux 配置 克隆

目录1.安装VMware2.安装Linux系统Centos64位3. 配置4. 克隆1.安装VMware2.安装Linux系统Centos64位最大磁盘大小200G 虚拟的 用多少是多少磁盘分区系统内核驱动目录根目录3. 配置IPADDR=192.168.xxx.xxx(不能选1 255 254.。。。1是子网ip 255是广播地址)DNS1=192.168.xx...

2019-10-25 18:32:43 130

原创 随笔

情感分析AI如何影响美国大选词法分析 情感词典机器学习词袋模型词向量模型LSTMlogistic分类开源的自然语言处理(NLP)库Natural language toolkit (NLTK)Apache OpenNLPStanford NLP suiteGate NLP library自然语言工具包(NLTK)是最受欢迎的自然语言处理(NLP)库。它是用 Python...

2019-09-28 11:15:34 113

原创 pandas.read_csv参数

pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~AnyStr]], sep=’,’, delimiter=None, header=‘infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_co...

2019-09-18 10:56:32 290

原创 CentOS python开发环境配置

1. 输入Python,进入Python编译环境,可以发现CentOS自带Python2.6.6版本,输入quit()退出。2. 进入/usr/etc目录安装Python3. 下载python 3.7.2可以通过网站https://www.python.org 找到相应的版本下载,也可以采用wget进行下载。wget下载的命令如下:wget https://www.python.org/...

2019-09-16 10:33:02 130

原创 Autograd自动求导

Autograd: 自动求导机制PyTorch 中所有神经网络的核心是 autograd 包。 我们先简单介绍一下这个包,然后训练第一个简单的神经网络。autograd包为张量上的所有操作提供了自动求导。 它是一个在运行时定义的框架,这意味着反向传播是根据你的代码来确定如何运行,并且每次迭代可以是不同的。示例张量(Tensor)torch.Tensor是这个包的核心类。如果设置 .req...

2019-09-02 22:56:33 240

原创 标准化及编码

特征归一化线性函数归一化零均值归一化线性函数归一化:将数据进行线性变换映射到[0,1]范围内。          Xnorm=X−XminXmax−XminX_{norm}=\frac{X-X_{min}}{X_{max}-X_{min}}Xnorm​=Xmax​−Xmin​X−Xmin​​零均值归一化:将原始数据映射到均值为0、标准差为1的分布上。            z=x−...

2019-09-02 20:44:02 982

原创 指数加权方式

市值加权市值加权是大家最熟知的加权方式,它是指一种以每只成份股的流通股本数量乘以每只股票的价格为基础确定数值的股票指数,是以股票市值作为权重计算出来的指数。以市值作为投资者组合加权的依据,市值越大的股票权重越高,股票涨跌对指数的影响也越大。市值加权方式的优点如下:中国内地的股价指数基本上都是市值加权指数。因此追踪市值加权指数的指数基金最多,流动性最高,费用最低。计算方法简单,容易复...

2019-08-31 13:58:59 2674

原创 指数分类标准

分类一宽基指数沪深300、上证50、中证50、恒生指数、标准普尔500、维斯达克100等窄基指数行业指数或主题指数分类二综合指数指总指数的综合形式,反映总体的综合变动情况,用于比较总量指标。常见的如上证综指、深证综指、创业板块综指规模指数从市值规模角度选择不同成分股数量,更好表征不同板块大中小市值股票的走势情况。例如沪深300、中证500和中证1000三只指数,分别...

2019-08-31 13:49:08 2336

原创 TensorFlow基本分类

训练了一个神经网络模型,来对服装图像进行分类,例如运动鞋和衬衫。tf.keras,这是一个用于在TensorFlow中构建和训练模型的高级API。from __future__ import absolute_import, division, print_function, unicode_literals'''通过该模块,python2可以调用python3的某些功能。首先是可以做个性...

2019-08-28 14:25:03 3089

原创 softmax应用

import tensorflow as tflabels = [[0, 0, 1], [0, 1, 0]] # one-hot标签labels2 = [[0.4, 0.1, 0.5], [0.3, 0.3, 0.4]] # 非one-hot标签labels3 = [2, 1] # sparse标签logits = [[2, 0.5, 6], [0.1, 0, 3]]lo...

2019-08-26 09:53:09 647

原创 TensorFlow——线性回归模型实例

线性回归模型实例import tensorflow as tfimport numpy as npimport matplotlib.pyplot as plt# 模拟数据train_X = np.linspace(-1, 1, 100)train_Y = 2 * train_X + np.random.randn(* train_X.shape) * 0.3plt.plot(t...

2019-08-26 09:45:25 311

原创 variable_scope作用域

import tensorflow as tfwith tf.variable_scope("scope1") as sp: var1 = tf.get_variable("v1", [1])print("sp:", sp.name)print("var1:", var1.name)with tf.variable_scope("scope2"): var2 = tf...

2019-08-26 09:40:12 190

原创 TensorFlow——hello world

import tensorflow as tfhello = tf.constant("hello,Tensorflow!") # 定义一个常量# a = tf.constant(3)# b = tf.constant(4)a = tf.placeholder(tf.int16) # 占位符b = tf.placeholder(tf.int16)add = tf.add(a, ...

2019-08-26 09:35:49 115

原创 决策树

就这样的信息熵是用来描述信息混乱程度或者说确定程度的一个值 。混乱程度越高,熵越大;混乱程度越低,熵越小。  整个样本集合的熵如下:       离散现在要做的是挑出这个“树根”,挑出“树根”的原则是这一个点挑出来一刀切下去,要尽可能消除不确定性,最好一刀下去就把两个类分清楚,如果不行才会选择在下面的子节点再切一次,切的次数越少越好。从熵的定义来看,不难看出,熵越大说明信息混乱程度越...

2019-08-25 15:19:48 3702

原创 三种贝叶斯分类

因变量是定量型的归纳学习称为回归,或者说是连续变量预测因变量是定性型的归纳学习称为分类,或者说是离散变量预测      P(AB)= P(B|A)P(A)  P(A)叫做A事件的先验概率,就是一般情况下,认为A发生的概率。  P(B|A)叫做似然度,是A假设条件成立的情况下发生B的概率。  P(A|B)叫做后验概率,在B发生的情况下发生A的概率,也就是要计算的概率。  P(B)...

2019-08-17 17:16:13 4319

原创 聚类评估

一、 聚类的趋势使用霍普金斯统计量(Hopkins Statistics)来量化评估。  ① 从所有的样本向量中随机找n个向量,把它们称为p向量,每一个向量分别是p1、p2、……、pn。对每一个向量都在样本空间里找一个离其最近的向量,然后求距离(用欧氏距离即可),然后用x1、x2、……、xn来表示这个距离。  ② 在所有样本向量中随机找n个向量,把它们称为q向量,每一个向量分别是q1、q2、...

2019-08-17 10:51:52 1393

原创 密度聚类sklearn.cluster包DBSCAN

#coding=utf-8import numpy as npfrom sklearn.cluster import DBSCANimport matplotlib.pyplot as plt#国家面积和人口X = [ [9670250, 1392358258], # 中国 [2980000, 1247923065], # 印度 [9629091, 31740...

2019-08-16 22:36:51 1665

原创 层次聚类sklearn.cluster包AgglomerativeClustering

**Ward策略:让所有类簇中的方差最小化。Maximum策略:也叫completed linkage(全连接策略),力求将类簇之间的距离最大值最小化。Average linkage策略:力求将簇之间的距离的平均值最小化single单次使用所有观测之间的最小距离两组中的一组。AgglomerativeClustering中linkage参数为 [‘ward’, ‘co...

2019-08-16 22:26:56 9898

原创 k-means聚类

import numpy as npimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeans从磁盘读取城市经纬度数据X = []f = open(‘data.txt’)for v in f:X.append([float(v.split(’,’)[2]), float(v.split(’,’)[3])]...

2019-08-16 21:50:39 141

原创 浮点数(即小数)在编程时为什么不精确

整数运算和浮点数运算为什么要区分整数运算和浮点数运算呢?这是因为整数运算的结果永远是精确的,而浮点数运算的结果不一定精确,因为计算机内存再大,也无法精确表示出无限循环小数,比如 0.1 换成二进制表示就是无限循环小数。用python测试那整数的除法运算遇到除不尽的时候,结果难道不是浮点数吗?我们来试一下:11 / 4 # ==> 2令很多初学者惊讶的是,Python的整数...

2019-01-15 18:05:20 803

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除