自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(108)
  • 收藏
  • 关注

转载 Python------pyecharts中常用的属性解释

legend图例组件。图例组件展现了不同系列的标记(symbol),颜色和名字。可以通过点击图例控制哪些系列不显示。#is_legend_show -> bool 默认True,是否显示顶端图例#legend_orient -> str 默认‘center’,图例组件离容器左侧的距离,有'left', 'center', 'right'可选,也可以为百分数,如"%60"#legend_top -> str 默认‘top’,图例组件离容器上侧的距离,有'top', 'ce

2021-07-01 20:04:46 2435

转载 Numpy,Pandas,Matplotlib常用函数

import numpy as np   import pandas as pd   import matplotlib.pyplot as plt      ---------------numpy-----------------------   arr = np.array([1,2,3], dtype=np.float64)   np.zeros((3,6))  np.empt...

2018-12-11 10:10:24 657

原创 同步,异步,并发,并行

     同步可以看成一个单线程操作,只要客户端请求了,在服务器没有反馈信息之前是一个线程阻塞状态。(同步是多个线程同时访问统一资源,等待资源访问结束,浪费时间,效率低。)    异步:看成多线程,在客户端请求时,可以执行其他线程,并且把这个线程存放在他的队列里面,有序的执行。(访问资源时在空闲等待时同时访问其他资源)   简单来说:同步是一件一件的事去做,等一件事做完以后才能去做下一件。...

2018-12-09 22:50:54 464

原创 项目中bug总结

一、invalid literal for int() with base 10: '293.02'在进行数组使用reduce求总和的时候,不能使用int()类型,应该使用float()。二、raise ValueError("Unknown label type: %r" % y_type)        Unknown label type: 'continuous'在进行模型...

2018-12-09 22:46:21 761

原创 比较全面的Adaboost算法总结(一)

目录:1. Boosting算法基本原理2. Boosting算法的权重理解3. AdaBoost的算法流程4. AdaBoost算法的训练误差分析5. AdaBoost算法的解释6. AdaBoost算法的正则化7. AdaBoost算法的过拟合问题讨论8. 总结Boosting的算法流程Boosting算法是一种由原始数据集生成不同弱学习器的迭代算法,然...

2018-12-07 12:27:45 1647

原创 初识Hadoop,对hadoop的简单认识,写的很明白

hadoop是什么?(1)Hadoop是一个开源的框架,可编写和运行分布式应用处理大规模数据,是专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式。Hadoop=HDFS(文件系统,数据存储技术相关)+ Mapreduce(数据处理),Hadoop的数据来源可以是任何形式,在处理半结构化和非结构化数据上与关系型数据库相比有更好的性能,具有更灵活的处理能力,不管任...

2018-12-06 14:22:00 629

原创 Linux常用高级命令

嗯,夜深了,多少人都已经进入梦中。回想起自己的小时候,没有电视,没有手机,白天光着脚丫子出去玩,晚上回来吃饭,天黑了,就早早的睡了。曾经多少次幻想着自己长大,长大了才会怀念小时候。长大了,就要咬着牙坚持,坚持不了了也要坚持,因为你的身后背负了太多的希望与责任。你不敢放松,怕一松就再也起不来了。几天没写博客了,今天复习了一下linux命令,挑了几个常用的分享出来:Du :查看文件大小ps –...

2018-12-05 00:31:28 519

原创 在虚拟机Linux部署Nginx服务器

安装Nginx服务器之前首先要部署自己的环境,下载一些安装包,下载命令:sudo apt install gccSudo apt install zlib1g-dev sudo apt install libpcres-dev 然后取官网下载对应的nginx稳定版安装包,1.14系列的即可,地址:http://nginx.org/en/download.html#找到安装...

2018-12-04 23:52:56 688

原创 python中的序列化问题

序列化 是指将对象、数据结构的状态信息转换为可以存储或传输的形式的过程。在序列化期间,对象将其当前状态写入到临时或持久性存储区。以后,可以通过从存储区中读取或反序列化对象的状态,重新创建该对象。我们编写的程序,会涉及到各种各样的对象、数据结构,它们通常是以变量的形式在内存中存在着。当程序运行结束后,这些变量也就会被清理。但我们有时希望能够在下一次编写程序时恢复上一次的某个对象(如机器学习中的到结...

2018-12-02 15:32:17 504

原创 58同城字体解密函数(二)

from fontTools.ttLib import TTFontimport base64from io import BytesIOdef make_font_file(base64_string:str): #将base64编码的字体字符串解码成二进制编码 bin_data = base64.decodebytes(base64_string.encode()) ...

2018-11-30 16:33:01 1519 4

原创 58同城的字体解密(一)

在爬虫的时候,经常会遇到一些反爬机制,但在反爬中字体加密属于比较难解决的一部分。今天介绍一个比较简单的解密方法。1、首先找到加密的字体,打开58的一个链接:https://zz.58.com/pinpaigongyu/?utm_source=market&spm=u-LlFBrx8a1luDwQM.sgppzq_zbt&PGTID=0d100000-0015-67a3-d744...

2018-11-30 14:36:55 5410

转载 数据库三大范式详解

参考资料    https://blog.csdn.net/w__yi/article/details/19934319作者写的很好,调理清晰,不需要再进行整理。

2018-11-28 08:50:39 300

原创 Navicat Premium 12破解方法,亲测有效

1、按步骤安装Navicat Premium,如果没有可以去官网下载:http://www.navicat.com.cn/download/navicat-premium2、安装好后下载激活文件:https://pan.baidu.com/s/1kVgTd6R  提取密码:t1yp3、下载好后解压文件,可以看到如下目录:4、重启启动软件即可...

2018-11-27 15:49:32 4000 1

原创 Python基础面试题。很基础也特别容易被面试到。

1.HTTP和Session的区别http是用于从万维网服务器传输超文本到本地浏览器的传送协议。基于TCP/IP通信协议来传送数据,主要特点:【1、简单快速,请求方法:get,head,post,因为协议简单,使的HTTP服务器的程序规模小,通信速度快。2、灵活,HTTP允许传输任意类型的数据对象。3、无连接,限制每次连接只处理一个请求,服务器处理完请求,并受到客户的应答后,即断开连接,这种方式...

2018-11-24 08:52:50 394

转载 使用正则表达式匹配中国运营商手机号的正则表达式(不含港澳台地区)

匹配手机号码的正则表达式:^1([358][0-9]|4[579]|66|7[0135678]|9[89])[0-9]{8}$目前匹配号段中国电信号段133、149、153、173、177、180、181、189、199中国联通号段130、131、132、145、155、156、166、175、176、185、186中国移动号段134(0-8)、135、136、137、138、...

2018-11-23 22:14:08 2525

转载 基础才是王道——TCP/IP详解学习笔记 这位仁兄写得太好了

写的真的很棒,开头就感觉到了明显的不一样,瞬间对整个概念都有了一定的认知。http://www.cnblogs.com/fengzanfeng/articles/1339347.html   

2018-11-23 20:52:31 483

转载 详细解析Cookie和Session的作用和工作原理,适合新手学习

一、Cookie详解(1)简介因为HTTP协议是无状态的,即服务器不知道用户上一次做了什么,这严重阻碍了交互式Web应用程序的实现。在典型的网上购物场景中,用户浏览了几个页面,买了一盒饼干和两饮料。最后结帐时,由于HTTP的无状态性,不通过额外的手段,服务器并不知道用户到底买了什么。为了做到这点,就需要使用到Cookie了。服务器可以设置或读取Cookies中包含信息,借此维护用户跟服务器...

2018-11-23 20:02:29 341

转载 深度解析HTTP协议

HTTP简介HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。HTTP是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系...

2018-11-23 18:57:43 618

转载 机器学习十大算法系类

https://blog.csdn.net/v_JULY_v/column/info/datamining

2018-11-22 21:30:00 222

原创 python线程安全队列

一直困扰我的问题,在博客园和CSDN中都查阅过资料,答案千奇百怪,查阅官网跟几位大牛交流后做了一个小总结:python中的list,dict,set,tuple都不是线程全队列。因为例如list在append()或者remove()的时候,资源是共享的,然后python没有在这些队列里面封装锁。但python中的queue队列属于线程安全,他底部封装了锁。所谓线程安全,就是一个线程在同一时...

2018-11-22 13:40:44 4440

原创 利用朴素贝叶斯分析鸢尾花,代码有详细解释。

#导入所需要的包from sklearn.naive_bayes import GaussianNBimport numpy as npimport pandas as pdfrom pandas import Series,DataFrameimport matplotlib.pyplot as pltfrom sklearn.datasets import load_irisf...

2018-11-21 20:51:49 9834 1

转载 numpy中np.c_和np.r_的区别

作者写的很好,简单明了。例子import numpy as npa = np.array([1, 2, 3])b = np.array([4, 5, 6])c = np.c_[a,b]print(np.r_[a,b])print(c)print(np.c_[c,a])np.r_是按列连接两个矩阵,就是把两矩阵上下相加,要求列数相等,类似于pandas中的concat(...

2018-11-21 20:16:31 321

原创 机器学习中numpy的meshgrid的理解和作用

刚开始学习numpy的时候,见到过一次meshgrid函数,当时没有深入理解,也不知道干涉么用的,在后面的i项目中见到好几次,然后查阅了一些好的博客,然后在这里自己做了一下总结。在项目中经常遇到这种情况,那么他什么意思和想要表达什么结果呢?x = np.linspace(xmin,xmax,300)y = np.linspace(ymin,ymax,300)xx,yy = np.m...

2018-11-21 20:08:18 1955

原创 Python面试题

1、Python是如何进行内存管理的?答:从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制一、对象的引用计数机制python内部使用引用计数,来保持追踪内存中的对象,所有对象都有引用计数。引用计数增加的情况:1,一个对象分配一个新名称2,将其放入一个容器中(如列表、元组或字典)引用计数减少的情况:1,使用del语句对对象别名显示的销毁2,引用超...

2018-11-20 22:48:40 77

原创 TCP滑动窗口机制

1、A与B之间通过三次握手四次挥手建立TCP连接。在报文的交互过程中,B将自己的缓冲区大小(为3)告诉给A,然后A也将自己的缓冲区大小发送给B,这样A与B都知道了彼此的缓冲区,即窗口大小。2、A开始发送数据,A知道B的缓冲区为3,然后连续发送三个数据,停止发送,等待B的相应。B接收数据,放到缓冲区里面,然后进程读取缓存区里的报文,读取一个,缓存区空出来一个,然后B向A发送相应,告诉A有一个...

2018-11-20 21:51:21 220

原创 机器学习中:autopct = '%0.3f%%',代表的意思。

a = '%3.1f%%'% 1000 # 1000.0%a = '%0.3f%%'% 1000 #1000.000%a = '%1.1f%%'% 100 #100.0%a = '%6.1f%%'% 100 #100.0%小数点前面的数字对产生的结果没有任何影响,小数点后面的数字表示保留小数点几位。...

2018-11-20 20:53:13 19559 4

原创 机器学习中,数据预处理:fit_transform()和transform()的区别

# 从sklearn.preprocessing导入StandardScaler from sklearn.preprocessing import StandardScaler # 标准化数据,保证每个维度的特征数据方差为1,均值为0,使得预测结果不会被某些维度过大的特征值而主导 ss = StandardScaler() # fit_transform()先拟合数据,再标准化...

2018-11-20 20:06:33 1034

原创 浅谈解析python线程安全锁问题

当多个线程几乎同时修改某一个共享数据的时候,需要进行同步控制线程同步能够保证多个线程安全访问竞争资源,最简单的同步机制是引入互斥锁。互斥锁为资源引入一个状态:锁定/非锁定。某个线程要更改共享数据时,先将其锁定,此时资源的状态为“锁定”,其他线程不能更改;直到该线程释放资源,将资源的状态变成“非锁定”,其他的线程才能再次锁定该资源。互斥锁保证了每次只有一个线程进行写入操作,从而保证了多线...

2018-11-20 16:09:47 252

原创 如何防止决策树过拟合的几种方法

一.什么是过度拟合数据?    过度拟合(overfitting)的标准定义:给定一个假设空间H,一个假设h属于H,如果存在其他的假设h'属于H,使得在训练样例上h的错误率比h'小,但在整个实例分布上h'比h的错误率小,那么就说假设h过度拟合训练数据.   overfittingt是这样一种现象:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在训练数据外的数据集上却不能很好的拟合数...

2018-11-19 22:32:30 14553

原创 对方向导数和梯度的理解

在微积分课程中,我们知道函数在某一点的导数(微商)代表了函数在该点的变化率。微分和积分,它们的定义都是建立在极限的基础上。对于单变量函数f(x),它在x0处导数是:当x趋近于x0时,函数的改变量与自变量的改变量的比值的极限,即微商(导数)等于差商的极限 对于单变量函数,自变量只有一个,当x趋近于x0时只能在直线上变动,移动的方向只有左右两方。然而,对于多变量函数,自变量有多个,表示自...

2018-11-19 21:18:35 2246

原创 机器学习中正则化项L1和L2的直观理解

机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,一般英文称作ℓ1ℓ1-norm和ℓ2ℓ2-norm,中文称作L1正则化和L2正则化,或者L1范数和L2范数。L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。对于线性回归模型,使用L1正则化的模型建叫做Lasso回归,使用L2正则化的模型叫做Ridge回归(岭回归)。...

2018-11-19 20:45:02 208

原创 机器学习Knn算法的理解与预测年收入阶段的项目Python代码实现。

最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢,其次就是存在一个测试对象同时与多个训练对象匹配,导致一个训练对象被分到了多个类的问题,基于这些问题呢,就产生了KNN。     KNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间...

2018-11-19 19:35:44 2369 2

转载 极大似然估计详解

https://blog.csdn.net/zengxiantao1994/article/details/72787849

2018-11-19 16:22:40 206

转载 机器学习算法中的过拟合与欠拟合

https://blog.csdn.net/u014696921/article/details/62883249##1

2018-11-19 11:53:50 195

原创 python中的yield函数的使用,并结合生产者与消费者案例。之前一直不太明白,就做了一个程序,依次执行,查看结果一目了然。

# encoding=utf-8#send函数与yield函数都是python中的内部封装函数,两者需要相结合使用#函数执行顺序:调用A,执行1,输出:要开始啃骨头了...,然后执行2,输出:consumer消费者A#执行到3,函数停止,因为没有send函数调用。#调用,执行1,输出:要开始啃骨头了...,然后执行2,输出:consumer消费者B#调用函数C,执行7,输出:正在生产...

2018-11-15 18:03:52 282

原创 在sqlite中创建表自增的时候报错:sqlite(near "AUTO_INCREMENT": syntax error)

SQLite中的自增关键字:AUTO_INCREMENT、INTEGER PRIMARY KEY与AUTOINCREMENTSQLite不支持关键字AUTO_INCREMENTAUTO_INCREMENT不生效的问题在SQLite中,自增字段需要使用关键字INTEGER PRIMARY KEY ...

2018-11-15 12:27:52 2955

原创 使用装饰器,查看函数的运行时间。深度解析python中对时间函数的使用

# Python time clock() 函数以浮点数计算的秒数返回当前的CPU时间。用来衡量不同程序的耗时,比time.time()更有用。# 这个需要注意,在不同的系统上含义不同。在UNIX系统上,它返回的是"进程时间",它是用秒表示的浮点数(时间戳)。# 而在WINDOWS中,第一次调用,返回的是进程运行的实际时间。而第二次之后的调用是自第一次调用以后到现在的运行时间。# (实际上...

2018-11-15 12:24:31 505

转载 简单理解正则化。

1. 正则化的目的:防止过拟合!2. 正则化的本质:约束(限制)要优化的参数。关于第1点,过拟合指的是给定一堆数据,这堆数据带有噪声,利用模型去拟合这堆数据,可能会把噪声数据也给拟合了,这点很致命,一方面会造成模型比较复杂(想想看,本来一次函数能够拟合的数据,现在由于数据带有噪声,导致要用五次函数来拟合,多复杂!),另一方面,模型的泛化性能太差了(本来是一次函数生成的数据,结果由于噪声的干...

2018-11-14 14:48:56 1189

原创 # 有一对兔子,从出生后第3个月起每个月都生一对兔子,小兔子长到第三个月 # 后每个月又生一对兔子,假如兔子都不死,问每个月的兔子总数为多少? # 分析后得:初始值是 1,1。从第3个数开始,每个数是

def tuzi_number(month): #range函数包前不包后 tuzi = [1,1] for i in range(1,month-1): if month <3: break #当month=4的时候,i= 1,2,然后x = tuzi数列的相加 else: ...

2018-11-12 22:48:15 154

原创 #输入年月日,输出该天是今年的第多少天

import datetimedef which_day(year,month,day): dt = datetime.date(year,month,day) du = dt.timetuple() print(du.tm_yday)#输入年月日year = int(input("请输入年份"))month = int(input("请输入月份"))day ...

2018-11-12 22:47:40 245

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除