oulittle-CSDN博客

原创 python多线程同步机制

力扣中刷到“1114. 按序打印”，题目描述如下：难度简单94收藏分享切换为英文关注通过次数14,189提交次数24,486我们提供了一个类：public class Foo {public void one() { print("one"); }public void two() { print("two"); }public void three...

2020-01-03 15:30:58 368

原创 Git 创建新分支检查分支

创建分支和切换分支，也可以称为检出分支创建新分支：git branch branchName切换到新分支：git checkout branchName上面两个命令也可以合成为一个命令：git checkout -b branchName删除分支：git branch -d branchName被copy的分支（master），拉取的新分支（dev）切换到要cop...

2019-12-16 16:52:11 536

转载 Linux常用命令及其功能

常用命令关于帮助关于查找压缩与解压关机与重启配置OtherPS：常用命令ls:list,所在路径：/bin/ls，显示目录下所有内容，“ll"等同于"ls -l”man + [命令]，可以显示命令的详细用法cd 是切换所在目录的命令，change directory，切换所在目录。所在路径：Shell 内置命令cd 命令的特殊符号：cd+~:切换到用户的家目录，’-‘代...

2019-12-16 15:26:34 552 1

原创 collections模块

collections模块使用专业集装箱数据类型替代Python的通用内置数据类型，dict，list，set，和tuple等。deque所谓双端队列，就是两端都能操作，与Python内置的list区别在于：头部插入与删除的时间复杂度为O(1)拥有几乎所有list的方法，但deque可以选择从左或者从右开始还具备一些其他功能：rotate：所有元素整体向左或右移动n个位置（如...

2019-12-16 11:42:04 159

原创 list,set,tuple,dict

记录python中最基本常用的数据类型及其功能函数：list：len(list)：数组长度max(list)：数组中最大值min(list)：数组中最小值list(seq)：将其他类型转换为list，seq如：tuple\set\dict\str等（list(dict)是将dict的健提出来转换为list）list.append(obj): 在list末尾添加objli...

2019-12-16 11:21:37 146

原创距离度量

在机器学习算法中，常根据样本间的相似度或距离来判断样本的归属或样本之间的相似性，对于不同的问题，具体哪种相似度/距离更适合取决于应用问题的特性。1、闵可夫斯基距离：定义1、给定样本集合X，X是n维实数向量空间中点的集合，其中 ,样本与样本的闵科夫斯基距离定义为： 2、欧式距离：当闵可夫斯基距离中的p=2时，称为欧氏距离，即 ...

2019-12-07 00:23:41 288

原创线代知识点

一、行列式n阶行列式：这里表示对所有n级排列求和，表示排列的逆序数。每项由不同行、不同列的n个元素乘积组成，没项的正负号取决于逆序数。行列式性质：1、行列互换，其值不变2、行列式中某行/列元素全为0，则行列式为03、行列式中某行/列元素有公因子k(k不为0)，则k可提到行或列外面 4、行列式某行/列元素均是两个...

2019-12-07 00:10:28 4847

原创统计学基本极限定理

一、切比雪夫不等式设随机变量X具有数学期望，方差 , 则对任意正数 ε，不等式成立。切比雪夫不等式须满足E(X)和D(X)存在且有限切比雪夫定理大意是：任意一个数据集中，位于其平均数m个标准差范围内的比例（或部分）总是至少为：，其中m为大于1的任意正数。对于m=2，m=3和m=5有如下结果：所有数据中，至少有3/4（或75%）的数据位于平均数2...

2019-12-06 23:12:00 1442

原创条件概率及与其有关的三个概率公式：乘法公式、全概率公式、贝叶斯公式

1、条件概率设A、B为任意两个事件，若P(A)>0,称在已知事件A发生的条件下，事件B发生的概率为条件概率，记为P(B|A) 理解为：条件概率就是在附加了一定的条件之下所计算的概率，当我们说到‘条件概率’时，总是指另外附加的条件，其形式可归结为“已知某事已经发生了”2、乘法公式如果P(A)>0，则 P(AB) = P(A)P(B|A)一般地，如果 ,则...

2019-12-06 22:47:08 9892

原创 Linux 技巧：让进程在后台运行更可靠的几种方法

我们经常会碰到这样的问题，用 telnet/ssh 登录了远程的 Linux 服务器，运行了一些耗时较长的任务，结果却由于网络的不稳定导致任务中途失败。如何让命令提交后不受本地关闭终端窗口/网络断开连接的干扰呢？下面举了一些例子，您可以针对不同的场景选择不同的方式来处理这个问题。nohup/setsid/&场景：如果只是临时有一个命令需要长时间运行，什么方法能最简便的保证它...

2019-12-06 19:17:55 133

转载 linux用户及权限

# useradd –d /usr/sam -m sam此命令创建了一个用户sam，其中-d和-m选项用来为登录名sam产生一个主目录/usr/sam（/usr为默认的用户主目录所在的父目录）。假设当前用户是sam，则下面的命令修改该用户自己的口令：#passwdOld password:******New password:*******Re-enter new ...

2019-12-06 19:17:17 718

转载 python之配置日志的几种方式

作为开发者，我们可以通过以下3种方式来配置logging:1）使用Python代码显式的创建loggers, handlers和formatters并分别调用它们的配置函数； 2）创建一个日志配置文件，然后使用fileConfig()函数来读取该文件的内容； 3）创建一个包含配置信息的dict，然后把它传递个dictConfig()函数；需要说明的是，logging.basicConfi...

2019-12-06 19:13:05 795

原创 Queue模块

Python Queue模块有三种队列及构造函数:1、Python Queue模块的FIFO队列先进先出。 class Queue.Queue(maxsize)2、LIFO类似于堆，即先进后出。 class Queue.LifoQueue(maxsize)3、还有一种是优先级队列级别越低越先出来。 class Queue.Prio...

2019-12-06 19:12:36 132

转载 python3自定义类：重写eq和hash函数

介绍__eq__和__hash__python3中，在set，frozenset，dict这三种数据结构中，都要求键值key是可hash的，因为要保证key的唯一性。而__hash__实际上是返回一个int值，用来唯一标记这个对象。用户自定义类中，如果你没有实现__eq__和__hash__函数，那么class会继承到默认的__eq__和__hash__函数。如下：class Verte...

2019-12-06 19:12:02 944

原创 vim操作全面讲解

目录第一讲移动光标 VIM的进入和退出文本编辑之删除文本编辑之插入小结第二讲删除类命令其他删除类命令关于命令和对象对象命令的特殊情况撤消类命令小结第三讲置入类命令替换类命令更改类命令使用c指令的其他更改类命令小结第四讲定位及文件状态搜索类命令配...

2019-12-06 19:11:44 458

转载判别式模型与生成式模型的区别

产生式模型(Generative Model)与判别式模型(Discrimitive Model)是分类器常遇到的概念，它们的区别在于：对于输入x，类别标签y：产生式模型估计它们的联合概率分布P(x,y)判别式模型估计条件概率分布P(y|x)产生式模型可以根据贝叶斯公式得到判别式模型，但反过来不行。判别式模型常见的主要有：　　　　Logistic Regression　　　　...

2019-12-06 19:01:32 85

原创 mysql导入导出sql文件

window下1.导出整个数据库mysqldump -u 用户名 -p 数据库名 > 导出的文件名mysqldump -u dbuser -p dbname > dbname.sql2.导出一个表mysqldump -u 用户名 -p 数据库名表名> 导出的文件名mysqldump -u dbuser -p dbname users> dbname_user...

2019-12-06 18:52:45 64

原创 MySQL判断一个字段不包含中文

中文=2个字节，英文或数字=1个字节，因此我们用mysql中两个函数比较字节和字符的长度是否相等来判断是否包含中文select * from user where CHAR_LENGTH(name)=LENGTH(name)如果想过滤掉空字符串或限制下长度可以加上长度判断select * from user where CHAR_LENGTH(name)=LENGTH(name) ...

2019-12-06 18:29:23 222

原创 uwsgi nginx 的一些参数

[uwsgi]chdir=/home/git/www/cloudmonitor # 指定项目目录home=/home/git/www/cloudmonitor/.env # 指定python虚拟环境wsgi-file=manager.py # 指定加载的WSGI文件callable=app # 指定uWSGI加载的模块中哪个变量将被调用master=true # 启动主线程...

2019-12-06 18:27:27 112

原创 MySQL 全文检索

1、自然语言全文检索：MATCH(productline) AGAINST('Classic,Vintage' IN NATURAL LANGUAGE MODE);同时包含Classic,Vintage的行将先被召回，然后才返回只包含单个词的行2、Boolean MODE （布尔全文检索）+ 包括，这个词必须存在。 - 排除，这个词不能存在。 > ...

2019-12-06 18:23:24 97

原创 flask uwsgi nginx 部署应用

一、防火墙：阿里云服务器开通端口 centos系统关闭防火墙CentOS 7.0默认使用的是firewall作为防火墙，使用iptables必须重新设置一下1、直接关闭防火墙systemctl stop firewalld.service#停止firewallsystemctl disable firewalld.service#禁止firewall开机启动2、设...

2019-12-06 17:59:23 84

原创损失函数

损失函数（Loss Function）的基本概念是定义在单个样本上的，是指一个样本的误差。代价函数（Cost Function）是定义在整个训练集上的，是所有样本误差的平均，也就是所有损失函数值的平均。目标函数（Object Function）是指最终需要优化的函数，一般来说是经验风险+结构风险，即：代价函数+正则化项。更多的时候我们所说的损失函数就是代价函数，这关系不大，因为从它们...

2019-12-06 17:55:18 408

转载 linux几种快速清空文件内容的方法

　　几种快速清空文件内容的方法：　　$ : > filename #其中的 : 是一个占位符, 不产生任何输出.　　$ > filename　　$ echo “” > filename　　$ echo /dev/null > filename　　$ echo > filename　　$ cat /dev/null > filename...

2019-12-06 17:38:44 163

原创 elasticsearch一些基本用法

elasticsearch 跟关系型数据库 MySQL 的对应角色关系MySQL ElasticSearchdatabase indextable typerow documentcolumn ...

2019-07-05 19:58:09 427

转载 python装饰器

开放--封闭原则：封闭：以实现的功能代码不应该被修改开放：对现有功能的扩展开放装饰器本质上是一个函数，他可以让其他函数在不需要做任何代码处理的前提下增加额外的功能，装饰器的返回值也是一个函数对象。它经常用于有切面需求的场景，比如：插入日志、性能测试、事务处理、缓存、权限校验等场景，装饰器是解决这类问题的绝佳设计。有了装饰器，我们就可以抽离出大量与函数功能本身无关的雷同代码到装饰器中并继...

2019-06-07 15:29:48 6620 4

原创 python命名规范

整理了一下自己的代码，发现混乱的结构和命名让自己头大，所以学习并且整理了一下python的命名规范、风格规范和项目结构规范。一、命名规范：文件名：全小写，可以使用下划线。模块（.py文件）：尽可能短的全小写的名字，如有必要，可以使用下划线增加可读性。包__init__.py文件夹）：尽可能短的全小写的名字，如有必要，可以使用下划线增加可读性。类（...

2019-06-04 10:43:26 452

数据库设计是项目中很基础很重要的环节，好的数据库设计能让开发者在项目开发中对数据操作更简单方便。一般来说，数据库设计需要满足一些规范，以优化数据的存储方式，在关系型数据库中，我们把这种规范称为范式。目前主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式，第一范式满足最基本的规范，在此基础上逐层满足更多要求，第五范式被称为完美范式。但一般在项目中，数据库满足第三范式就足够...

2019-02-28 22:41:16 782 1

原创 python的random模块

昨天刷题的时候遇到了两道取随机数的题，一时没有想起来random模块的具体用法，今天整理一下。import randomrandom.random()：生成一个介于0和1之间（半开区间：[0.0，1.0) ）的浮点数参数为空 random模块下的其他随机数生成函数都是基于此函数random.randrnge(start,end,s...

2019-02-28 14:57:37 249

原创经典排序算法

1、冒泡排序：算法描述：比较相邻元素，如果前序元素大于（或小于，看需求而定）后序元素，就交换两个元素的位置对每对相邻元素重复上面工作，从第一对到最后一对，这样，在经过一轮比较厚，最后一个元素就是最大（或最小）对所有元素重复以上工作，除了已经确定了的前n大（或小）的元素，直到完成排序def bubbleSort(arr): for i in range(len...

2019-02-28 11:18:53 95

转载 uwsgi服务启动(start)停止(stop)重新装载(reload)

1. 添加uwsgi相关文件在之前的文章跟讲到过centos中搭建nginx+uwsgi+flask运行环境，本节就基于那一次的配置进行说明。在www中创建uwsgi文件夹，用来存放uwsgi相关文件在uwsgi文件夹中创建uwsgi.pid和uwsgi.status文件，uwsgi.pid文件用来重启和停止uwsgi服务，uwsgi.status用来查看uwsgi的服务状态...

2019-02-26 10:18:45 296

原创 907. 子数组的最小值之和

碰到leetcode907，子数组的最小值之和，用python3按自己思路写死都过不去，怎么都超时，这是python3代码：class Solution: def sumSubarrayMins(self, A): """ :type A: List[int] :rtype: int """ res = ...

2019-02-22 16:20:42 220

转载计算文本相似度方法

简单讲解基于关键词的空间向量模型的算法，将用户的喜好以文档描述并转换成向量模型，对商品也是这么处理，然后再通过计算商品文档和用户偏好文档的余弦相似度。文本相似度计算在信息检索、数据挖掘、机器翻译、文档复制检测等领域有着广泛的应用。比如舆论控制，我们假设你开发了一个微博网站，并且已经把世界上骂人的句子都已经收录进了数据库，那么当一个用户发微博时会先跟骂人句子的数据库进行比较，如果符合里面...

2019-02-13 17:55:40 312

原创 k-means

在机器学习算法中，聚类算法不同于分类和回归算法需要标注数据训练学习，聚类是无监督学习算法，根据‘物以类聚，人以群分’的思想，将未标注的数据中相似的数据分到同一个簇中。 k-means算法是聚类算法的一种，算法简单、高效，易于理解，所以有着很广泛的应用。按字面意思理解，k：数据聚类为k个簇，means：每个数据簇中的均值作为该簇的中心（质心）。k-means算法...

2019-01-11 20:01:46 363

原创 textRank算法

textRank算法思想基于谷歌的pageRank算法，一种用于文本的基于图的排序算法，用于为文本生成关键字和摘要。pageRank用来计算网页的重要性，整个网络的所有网页可以看作是一张有向图，网页作为节点，如果A网页中存在B网页的链接，那么一条有向边从A节点（网页）指向B节点（网页）。假设形成这样一张图，可以用矩阵来表示这张图的链入链出的关系：（看起来成了马尔可夫转移矩阵...

2019-01-10 19:16:42 816

原创 python二叉树前、中、后序遍历非递归实现

在上篇博客https://blog.csdn.net/tryhardsilently/article/details/86136216中描述了二叉树的构建，深度遍历(前序、中序、后序遍历)的递归实现、层次遍历现在记录前序、中序、后序遍历的实现：# 中序遍历非递归实现：思路：1、从根节点开始遍历左子树，遇到的每个节点入栈，直到左子树遍历完毕 2、栈顶出栈当前节点指向其右子...

2019-01-09 20:31:27 2669

原创二叉树及前、中、后序遍历递归实现，广度遍历实现

概念：树：一种数据结构，由n个节点组成的具有层次关系的集合（n>0,n有穷）树的特点： 1、每个节点有0个或多个子节点； 2、没有父节点的节点称为根节点； 3、每一个非根节点有一个父节点； 4、除了根节点外，每个子节点可以分为多个不相交的子树。 ...

2019-01-09 16:19:28 218

转载 one-hot和tf-idf的理解

one-hot:对每个特征进行普通的数字编码。对于每个特征有多少状态，就用多少状态码来表示，one-hot编码保证每个样本的单个特征只有一位处于状态1，其他都是状态0。对于2、3、4种状态，可以得到以下的表示：所以可以得到sample_1的特征向量为：【0.1.1.0.0.0.1.0.0】 sample_4：【1.0.0.0.0.1.0.0.1】one-hot在文本特征提取上属...

2019-01-08 11:03:33 573

tryhardsilently的博客