自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

枫城雪-----学习空间

记录学习过程

  • 博客(71)
  • 收藏
  • 关注

原创 将某个字符串分几个相等元素个数的子字符串,并将子字符串翻转(2021届校招滴滴笔试编程题)

题目如标题:代码:li_n=list(map(int,input().split()))li = list(input().split())lenght=li_n[0]s=li[0]ss=[]n=0for i in range(1,len(s)+1): if i % lenght ==0: ls=s[n:n+lenght] n=n+lenght S = ls[::-1] ##翻转字符串 ss.append(S)r

2020-09-13 21:27:04 240

原创 22.深度学习——卷积神经网络

1、 深层的神经网络深度学习网络与更常见的单一隐藏层神经网络的区别在于深度,深度学习网络中,每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着神经网络深度增加,节点所能识别的特征也就越来越复杂。2、卷积神经网络2.1、卷积神经网络与简单的单层神经网络的比较卷积神经网路的错误率很低。2.2、卷积神经网络的发展历史2.3、卷积神经网络的结构分析神经网络(neural networks)的基本组成包括输入层、隐藏层、输出层。而卷积神经网络的特点在于隐藏层分为卷积层和池化层(poo

2020-08-10 20:31:45 383

原创 21. 深度学习——感知机和人工神经网络

1、 感知机感知机用来解决分类问题的,线性回归可以解决回归问题。

2020-08-06 15:03:07 715

原创 tensorflow的API——tf.one_hot

tf.one_hot 在求交叉熵是会用到,要对目标值(标签值)进行one_hot编码。相当于将多个数值联合放在一起作为多个相同类型的向量,可用于表示各自的概率分布。比如在求交叉熵的时候:交叉熵公式:yi我们知道是softmax后的结果,也就是某个样本是所有类别的每一个类别的概率,yi’ 是真实的结果,也是一个概率,那应该是多少呢?刚刚说了one_hot相当于将多个数值联合放在一起作为多个相同类型的向量,可用于表示各自的概率分布;因此我计算交叉熵是这样的计算的:如上图,一个手写体识别的例子,手写体一

2020-08-06 10:50:29 189

原创 15. 深度学习——tensorflow实现线性回归和模型的保存、加载

小程序

2020-08-03 11:02:51 327

原创 18. 深度学习——图像的读取(笔记)

1. 图像基本知识像素值就是特征值单通道:每一个像素一个值,叫灰度值在[0~255]之间,三通道,每个像素点3个值。4-D张量是 [样本数,height, width, channels]缩放图片⼤小:减少像素的量;统⼀图⽚的⼤小,去进⾏算法识别。2. 图像基本操作API3.案例狗图片读取1、构造图片文件队列2、构造图片阅读器3、读取图片数据4、处理图片数据代码:import tensorflow as tfimport osmain_path = "F:/文本文件

2020-08-03 09:00:11 1056

原创 17.深度学习——文本文件的读取(笔记)

1. 文件读取的一般流程文件队列构造文件阅读器文件内容解码器批处理前3个步骤都是读取一个样本,第四步读取多个样本。2. 每个步骤需要的API读取数据中也用到线程的操作:3. 文件读取案例各种文本文件,这里使用的是txt文件,其他csv之类的都可以。import tensorflow as tfimport osmain_path = "F:/文本文件数据/"# 导入数据的准备file_name = os.listdir(main_path)print(file_

2020-08-01 20:26:04 488

转载 jupyter notebook中Nbextensions插件功能大全

Nbextensions简介Nbextensions软件包是Jupyter非官方扩展包的集合,可以为Jupyter提供很多实用的功能。这些扩展包大部分为Javascript编写,在运行Jupyter浏览器时被本地加载。文档地址:https://jupyter-contrib-nbextensions.readthedocs.io/en/latest/index.htmlNbextensions扩展包插件的安装方法关闭Jupyter,在命令提示符(cmd)中执行如下命令:pip install

2020-07-31 10:56:44 3835

原创 16. 深度学习——tensorflow队列和线程(笔记)

1、 Tensorflow队列队列的API1、同步操作示例:完成一个出队列、+1、入队列操作代码# 模拟一下同步操作,先处理数据,然后才能取数据训练import tensorflow as tf# 1.首先定义队列Q = tf.FIFOQueue(3, tf.float32)# 放入一些数据enq_many = Q.enqueue_many([[0.1, 0.2, 0.3], ]) # [,]用逗号隔开指定列表,防止与tensor混淆# 2.定义一些处理数据, 取数据的过程

2020-07-30 19:55:31 271

原创 14. 深度学习——Tensorflow基础(笔记)

1、认识Tensorflow1.1 Tensorflow特点2、Tensorflow关闭警告import osos.environ['TF_CPP_MIN_LOG_LEVEL']='2'2.1 图代码import tensorflow as tfimport osos.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'a = tf.constant(3.0)b = tf.constant(2.0)sum = tf.add(a, b)print(

2020-07-30 11:30:20 165

原创 13. 机器学习——非监督学习 K-means (笔记)

非监督学习的特点?物以类聚,人以群分非监督学习(unsupervised learning)的方法主要有 K - meansk-means步骤1、k-means API• sklearn.cluster.KMeans2、Kmeans性能评估指标b_i>>a_i: 趋近于1 效果最好b_i<<a_i:趋近于 趋近于-1,效果不好 ,效果不好轮廓系数的值是介于 [-1,1] ,越趋近于1代表内聚度和分离度都相对较优3、Kmeans性能评估指标API• s

2020-07-30 10:19:02 146

原创 12. 机器学习——分类算法-逻辑回归

• 广告点击率• 是否为垃圾邮件• 是否患病• 金融诈骗• 虚假账号逻辑回归是解决二分类问题的利器逻辑回归可以和朴素贝叶斯一样给出一个样本属于某一类的概率。它是因为激活函数sigmoid逻辑回归:线性回归的式子作为的输⼊入逻辑回归是样本中那个类别少,就判断每一个样本是这个类别的概率,大于阈值0.5,就认为是否则不是这个类别。它的损失函数和优化对数似然损失函数,有点像之前的信息熵的求法。...

2020-07-28 11:03:26 131

原创 11. 机器学习——sklearn 中模型的保存和加载

sklearn模型的保存和加载from sklearn.externals import joblib示例;保存代码from sklearn.datasets import load_bostonfrom sklearn.linear_model import Ridgefrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklear

2020-07-27 11:28:23 711

原创 10. 机器学习——带正则化的岭回归(笔记)

1、过拟合与欠拟合问题:训练数据训练的很好啊,误差也不大,为什么在测试集上面有问题呢?欠拟合:过拟合分析上图1经过训练后,知道了天鹅是有翅膀的,天鹅的嘴巴是长长的。简单的认为有这些特征的都是天鹅。因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。分析上图2机器通过这些图片来学习天鹅的特征,经过训练后,知道了天鹅是有翅膀的,天鹅的嘴巴是长长的弯曲的,天鹅的脖子是长长的有点曲度,天鹅的整个体型像一个"2"且略大于鸭子。这时候机器已经基本能区别天鹅和其他动物了。然后,很不巧已

2020-07-27 11:08:18 357

原创 9. 机器学习——线性回归(笔记)

1、回忆回归问题的判定?房价预测销售额预测贷款额度目标值是一个连续的值,就是回归问题。目标值是一个离散的值,就是分类问题。2、线性回归线性回归:寻找⼀一种能预测的趋势2.1 线性关系模型定义自变量就是特征值,因变量就是目标值矩阵:是⼤多数算法计算基础,接下来介绍矩阵和数组的区别2.2 矩阵和数组数组有很多维数,0维就是一个数值,1维、2维等,矩阵就只是有二维。矩阵的二维和数组的二维有啥区别?主要区别在于数学上的运算,数组有加法、乘法运算,矩阵也有乘法运算,矩阵的乘

2020-07-27 10:12:26 217

原创 8. 机器学习——分类算法-决策树、随机森林(笔记案例)

1、 决策树1.1 认识决策树决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-then结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法。例子:你如何去划分是否能得到贷款?决策树的实际划分1.2 信息的度量和作用猜谁是冠军?假设有32支球队每猜一次给一块钱,告诉我是否猜对了,那么我需要掏多少钱才能知道谁是冠军?我可以把球编上号,从1到32,然后提问:冠 军在1-16号吗?依次询问,只需要五次,就可以知道结果。32支球队,log32=5比特64支球队,log6

2020-07-20 17:27:19 733

原创 7.机器学习——交叉验证和网格搜索(模型的选择与调优)

1.模型的选择与调优交叉验证:为了让被评估的模型更加准确可信1.1 交叉验证过程交叉验证:将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成4份,其中一份作为验证集。然后经过4次(组)的测试,每次都更换不同的验证集。即得到4组模型的结果,取平均值作为最终结果。又称4折交叉验证。1.2 超参数搜索-网格搜索1.3 超参数搜索-网格搜索API代码案例在随机森林部分演示...

2020-07-20 11:34:20 498

原创 6. 机器学习——精确率与召回率(笔记)

1. 分类模型的评估• estimator.score()• 一般最常见使用的是准确率,即预测结果正确的百分比1.1 混淆矩阵上面的不需要记,只要记住精确率和召回率。其中召回率考虑的比较多。1.2 精确率(Precision)与召回率(Recall)其他分类标准,F1-score,反映了模型的稳健型2. 分类模型评估API sklearn.metrics.classification_report代码演示from sklearn.naive_bayes import Multin

2020-07-20 11:23:13 366

原创 5. 机器学习——分类算法-朴素贝叶斯算法(笔记)

1. 常见的例子1.1 垃圾邮件分类1.2 文章分类2. 概率基础简单的一个例子,职业和体型与女神是否喜欢的关系:2.1 联合概率和条件概率可以看到第一问题很简单4/7,第二个问题是求联合概率 p(程序员,匀称) = p(程序员)p(匀称) = 3/7 * 4/7=12/49。第三个问题是条件概率,p(程序员|喜欢) = 2/4 ;第4个问题也是条件概率,P(产品,超重|喜欢) = P(产品|喜欢)P(超重|喜欢) = 1/2*(1/4) = 1/83. 朴素贝叶斯-贝叶斯公式

2020-07-19 19:19:52 234

原创 4. 机器学习——分类算法-k近邻算法

1.KNN的思想通过你的“邻居”来推断出你的类别。比如下面的表格判断最后一部电影是什么类型的,通过计算6部电影与未知电影的距离,从而判断未知电影属于哪一种类型。可以看到第二部电影和未知电影的距离最近,而第二部电影是爱情片,所以未知电影也是爱情片。2.KNN的定义3. 计算距离公式4.sklearn k-近邻算法API5.KNN案例...

2020-07-17 20:56:13 113

原创 3. 机器学习——sklearn数据集划分与转换器、估计器

一、数据集划分机器学习一般的数据集会划分为两个部分:训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效1.sklearn数据集划分APIsklearn.model_selection.train_test_splitscikit-learn数据集API介绍from sklearn.datasets import load_irisli = load_iris()print('获取特征值')print(li.data)print('获取目标值')pr

2020-07-15 21:35:38 228

原创 2. 机器学习——数据的特征预处理(笔记)

1. 特征处理是什么       通过特定的统计方法(数学方法)将数据转换成算法要求的数据。这里主要说数值型数据的预处理。2. 归一化为什么需要归一化比如上面的案例,三个特征同等重要,当一组特征里面的数据很大,而另一组特征数据很小时,比如在K最近邻算法中通过距离,来判断某个数据属于那一类,(72993-35948)^2 + (10.14-6.8)2+(1.0-1.21)2可以看到,数据大的占的比重大会对结果造成很大的影响。

2020-06-12 22:03:14 208

原创 1. 机器学习——概述、数据的特征抽取(笔记)

1.人工智能、机器学习、深度学习的关系机器学习可以做什么。学习的书籍推荐学习目标2. 什么是机器学习机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测。从历史数据当中获得规律?这些历史数据是怎么的格式?3. 数据集的结构1. 可用的数据集2. 数据集结构特征值就是房子的面积、位置、楼层、朝向;目标值就是房价。数据中对于特征处理两个包:1.pandas:一个数据读取非常方便以及基本的处理格式的工具;2.sklearn:对于特征的处理提供了强大的接口

2020-06-12 11:40:18 683

原创 5. 数据库与Linux——Ubuntu更换镜像源(笔记)

更新Ubuntu软件下载地址1.寻找国内镜像源       所谓的镜像源:可以理解为提供下载软件的地方,比如Android手机上可以下载软件的91手机助手;iOS手机上可以下载软件的AppStore       有清华源、中科大、阿里、网易等。这里添加清华源。清华源网址清华源2. 备份Ubuntu默认的源地址sudo cp /etc/apt/source

2020-06-06 09:10:49 109

原创 4. 数据库与Linux——Linux的常用命令(笔记二)

输出重定向命令:>       Linux允许将命令执行结果重定向到一个文件,本应显示在终端上的内容保存到指定文件中。

2020-06-05 21:31:45 221

原创 Ubuntu安装vim自动补全工具pydiction

2020-06-05 11:29:08 356

原创 Ubuntu更改默认python

sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 100 sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150

2020-06-05 11:25:51 105

原创 3. 数据库与Linux——Linux的常用命令(笔记一)

基本命令查看文件信息:ls       ls是英文单词list的简写,其功能为列出目录的内容,是用户最常用的命令之一,它类似于DOS下的dir命令。       Linux文件或者目录名称最长可以有265个字符,“.”代表当前目录,“…”代表上一级目录,以“.”开头的文件为隐藏文件,需要用 -a 参数才能显示。ls常用选项:如:ls -l -h -a

2020-06-02 21:13:17 358 1

原创 2. 数据库与Linux——常用Linux命令的基本使用(笔记)

学习 Linux 终端命令的原因常用 Linux 命令的基本使用自动补全在敲出 文件/目录/命令 的前几个字母之后,按下 tab 键如果输入的没有歧义,系统会自动补全如果还存在其他 文件/目录/命令,再按一下 tab 键,系统会提示可能存在的命令终端命令格式command [-options] [parameter]在ubuntu和其他linux系统中,命令是第一个,后面的选项和参数谁前谁后都可以,在mac中需要安装、选项在前参数在后的这种格式。查阅命令帮助信息(知道)有两

2020-06-02 20:02:03 163

原创 1.数据库与Linux——文件和目录(笔记)

Windows 和 Linux 文件系统区别1. Windows 下的文件系统       在 Windows 下,打开 “计算机”,我们看到的是一个个的驱动器盘符,如图所示每个驱动器都有自己的根目录结构,这样形成了多个树并列的情形,如图所示:也就是说在window里面是一个硬盘分区了,弄成很多盘符的,比如我们常说的C盘、D盘之类的。2.Linux 下的文件系统     &n

2020-06-02 17:55:27 215

原创 24.数据结构——二叉树的遍历(笔记)

二叉树的遍历       树的遍历是树的一种重要的运算。所谓遍历是指对树中所有结点的信息的访问,即依次对树中每个结点访问一次且仅访问一次,我们把这种对所有节点的访问称为遍历(traversal)。那么树的两种重要的遍历模式是深度优先遍历和广度优先遍历,深度优先一般用递归,广度优先一般用队列。一般情况下能用递归实现的算法大部分也能用堆栈来实现。深度优先遍历      &nbs

2020-05-31 21:31:20 232

转载 23.数据结构——二叉树添加节点和广度优先遍历的实现(笔记)

二叉树的节点表示以及树的创建       通过使用Node类中定义三个属性,分别为item本身的值,还有lchild左孩子和rchild右孩子class Node(object): """节点类""" def __init__(self,item): self.item = item self.lchild = None self.rchild = None树的创建,

2020-05-30 17:35:58 212

原创 22.数据结构——二叉树概念及性质(笔记)

二叉树的基本概念       二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree)二叉树的性质(特性)性质1: 在二叉树的第i层上至多有2^(i-1)个结点(i>0)性质2: 深度为k的二叉树至多有2^k - 1个结点(k>0)性质3: 对于任意一棵二叉树,如果其叶结点数为N0,而度数为2的结点总数为N2,则N0=N2+1;性质4:具

2020-05-30 16:23:25 223

原创 21.数据结构——树的认识及概念(笔记)

树的概念       树(英语:tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点:每个节点有零个或多个子节点;没有父节点的节点称为根节点;每一个非根节点有且只有一个父节点;除了根节点外,每个子节点可以分为多个不相

2020-05-30 15:16:08 185

原创 20.数据结构——二分法查找(笔记)

什么是搜索算法       搜索是在一个项目集合中找到一个特定项目的算法过程。搜索通常的答案是真的或假的,因为该项目是否存在。 搜索的几种常见方法:顺序查找、二分法查找、二叉树查找、哈希查找。二分法查找       二分查找又称折半查找,优点是比较次数少,查找速度快,平均性能好;其缺点是要求待查表为有序表,且插入删除困难。因此,折半查找方法适用于不经常变动而查找频

2020-05-30 10:02:34 930

原创 18.数据结构——快速排序(笔记)

快速排序       快速排序(英语:Quicksort),又称划分交换排序(partition-exchange sort),通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。...

2020-05-29 21:30:14 242

原创 19.数据结构——归并排序(笔记)

归并排序       归并排序是采用分治法的一个非常典型的应用。归并排序的思想就是先递归分解数组,再合并数组。       将数组分解最小之后,然后合并两个有序数组,基本思路是比较两个数组的最前面的数,谁小就先取谁,取了后相应的指针就往后移一位。然后再比较,直至一个数组为空,最后把另一个数组的剩余部分复制过来即可。    &

2020-05-29 16:09:08 144

原创 17.数据结构——希尔排序(笔记)

希尔排序       希尔排序(Shell Sort)是插入排序的一种。也称缩小增量排序,是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。该方法因DL.Shell于1959年提出而得名。 希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。希尔排序过程    &n

2020-05-26 22:10:11 176

原创 15.数据结构——选择排序(笔记)

选择排序       选择排序(Selection sort)是一种简单直观的排序算法。它的工作原理如下。首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。       选择排序的主要优点与数据移动有关。如果某个元素位于正确的最终位置上,则它不

2020-05-26 10:23:22 333

原创 16.数据结构——插入排序(笔记)

插入排序       插入排序(英语:Insertion Sort)是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。       相对于选择排序,插入排序不会遍历整个未排序的部分,只是从里面拿出一

2020-05-22 11:42:08 272

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除