weixin_45955767-CSDN博客

原创通俗易懂tf.split

输入参数方式1是输入参数方式2的特殊形式,输入方式1是一种等权重的切割，输入方式2是一种不等权重的切割。输入[50,40,30],num_or_size_splits=[10,15,25],axis=0。输入 [50,40,30],num_or_size_splits=2,axis=0。输出[10,40,30],[15,40,30],[25,40,30]输入参数方式1：待分割的向量，切割后子向量的数量，被切割的维度。输入参数方式2：待分割的向量，切割后子向量的分量，被切割的维度。

2022-11-26 14:10:48 189 1

原创 matlabplotlib显示中文

matlabplotlib显示中文

2022-10-02 20:53:53 641

原创特征工程面试题

进行特征工程的第一步是对数值类型进行理解类别字段的特征工程缺失值填充使用出现次数最多的字段值进行填充#独热编码pd.get_dummier(数据的dataframe,columns=['列名'])#自然数编码 label encoder sklearn版from sklearn.preprocessing import LabelEncoderle = LabelEncoder()df['新列名'] =le.fit_transform(df['用来labelenco

2022-03-02 22:51:39 284

原创视觉transformer面试题：vit

输入端适配通过patch0与每个patch计算value来整合信息最后分类因为transformer的输入输出维度是一致的，transformer block的任何一个输出无法进行很好的分类为什么不使用输出patch相加求平均？patch 可能是1616的数量,然后哪怕256256的大小，输出向量也无法接受位置编码图像切分重排后丢失位置信息，并且transformer计算无需位置信息结果分析attention的距离等价于Conv中的感受野大小可以看到越深的层数，att..

2022-03-01 21:20:04 1062

原创 kaggle实战：海星赛复盘

赛题背景：本次比赛的目标是通过建立一个在珊瑚礁水下视频上训练的物体检测模型，实时准确地识别海星。比赛方案：工具库：mmdetection,yolov5开源代码链接：the framework of ensemble | Kaggle比赛最终的方案是fasterrcnn和yolov5通过wbf模型融合定义模型config_file = f'../input/fastrcnn2000/faster_rcnn_cbv2d1_r50_fpn_1x_coco.py'checkpoint

2022-02-25 21:31:49 2998

原创 cs224n名词解释

objective function 目标函数= loss function 损失函数One-hot representation稀疏表达Distributed representation 分布式表示/稠密表达（Word）embedding（词）嵌入Bag of words BOW词袋Word vector词向量Word context词的上下文Word analogy词的类比...

2022-02-22 19:27:13 72

原创 CS224n 核心知识和面试题

自然语言处理问什么这么难？一词多义上下文相关不守语法随着时间变化表达的意义信息量很大隐含常识深度学习相对传统机器学习的优势在哪里用树模型计算词的相似度word_to_vec学到的是什么？上下文的关系word_to_vec压缩自编码是什么意思？从输入层到隐藏层向量维度减少所以是压缩从输入层到输出层向量维度不变所以是编码CBOW的原理...

2022-02-22 19:26:29 2617

原创目标检测底层实现

VOC转yolodef voc2yolo(bboxes, image_height=720, image_width=1280): """ voc => [x1, y1, x2, y1] yolo => [xmid, ymid, w, h] (normalized) """ bboxes = bboxes.copy().astype(float) # otherwise all value will be 0 as voc_pascal

2022-02-12 09:36:01 1289

原创目标检测面试项目：yolov5逐行注释

1网络配置文件类型：yaml，yolov5*.yaml文件通过yolo.py解析文件配置模型的网络结构。yaml文件的优点方便，不需要像Yolov3的config设置网络一样设置网络进行叠加，只需要在yaml配置文件中的参数进行修改以yolov5s.yaml为例子1模型的深度和宽度s—m—l—x# parametersnc:80 #num_classesdepth_mumultiple:0.33 #模型的深度，控制模块的数量model depth multip

2022-02-03 12:33:38 5495 2

原创计算机视觉与模式识别速成

模式识别的基本定义分类：输出量是离散的类别表达，即输出待识别模式所属的类别回归：输出量是连续的信号表达（回归值），输出量维度：单个/多个维度模式识别：根据已有知识的表达，针对待识别模式，判别决策其所属的类别或者预测其对应的回归分类(Classificat(特征提取(feature extraction)：从原始输入数据提取更有效的信息回归器(regressor)：将特征映射到回归值判别函数：使用一些特定的非线性函数来实现，记作函数g 。由于..

2021-12-23 17:23:19 4793

转载操作系统面试题：磁盘组织与管理

2021-12-12 12:07:16 78

原创计算机视觉面试题：SIFT专题

什么是高斯模糊？高斯模糊算法 - 知乎传统的模糊算法有很多种，其中一种是高斯模糊（Gaussian Blur），它将正态分布（即高斯分布）用于图像处理。原理所谓“模糊”的原理，可以理解为，每个像素，都取周围像素的平均值。对于下面这张图片模糊后的…https://zhuanlan.zhihu.com/p/437052556什么是SIFT？尺度不变特征变化，提取图像局部特征的常用方法什么是高斯金字塔？一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低，且来源于同一张原始图的图像

2021-12-08 23:21:37 382

原创 opencv面试题

数字图像的概念和起源常见的成像方式图像直方图有什么用？图像二值化含义：纵轴是像素的个数，左到右是黑色到白色图像平移图像缩放：图像缩放必然会涉及图像插值最近邻插值：如何计算插值点？就是把像素块当作点建系，找最近的整数点最近邻法不需要计算只需要寻找原图中对应的点，所以最近邻法速度最快，但是会破坏原图像中像素的渐变关系，原图像中的像素点的值是渐变的，但是在新图像中局部破坏了这种渐变关系。单...

2021-12-08 05:29:22 1018

原创深度学习面试题：计算机视觉训练技巧

CosineAnnealingLR:模型受学习率影响大的模型测试集数据增广：基本对结果有0.5%-1%的影响注意：训练集用了哪些数据扩增方法，测试集才可以用对应的数据扩增方法soft label 与 pseudo label如何利用soft label进行模型蒸馏？用小模型学习大模型输出的分布是利用模型对测试集进行预测（打标），并将打标后的数据加入训练集进行训练伪标签适用的条件是模型精度比较高，且是深度学习用的比较多...

2021-12-07 01:56:41 1798

转载计算机视觉面试题：图像检索专题

从20世纪70年代开始，有关图像检索的研究就已开始，具体方向包括基于文本的图像检索技术（Text-based Image Retrieval，TBIR）和基于内容的图像检索（Content-based Image Retrieval，CBIR）。其中TBIR利用文本描述的方式描述图像的特征，如绘画作品的作者、年代、流派、尺寸等来检索图像，CBIR利用图像的颜色、纹理、布局等进行内容分析来检索图像。电商图像具备的时尚元素，主要可以按照类别进行划分在电商平台（淘宝、京东、拼多多）拥有海量的商品图像信息，如

2021-12-06 23:51:05 255

原创聚类相关的面试题

聚类和分类的不同？输入维度的不同：分类同时展示向量的位置和标签信息，聚类只展示位置信息输出维度不同：分类需要找到超平面对不同类进行分类，聚类不需要对类别标签进行预测...

2021-12-05 05:21:19 790

原创机器学习数学基础

为什么机器学习需要线性代数？因为机器学习本质是优化问题，优化问题需要矩阵计算什么是NPhard问题？算法复杂度是指数增长，无法穷举所有可能的问题向量可以表示文本向量可以表示图片SVD奇异值分解：用于图像压缩用向量表示时间序列线性生成空间向量的所有线性组合的集合称为向量的线性生成空间空间维度空间维度是基的数量决定的 ...

2021-12-04 14:59:43 521

原创计算机视觉面试题

图像分类存在的挑战？图像特征的分类？全局特征和局部特征什么时候用全局特征？什么时候用局部特征？分类任务（对图像进行分类，对像素点进行分类）使用cnn提取特征版权检索，相同图像检索使用局部特征匹配相似点或者对局部特征编码后计算相似度什么时候用特征聚合？怎么做特征聚合？对特征库的图片进行统计，就像词袋模型特征聚合中池化的作用是什么？对特征进行降维；剔除了位置关系在图像检索中，推荐最大池化还是平均池化？最大池化，图像检索关注突出的信息Gem-pooling...

2021-12-04 04:54:12 2528

原创目标检测面试题

目标检测任务及发展脉络图像处理有三大任务：物体识别，目标检测，图像分割目标检测：给定一张图像，判断图像中是否存在指定类别的目标，若存在，则输出目标的位置，类别，置信度。包括目标的分类和目标位置的确定双阶段算法和单阶段算法双阶段（two-stage）：第一级网络用于候选区域提取；第二级网络对提取的候选区域进行分类和精确坐标回归，例如RCNN系列.单阶段（one-stage）：掘弃了候选区域提取这一步骤，只用一级网络就完成了分类和回归两个任务例如YOLO和SSD等.单阶段网络的准确度.

2021-12-04 04:26:12 598

原创凸优化面试题：凸集凸函数凸优化

为什么研究凸优化先要从凸集的性质开始：凸函数图像的上方区域，一定是凸集；假如一个函数上方是凸集，这个函数就是凸函数如何用向量表示几何体什么是凸包包含凸集的最小集合凸集基本概念凸集保凸运算凸函数图像的上方区域，一定是凸集；假如一个函数上方是凸集，这个函数就是凸函数分割超平面支撑超平面...

2021-12-04 01:00:14 907

原创支持向量机设计思想和相关面试题

支持向量机从idea到优化方法的全流程支持向量机的key idea? key idea1: 待分类点在决策边界法向量上的投影大于决策边界到原点的距离，则是正样本 key idea2: 如何求支持向量的间隔选取一个正样本X+ 一个负样本X- 求X+ - X-在决策边界法向量上的投影长度 key idea3 如何最大化支持向量的间隔？ ...

2021-12-02 08:46:46 464

原创 20h六级通关

单词的组成形近字汇总premise n.前提条件 ——> precondition n.前提条件——>conditional a. 有条件的promise v/n 承诺——>promising a.有希望的addict ——>indicate——>contradict——>predictaddict sb be addicted to sth to是介词 sth是坏事使沉溺于使上瘾contr...

2021-11-26 13:06:16 2565

原创操作系统面试题：设备管理

管理什么设备？除cpu,内存外的所有设备

2021-11-25 23:31:25 4222 1

原创操作系统面试题：文件

文件系统：也是一种操作系统，也是一种文件文件:信息在电脑里的储存形式，和数据库一样现在都是流式存储用户直接打开看不懂但是程序可以直接可视化文件属性存放在哪里？目录文件里操作系统如何解决文件储存的问题？依旧是逻辑结构和物理结构文件的物理结构是在硬盘上？还是内存上？还是缓存上？还是都是？合理的物理结构的目的是什么？缩短I/O时间？连续文件，索引文件，串联文件是什么？都是文件的物理结构？连续存放的文件物理结构，索引存放的文件物理结构，串联存放的文件物理结构连续文件的连续是什么..

2021-11-25 19:21:36 683

转载李沐深度学习论文解读 alexnet 笔记

李沐b站视频链接9年后重读深度学习奠基作之一：AlexNet【论文精读】_哔哩哔哩_bilibili-https://www.bilibili.com/video/BV1ih411J7Kz?spm_id_from=333.999.0.0主要记录行业大专家如何看待细分领域，跨领域工作的1.alexnet 论文只是说明了效果很好但是没有说明为什么效果好，以及在什么地方效果好2.计算机视觉对刷榜很在意，所以对.alexnet 没有理论上的偏见3.alexnet的摘要更像技术报告，很少有论文写

2021-11-25 18:09:45 257

原创计算机视觉的基本面试题

1.描述图像大小，通道数？长：331 宽：500 通道数：32.img[:,:,0]的含义0，1，2表示图像的RGB通道3.如图的iread设置参数0的含义？就是读取灰度图像4.如何让该图片颜色显示正常？设置cv2.COLOR_BGR2RGB5.如下代码的效果# 相似变换 import cv2def rotate(img_ori, aug_value, scale): ''' img_ori: 图像 aug_value:旋转角..

2021-11-23 20:29:28 2205

原创算法设计与分析速成

1.递归方程的求解迭代展开：迭代展开递归方程注意：每一项内的值不能出现负数或0 比如T（n-1）则 n >=1 i则 <=n-1换元迭代：递归树表示：迭代展开的可视化表示假设归纳：先假设，数学归纳法高阶方程的简化：转化为一阶方程主定理：特殊递归方程的解...

2021-11-22 03:02:30 6905 1

原创算法设计与分析常见思路和模板

计算时间复杂度的必备技能1.判断循环什么时候结束2.观察函数被调用了多少次（适用于递归，动态规划问题）while i < n: i=i*2while i < n: i=i+i实在不行举个例子，i=1,2,4,8,2^m用空间换时间缓存就是用空间换时间发现排序问题类内有序1.用于计数问题根据类别制作容器利用常见数据结构的特性单链表的特性原理 1.只能找到下一个元素，不能找到上一个元素...

2021-11-08 08:53:36 632

原创机器学习面试题

统计学习什么是统计学习？基于数据构建模型，再利用模型分类回归的方法一般分为监督学习，无监督学习，强化学习，半监督学习什么是统计学习方法的三要素？模型，策略，算法什么是模型？条件概率分布形式，决策函数形式什么是假设空间？备选模型的集合什么是策略？选择模型的准则对于分类问题，用0，1损失函数对于...

2021-11-06 19:59:06 78

原创自然语言处理面试题

tfidftf是啥？词频idf是啥？逆词频max_df 选择词频的上界min_df 选择词频的下界max_features 选择的最大特征数利用sklearn tfidf实例导包from sklearn.feature_extraction.text import TfidfVectorizer实例化word_vec = TfidfVectorizer(analyzer='word', ngram_range=(1,2),#(...

2021-11-06 18:00:11 310

原创经典机器学习算法的数学推导

线性回归为什么叫h(x)为什么用θ表示参数θ是向量还是矩阵？为什么用x表示特征为什么X是一个来表示的向量为什么在表格添加一列1 ?便于矩阵计算为什么用表示误差？K-means基础概念：1.要得到簇的个数，需要指定K值2.质心：均值，即向量各维取平均即可3.距离的度量：常用欧几里得距离和余弦相似度（先标准化）4.优化目标：就是每个簇内每个样本点到簇中心的距离之和最小必须记住的表示方法1.用求和形式表示多项式，偏置项合并到关于θ的向量...

2021-11-05 20:57:53 3034 1

原创 pytorch必备技能

1.模型的序列化反序列化（没啥用但是基础的前置知识）torch.save(什么都可以,文件的路径) 保存整个模型:torch.save(model，模型路径) 加载整个模型 torch.load(保存模型的路径) 保存模型参数: state_dict = model.state_dict() torch.save(state_dict,模型路径)torch.load(文件的...

2021-11-02 23:15:00 166

原创图神经网络

1.metapath2vc能否和SDNE一样学到图的二阶相似度？邻居汇聚的思想nodes aggregate information from their neighbors using neural networksnode2vec摘要核心1，强调之前的基于特征工程的工作的缺点，从而引出node2vec并能探索邻域的多样性2，通过biased random walk算法提出可调的搜索策略，生成不同语义的节点序列信息3，讨论算法的高效性、鲁棒性，从案例分析和大量实验论文..

2021-10-26 11:08:08 160

原创深度学习面试题

1.如何选择，如何判断依据解1：模型2的泛化性更好（奥卡姆剃刀原则，simple is better）解2：每个模型都是一个系统，我们更希望系统不受噪音的影响，右边的系统更加稳定

2021-10-24 07:49:12 1088

原创 gan 5小时速成

1.数字图像：有什么用：最早海底电缆传输图像，数字图像可以加快传输是什么：用矩阵表示图像怎么形成数字图像：物体发送电磁波被设备接收形成数字图像例子：x射线成像人体密度高的地方（骨头）对x射线吸收多吸收的能量多，就发白人体密度低的地方，x射线直接穿透，就发黑 ...

2021-10-22 15:27:28 4460

原创手把手从0开始图像分类实战（持续更新）

pipeline1）尝试读取少量图片，检查图像格式，并且进行可视化，对数据做个大概了解；2）划分数据集（训练集、验证集、测试集），并且分别统计下各项指标：图像分辨率、均值、方差等，可以了解到它们之间的数据分布是否接近：224，32 imagenet3）实现数据读取1尝试单张与批次读取，以测试是否有bug：4）搭建模型：5）实现损失函数；6）选择优化算法、学习率更新策略（虽然大部分框架已有很方便的接口，但实际任务时仍有较大可能需要自定义实现7）编写训练pipepline：调用模型的前向...

2021-10-19 09:54:12 563

原创 tensorflow2快速入门最干教程

.1.argmax 用于计算损失函数，用于计算准确率tf.argmax(x,1) 按行返回矩阵x最大值的索引2.tf.equal 和cast配合用于计算准确率匹配函数内两个式子的结果是否相等，相等则返回true3.tf.cast将bool值转化为浮点数，和eual用于计算准确率tf.cast(x,"float") x=true 返回 1；x=false 返回04.tf.placeholder() 先占位，后初始化（tf.Variable()）传入数据类型，数据的维...

2021-10-16 16:37:18 620

原创神经网络高频面试题

序列数据：数据前后不独立语言模型：是nlp的重要技术，把文本看成时间步 W1，W2,……，WT门控循环单元：循环神经网络： hidden state:记录历史信息循环指的是循环使用权重矩阵Whh,Whq,Wxh 反正用的都是这三个权重矩阵，参数大的数量不随时间步增加而增加激活函数用的Tanh:将输出域限制在(-1,1)，均值为0 Whh会导致梯度消失或者梯度爆炸...

2021-09-24 08:37:23 1023

原创线性代数的几何意义

1.线性代数的含义线性映射和矩阵是对应的，线性映射=线性变换（向量的伸缩旋转）=满足齐次性和叠加性线性映射的直观解释：向量映射为向量，线段映射为线段，平行四边形映射为平行四边形。为什么这条规则成立：线段映射成线段就是向量数乘的不变性2.向量——>向量集合——>向量空间（线性空间）——>物体向量集合如何构成向量空间：集合是无序无结构，空间是有序的线性空间：一种定义了加法和数乘的向量空间，这个空间里的向量，通过向量加法和向量数乘两个运...

2021-09-23 13:39:09 926

原创操作系统概念6小时速成QA版速记

1.操作系统（Operating System，Os）是指控制和管理整个计算机系统的硬件和软件资源，并合理地组织调度计算机的工作和资源的分配：以提供给用户和其他软件方便的接口和环境：它是计算机系统中最基本的系统软件。处理机管理：用哪个cpu处理？设备管理：键盘，显示器给哪个进程使用？存储器管理：把程序相关的数据放入内存2.操作系统的功能：向上层提供方便易用的服务和对硬件机器的拓展3.GUI：图形化用户接口4.交互式命令接口：脱机命令接口：批处理命令接口5....

2021-09-21 14:25:25 526

cs231n任务1knn.ipynb

空空如也