自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 收藏
  • 关注

原创 A Lip Sync Expert Is All You Need for Speech to Lip Generation In the Wild(论文阅读)

现有方法局限现有方法在静态图像或视频上进行嘴唇同步有很好的性能,但对于动态的说话不受约束的人脸视频仍然难以很好的嘴唇同步。本文方法通过学习一个强大的唇部同步鉴别器来解决这些问题。接着,提出了新的严格评估基准和指标,以准确衡量不受限制视频中的唇部同步。通过在我们具有挑战性的基准上的广泛定量评估,结果表明,Wav2Lip模型生成的视频的唇部同步精度几乎与真实同步视频一样好。

2024-04-09 20:13:44 780

原创 Python基础语法

从某个模块中导入多个函数,格式为: from somemodule import firstfunc, secondfunc, thirdfunc。像if、while、def和class这样的复合语句,首行以关键字开始,以冒号( : )结束,该行之后的一行或多行代码构成代码组。将某个模块中的全部函数导入,格式为: from somemodule import *缩进的空格数是可变的,但是同一个代码块的语句必须包含相同的缩进空格数。Python 可以在同一行中使用多条语句,语句之间使用分号;

2024-03-16 22:35:18 830

原创 论文阅读:Dataset Quantization

基于上述观察和分析,我们提出了数据集量化(DQ),这是一种量化大规模数据集以进行无损训练的新框架,其中考虑了数据效率、可扩展性和计算成本。在本文中,我们首先通过最大化子模块增益将数据集划分为几个不重叠的 bin。如图3,给定一个数据集 D,使用预定义大小 K 的 bin 从 D 递归采样小信息集 bin,产生一组小 binS1SnSNS1​...Sn​...SN​其中 N = M/K。每个binSnxjnyjnj1K⊂DSn​xjn。

2024-03-06 22:06:22 924

原创 论文阅读:Myriad: Large Multimodal Model by Applying Vision Experts for Industrial Anomaly Detection

动机:现有的工业异常检测(IAD)方法预测异常检测和定位的异常分数。然而,他们很难对异常区域(例如工业异常的颜色、形状和类别)执行多轮对话和详细描述。多模态大模型的能力:在多模态视觉任务上有卓越的能力,比如image captioning,visual understanding,visual reasoning。大模型局限:现有的一般LMM中不存在关于异常检测的知识,而训练特定的LMM进行异常检测需要大量的注释数据和大量的计算资源。

2024-03-03 13:45:54 1091

原创 VL-Match: Enhancing Vision-Language Pretraining with Token-Level and Instance-Level Matching论文阅读

在本文中,我们提出了 VL-Match,这是一种生成器判别器框架,它通过token level和instance level匹配来增强视觉语言预训练。在token level,我们为多模态编码器提出了Vision-Language Replaced Token Detection任务,该任务引入了更多的语言先验知识,并涉及更多的文本token来匹配图像,提高了匹配效率。

2023-10-29 11:04:41 135

原创 深度学习入门——神经网络

神经网络是一种受到人脑神经系统启发的机器学习模型。它由一系列相互连接的人工神经元组成,这些神经元以层次结构排列。每个神经元接收来自上一层神经元的输入,并根据权重和激活函数对输入进行加权处理,然后将输出传递给下一层神经元。如下图是一个简单的神经网络,最左边的一列称为输入层,最右边的一列称为输出层,中间的一列称为中间层。上述说到根据权重和激活函数对输入进行加权处理,这个过程可以描述成感知机实现的过程。

2023-06-14 23:04:52 1453

原创 深度学习入门——神经网络的学习

神经网络的特征就是可以从数据中学习。所谓“从数据中学习”,是指可以由数据自动决定权重参数的值。在实际的神经网络中,参数的数量成千上万,在层数更深的深度学习中,参数的数量甚至可以上亿,想要人工决定这些参数的值是不可能的。在神经网络中,机器可以学习图像中的重要特征量,神经网络的优点是对所有的问题都可以用同样的流程来解决。

2023-06-14 23:03:30 662

原创 Matplotlib学习

在深度学习的实验中,图形的绘制和数据的可视化非常重要。Matplotlib是用于绘制图形的库,使用Matplotlib可以轻松地绘制图形和实现数据的可视化。这里,我们来介绍一下图形的绘制方法和图像的显示方法。

2023-06-14 23:02:42 754

原创 深度学习入门——感知机

感知机接收多个输入信号,输出一个信号。这里所说的“信号”可以想象成电流或河流那样具备“流动性”的东西。像电流流过导线,向前方输送电子一样,感知机的信号也会形成流,向前方输送信息。但是,和实际的电流不同的是,感知机的信号只有“流/不流”(1/0)两种取值。如下图是是一个接收两个输入信号的感知机的例子。x1、x2是输入信号,y是输出信号,w1、w2是权重(w是weight的首字母)。图中的○称为“神经元”或者“节点”。输入信号被送往神经元时,会被分别乘以固定的权重(w1x1、w2x2)。

2023-06-14 23:02:08 569

原创 数据结构学习之——线性表

定义:线性表的顺序存储又称顺序表。它是用一组地址连续的存储单元依次存储线性表中的数据元素,从而使得逻辑上相邻的两个元素在物理位置上也相邻。位序:第1个元素存储在线性表的起始位置,第i个元素的存储位置后面紧接着存储的是第i+1个元素,称i为元素aia_{i}ai​在线性表中的位序。因此,顺序表的特点是表中元素的逻辑顺序与其物理顺序相同。

2023-05-25 21:54:20 4146

原创 数据分析实用python程序

【代码】数据分析实用python程序。

2023-04-26 21:39:07 88

原创 华东师范大学计算机学硕2023考研经验贴

决定二战后,我选择考学硕,吸取了去年英语卡线的教训,我二战最终选择了华东师范大学,因为没有单科线,这也是一个无比正确的选择,由于考试带病在阳性考场考试,今年的初试政治英语考得很差,英语分数38分,正好踩着在国家线,政治56,数学131,专业课126,总分351,初试排名第17,因为2022年的录取最低分358,我也以为今年也无缘上岸了,边找工作边准备复试,然而今年分数线降了十几分,幸运女神拉了我一把,最后复试超常发挥,复试成绩第5,总成绩第6。对于大题,直接是在最后三周背肖四,最后我一战政治成绩考了72。

2023-04-24 18:42:14 3956 24

原创 华为技术面

青蛙跳台阶i

2023-04-12 22:28:52 969

原创 D. A Wide, Wide Graph

首先找到最长的直径,即距离最长的两个点,然后通过深度优先遍历,得到每个节点到这两个点的距离,取其中较长的距离,然后对距离进行排序,再计算k从1到n的组成成分,当为1的时候只有一份,随着k的增大,到两个端点的最大距离小于k的点就需要分离,每一个点分离,组成成分就增加1,以此计算出所有的组成成分。

2023-04-03 19:08:51 144

原创 开心消消乐

个与右端点颜色相同的点的情况下所能得到的最优解。

2023-03-22 17:10:37 441

原创 华为OD机试经验(A 卷 2022Q4)

第一二题很简单,理清楚逻辑就没问题,第三题我通过了80%,最后20%的问题是堆栈爆了,求大佬指教指教(总分360)

2023-03-17 20:15:53 2203 3

原创 C++中stack用法详解

stack是一种先进后出(First In Last Out,FILO)的数据结构。它只有一个出口,形式如图4-18所示。stack 允许新增元素、移除元素、取得最顶端元素。但除了最顶端外,没有任何其它方法可以存取stack 的其它元素。换言之,stack不允许有遍历行为。

2023-02-27 15:20:14 253

原创 C++中set和map的用法详解

set使用红黑树实现,set的特性是,所有元素都会根据键值自动被排序,set元素的键值就是实值,实值就是键值,set不允许两个元素有相同的键值。不可以通过set的迭代器改变set的元素,因为set的元素值就是键值,关系到set的排列规则。如果随意破坏set的元素值,会严重破坏set的组织。std::unordered_set< key >是一种STL提供的无序集合的类,集合的特点就是其中没有任何重复的元素,这个特点非常适合用于纪录某个数据中是否有重复的数据,并且将其挑出来。

2023-02-23 11:58:57 1206

原创 Python入门实践(四)——操作列表

遍历列表的所有元素,对每个元素执行相同的操作。在for循环后面想要包含多少行都行,在for语句后面,每个缩进的代码行都是循环的一部分。通过对比这里的两个for循环的输出结果,可知道第一个for循环的循环体包括打印“循环”,第二个不包括。

2023-01-20 22:03:20 527

原创 Python入门实践(三)——列表

列表是有序集合,因此要访问列表的任何元素,只需将该元素的位置或索引告诉Python即可。要访问列表元素,可指出列表的名称,再指出元素的索引,并将其放在方括号内。方法pop()可以删除列表末尾的元素,并让你能够接着使用它,pop()也可以删除任意位置的元素,只要提供索引就可以了。首先定义一个省份列表,第一个元素为“hunan”,接下来将其改为“tianjin”,输出表明,第一个元素值变了,其他列表元素未变。要修改列表元素,可指定列表名和要修改的元素的索引,再指定该元素的新值。输出结果为倒数第二个元素,即。

2023-01-19 02:20:56 762

原创 Python入门实践(一)——搭建环境

python环境搭建

2023-01-16 00:00:00 68

原创 Python入门实践(二)——变量的使用

变量是对一种数据结构的命名,以方便访问,如下message就是变量,存储的值为文本“hello world”。

2023-01-16 00:00:00 944

原创 C++中vector的用法详解

文章目录构造函数增加函数删除函数遍历函数判断函数构造函数 //vector(): 创建一个空vector vector<int> v1 = vector<int>(); //v1 = [] //vector(int nSize): 创建一个vector,元素个数为nSiz

2022-04-28 23:30:59 14048 4

原创 常用学习网站

常用学习网站算法刷题力扣洛谷牛客视觉比赛kaggle天池代码仓库GitHub学习视频哔哩哔哩慕课学习书籍动手学深度学习TensorFlow版动手学深度学习pytorch版学习网站TensorFlow教程官方手册MATLABTensorFlowpytorch中文教程python文献搜索知网my librarybook......

2022-04-07 22:29:06 2014

原创 机器学习--绪论(一)

文章目录1、介绍2、基本术语1、介绍机器学习是一门怎样的学科呢?许多人会好奇,机器学习如何完成现实生活中的任务吧,我就介绍介绍我的理解,由于计算机的快速计算的能力,人们期望计算机能够完成一些简单而繁多的工作,这些工作对于人来说会很简单,但对于计算机确不是容易的事,而计算机的优势在于能够快速的完成大量的任务,比如判断一个水果是好的还是坏的,人只要拿在手上看一圈就可以判断出来,但要人判断成千上万的水果是好是坏,那就需要很多时

2022-04-07 17:32:05 1077

原创 数据集tf.data.Dataest的使用

z

2020-10-08 17:54:38 763 1

原创 Git从远程库克隆

这个最简单用得最多,也是找代码必备技能,首先找到要克隆的远程库,远程库必须要有README.md文件。然后就通过命令git clone克隆到本地库$ git clone [email protected]:lqhou/TensorFlow2.0-Book然后就可以在你的本地库找的了...

2020-10-07 20:52:12 137

原创 Git之版本回退

上一篇博客写了一个new.txt文件,提交到了Git版本库,现在修改一下,内容如下:Git is a version control system.Git is free distributed under the GPL.然后用“add”,“commit”命令提交$ git add new.txt$ git commit -m "append GPL"[master 85eabe3] append GPL 1 file changed, 1 insertion(+), 1 deletion

2020-10-07 17:08:56 231

原创 Git创建版本库

什么是版本库呢?版本库又名仓库,英文名repository,你可以简单理解成一个目录,这个目录里面的所有文件都可以被Git管理起来,每个文件的修改、删除,Git都能跟踪,以便任何时刻都可以追踪历史,或者在将来某个时刻可以“还原”。首先创建一个空目录:github_learncd命令进入目录,类似于命令提示符pwd命令显示当前目录$ mkdir github_learn$ cd github_learn$ pwd第二步:通过git init命令把这个目录变成Git可以管理的仓库$ git i

2020-10-06 12:52:43 168

原创 Git安装(window)

Git是目前世界上最先进的分布式版本控制系统,所以作为程序员必须学会使用首先在官网上下载,网址:https://git-scm.com/downloads下载Windows版本:下载后打开打开安装一路next到安装完成在开始菜单找到Git Bush,点开跳出类似命令行窗口的页面就说明安装成功了...

2020-10-06 12:52:12 108

原创 环境配置经验教训(tensorflow)

在环境配置过程中,想必大多数人和我一样,配置前疯狂找教程,配置后疯狂找解决办法,可能试了一堆办法也无法成功。tensorflow的环境配置方法有很多,有通过anaconda下载tensorflow,还有pycharm中直接下载,我用的是第二种办法,以下是我在tensorflow环境配置过程的经验教训。步骤如下:1:首先确定python版本和要下载的tensorflow版本python与tensorflow版本对应CPUGPU那么问题就来了,现在python的最新版本是3.8.6,所以和tens

2020-09-28 20:28:31 316 1

原创 pycharm如何查看python文件的工作目录

在找bug的过程中发现python文件的工作目录和存放目录地址有可能是不一样的,pathlib路径操作中的pathlib.Path.cwd()获取的是工作目录而不是存放目录地址发现工作目录和存放目录地址不同的时候一定要修改过来,防止发生怀疑人生bug哈哈以下是查看工作目录的步骤:...

2020-09-26 17:14:51 7190 1

原创 python--pathlib--路径操作

我的代码路径:D:\orde\python\tensorflow\path_imple.pyfrom pathlib import Pathp1=Path(__file__) #获取当前文件路径print(p1) #D:\orde\python\tensorflow\path_imple.pyp2 = Path.cwd() #获取当前文件的目录print(p2) #D:\orde\python\tensorflowp3=Path.cwd().parent #当前文件目录的父目

2020-09-26 16:36:25 639

原创 getRotationMatrix2D和warpAffine函数算法

一直找不到这两个函数的源码,就学习了一下此函数的算法,希望有博主大佬给我点途径看看OpenCV这两个函数的源码,以下是我学习这个算法的一点心得,具体计算过程在最后面,前面主要介绍一些概念:getRotationMatrix2D函数调用形式:Mat getRotationMatrix2D(Point2f center, double angle, double scale)参数详解:Point2f center:表示旋转的中心点double angle:表示旋转的角度double scale:图

2020-09-25 21:58:01 1056

原创 51单片机之数码管

1.静态数码管原理图LED数码管根据LED的不同接法分为两类:共阴和共阳

2020-09-22 20:46:15 5071 3

原创 OpenCV(图片自由缩放及边缘裁剪)

图像的扩缩裁挖

2020-09-22 20:45:05 2332

原创 OpenCV之卷积核处理

OpenCV的色彩空间OpenCV的色彩空间有三种:灰度,BGR(蓝绿红),HSV(H是色调,S是饱和度,V是黑色度)卷积核与图形特征提取卷积核是一种常用的图形处理公具,其主要方法是通过确定的核块来检测图像的某个区域,之后根据所检测的像素与其周围存在的像素的亮度差值来改变像素明亮度import cv2import numpy as npfrom scipy import ndimage# [3,3]的卷积核kerne133 = np.array([[-1,-1,-1],[-1,8,-1],

2020-09-17 21:39:14 774

原创 初学OpenCV

1.OpenCV基本图片读取读取图片函数:cv2.imread()参数为图片的相对路径或绝对路径展示图片函数:cv2.imshow()第一个参数:窗口名第二个参数:显示的目标图片储存图片函数:cv2.imwrite()第一个参数:图片储存名称第二个参数:储存的目标import cv2#读取为三维矩阵jpg = cv2.imread("1.jpg")img = cv2.imread("D:\1.jpg")# 用名叫img的窗口,打开img图片cv2.imshow("img",i

2020-09-17 21:19:25 151

原创 让我崩溃的大整数加法

想用此博客表示我崩溃的心,我真是被我的愚蠢蠢哭了,啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。接下来是一道VJ上的题目:另外附上我改了无数次的代码:#include<iostream>#include<cstring>using nam...

2019-05-12 23:55:00 200 3

原创 字符串的算法程序(暴力,kmp算法)

1.暴力匹配算法完整代码假设现在我们面临这样一个问题:有一个文本串S,和一个模式串P,现在要查找P在S中的位置,怎么查找呢?如果用暴力匹配的思路,并假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置,则有:#include<iostream>#include<cstring>#include<cstdio>using namespace st...

2019-05-10 17:31:39 215

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除