lynnandwei-CSDN博客

转载 StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery 文本驱动的styleggan图像合成全文翻译

# StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery 文本驱动的styleggan图像合成## Abstract 摘要Inspired by the ability of StyleGAN to generate highly realistic images in a variety of domains, much recent work has focused on understanding how to use the late

2021-05-06 10:38:48 756

原创图示Mobilenet与Mobilenetv2--转自AlphaTree

MobileNet 很赞的轻量级小模型，移动应用居家必备之良药。^_^顾名思义，它是可以用在移动设备上的网络，性能和效率取得了很好平衡。它发展了两个版本，第一个版本基本结构和VGG类似，主要通过 depthwise separable convolution 来减少参数和提升计算速度。第二个版本则是基于ResNet的结构进行改进。MobileNet v2使用了 ReLU6（即对 ReLU 输出的结...

2018-06-20 11:12:10 1690

转载 [干货]一张地铁图看懂人工智能算法发展（含代码）---转自AlphaTree

“ 或许你曾经困扰过：明明自家产品有自己的数据，明明算法模型很多开源，可为什么开发起来却问题多多？要么拿到问题无从下手？”每一个大厨，心中都有自己的菜谱。要烹制一桌山珍海味，美味佳肴，自然要熟知三件事，原料（模型），调料（优化算法）和秘籍菜谱（这里常常只paper：paper会告诉你解决什么问题用什么模型与算法）。有了这三样，还要基本功扎实，拌、腌、炒、烧、蒸、炸、煮、煲基本手法样样不能少。（基...

2018-06-19 12:33:14 5657

原创 VGG

VGG-Net同样也是一种CNN，它来自 Andrew Zisserman 教授的组 (Oxford)，VGG-Net 在2014年的 ILSVRC localization and classification 两个问题上分别取得了第一名和第二名，VGG-Net不同于AlexNet的地方是：VGG-Net使用更多的层，通常有16－19层，而AlexNet只有8层。另外一个不同的地方是：VGG-N

2016-12-19 14:44:36 3134

原创学习笔记：inception V4 与resnet

原始的Inception模型，也就是GoogLeNet被称为Inception-v1，加入batch normalization之后被称为Inception-v2，加入factorization的idea之后，改进为Inception-v3。然后发现ResNet的结构可以加速训练，就有了之后的inception v4 和resnet v2.V4resne

2016-12-19 10:55:57 8243

原创学习笔记：GoogLeNet Incepetion V2，V3

上次整理了googlenet V1，V2和V3在同一篇文章里进行描述的，所以我们也在这里一起学习。tensorflow发布了所有的模型https://github.com/tensorflow/models/blob/master/slim/README.md#pre-trained-models论文列表：[v1] Going Deeper wi

2016-12-15 17:54:18 3758

原创 Tensorflow在centos上安装记录

之前安装过 tensorflow 0.6，还没来得及玩就休假了。回来之后，tensorflow就已经是0.8了，支持分布式训练。于是着手先升级。系统里面之前装caffe，也装过很多tensorflow需要的库，所以一开始安装，各种需求冲突还是有点头大。tensorflow有四种安装方式，之前直接用的pip install的方式进行安装。Pip Install: Install T

2016-06-20 17:19:33 3360

原创 ruby安装笔记

这次下的一些ios项目里面有用到ruby 于是开始安装参考文档为如何快速正确的安装 Ruby, Rails 运行环境 https://ruby-china.org/wiki/install_ruby_guide 然后在gem install bundler 的时候报错 Errno::ECONNRESET: Connection reset by peer - SSL_co

2016-04-13 22:46:36 1130

原创拍照识别小工具

最近海淘的东西明显变多，啥语言都有，连英文都不是标配了。几个识别工具都用的自己的翻译。经常看得是，明明都是中文，咋不知道在说啥捏。突然想着把几年前做的一个图片识别小工具改到现在手机上来因为google的翻译api后来收费了，现在又没有搭建服务器。就干脆先识别然后打开翻译的网页，然后将识别的文字粘贴过去。这是结果图识别如果不做成单机版，而做成服务器版，是可以将识别的速度加快很多的。

2016-04-13 21:28:01 2458

原创学习笔记：深度学习网络特征逐层可视化

“ Deep Learning很吸引人，也很玄乎的一个点就是大家都说它可以提取到分级的逐层抽象的特征。但对我们来说，总是耳听为虚，眼见为实。所以，每当我们训练完一个深度模型后，我们还特别想把这个深度模型学到的东西给可视化出来，好弄明白它到底学到了什么东西，是不是有意义的，是不是像传说中的那样神奇” zouxy09 http://blog.csdn.net/zouxy0

2015-05-14 15:23:20 6995 1

原创学习笔记：自训练Cifar10网络数据结果

看了那么多深度网络的结构，于是上个月就开始自己拿数据来训练。训练的数据需要尽量多一点。首先拿101_ObjectCategories的数据来试一下。101_ObjectCategories里面有的类别数据量太少，

2015-05-05 17:51:11 4452

原创学习笔记：GoogLeNet

GoogLeNet, 2014年ILSVRC挑战赛冠军，将Top5 的错误率降低到6.67%. 一个22层的深度网络，题目为：Going deeper with convolutions。。GoogLeNet这个名字也是挺有意思的，为了像开山鼻祖的LeNet网络致敬，他们选择了这样的名字。

2015-03-19 15:02:40 44032 12

原创学习笔记：AlexNet&Imagenet学习笔记

ImageNet(http://www.image-net.org)是李菲菲组的图像库，和WordNet 可以结合使用（毕业于Caltech；导师：Pietro Perona；主页：http://vision.stanford.edu/~feifeili/）总共有十万的synset，其中2010的数据表示，有图像的非空synset是21841，每一类大约1000张图片，图片总数：14

2015-03-18 18:20:10 23453 3

原创学习笔记-CIFAR10模型理解简述

整个结构中包含三个convolution layer、三个pooling layer和两个fully connected layer。每个层有多个Feature Map，每个Feature Map通过一种卷积滤波器提取输入的一种特征，然后每个Feature Map有多个神经元。首先是数据层，测试数据100张为一批（batch_size），后面括号内是数据总大小。如100*32*32

2015-03-16 10:53:53 7130 1

原创学习笔记：Caffe上配置和运行Cifar10的示例

CIFAR-10数据集含有6万个32*32的彩色图像，共分为10种类型，由 Alex Krizhevsky, Vinod Nair和 Geoffrey Hinton收集而来。包含50000张训练图片，10000张测试图片http://www.cs.toronto.edu/~kriz/cifar.html数据集的数据存在一个10000*3072 的 numpy数组中，单位是uint8s，

2015-03-12 16:58:48 13935 1

原创学习笔记：Caffe上LeNet模型理解

Caffe中用的模型结构是著名的手写体识别模型LeNet-5（http://yann.lecun.com/exdb/lenet/a35.html）。当年美国大多数银行就是用它来识别支票上面的手写数字的。能够达到这种商用的地步，它的准确性可想而知，唯一的区别是把其中的sigmoid激活函数换成了ReLU。为什么换成ReLU，上一篇blog中找到了一些相关讨论，可以参考。CNN的发展，关键就在

2015-03-05 17:23:17 5513 1

原创图像处理-素描篇

素描滤镜：最基础的算法就是：1、去色；2、复制去色图层，并且反色；3、对反色图像进行高斯模糊；4、模糊后的图像叠加模式选择颜色减淡效果。减淡公式：C =MIN( A +（A×B）/（255-B）,255)，其中C为混合结果，A为去色后的像素点，B为高斯模糊后的像素点。2 PIL素描滤镜http://qinxuye.me/art

2015-02-26 17:35:14 2285 1

原创图像处理-基础篇

年初和人聊天的时候，谈起美图光影等各种图像处理软件。突然想起，虽然很多算法说起来很容易，但是我也没脚踏实地的都实现一下，于是决定实实在在的都实现一遍。自己还很喜欢很多相机里自带的滤镜风格，如理光GR。也可以看看能不能做出来。理光GR对比图效果可参见测评http://article.pchome.net/content-1621943-6.html实现还是用的opencv。先整理一

2015-02-26 15:32:22 1660

原创学习笔记：Caffe上配置和运行MNIST

MNIST，一个经典的手写数字库，在Caffe上配置的第一个案例 1首先，获取minist的数据包。这个版本是四个数据包cd $CAFFE_ROOT./data/mnist/get_mnist.sh#!/usr/bin/env sh# This scripts downloads the mnist data and unzips it.DIR="$( cd "$

2015-01-29 17:35:07 14697 2

原创 SparseAutoEncoder 稀疏自动编码器

Sparse Coding稀疏编码（Sparse Coding）是一种模拟哺乳动物视觉系统主视皮层V1区的视觉感知算法，NNSC（Non-Negative Sparse Coding，非负稀疏编码）是SC和非负矩阵分解相结合的一种编码算法。对57个训练样本的每一幅图片随机抽样1500个4×4个图像小块，4×4可显示一个眼的余角，4×4比8×8精确的多，使用NNSC

2015-01-29 11:38:27 5422

原创 Caffe安装过程记录（CentOS，无独立显卡，无GPU）

Caffe（ http://caffe.berkeleyvision.org/ ）是一个清晰而高效的深度学习框架，其作者是博士毕业于UC Berkeley的贾扬清（http://daggerfs.com/ ），他目前在Google工作。Caffe是纯粹的C++/CUDA架构，支持命令行、Python和MATLAB接口；可以在CPU和GPU直接无缝切换.

2015-01-28 17:34:18 20379 1

转载语义哈希(semanticHashing)

语义哈希(semanticHashing)是指将高维空间向量映射至低维汉明空间,并保持原空间向量相似性,使得新空间向量的汉明距离反映原空间向量相似度的哈希算法。语义哈希引入了近似的概念,认为在海量数据的搜索中,在大多数情况下,完全精确的查找并不是必须的,近似解己经足以满足用户绝大多数的要求,因而通过哈希算法迅速定位数据集中一定概率下与搜索关键词相关的数据,配合汉明空间相似度度量的快速性和索引结果容

2015-01-28 15:56:04 7015

转载机器学习算法的分类

现在有很多机器学习算法，困难的是进行方法归类，这里我们介绍两种方法进行思考和分类这些算法。第一组算法是学习风格，第二组是在形式和功能上类似。学习风格　　一个算法基于问题建模有不同的方法，无论这个问题是基于经验或环境的交互，或者是基于我们需要输入的数据，学习风格是ML首先必须考虑的问题。　　下面我们看看一些算法的主要学习风格或者称为学习模型。Supervised Learning

2015-01-28 15:12:22 3269

转载在导购的田野上（孙彤）

美丽说蘑菇街之后，电商生态体系的导购新机会正在出现，在导购的田野上势必会加入一些个性化的新生力量。2011年电商圈最热闹的网站，非美丽说、蘑菇街莫属。这两家公司均带给淘宝过亿元的销售额，而去年淘宝开放平台产生的总交易额不过才30亿元。它们迅速引爆了大众对导购这件事的重新认识。在中国的电子商务格局里面，大型B2C林立，各种价格战此起彼伏，生存空间相互挤压。但是在大电商

2013-08-28 14:51:32 1480

转载猜你喜欢

“猜你喜欢”是怎么猜中你心思的？ccyou 2012-11-12 15:54（文／Joseph A. Konstan & John Riedl）如今，到网上购物的人已经习惯了收到系统为他们做出的个性化推荐。Netflix 会推荐你可能会喜欢看的视频。TiVo 会自动把节目录下来，如果你感兴趣就可以看。Pandora 会通过预测我们想要听什么歌曲从而生成个性化的音

2013-08-28 14:46:19 1263

原创 12306验证码识别的结果记录

一直抽空在做12306的验证码识别，其实空余时间不多，花在上面的时间也不多，九月底基本算是做出一个结果，仔细验证之后觉得识别率也不是很高。没有别人做的效果好。。。。。回头再仔细想想怎么做。这次用leptonica 来做的，没用opencv 可能也有工具不熟的原因吧。

2012-10-13 10:58:25 2508

原创 Lazysnapping Grabcut 算法实现的结果

8月8号到8月18号，根据Lazysnapping的论文和一些资料，做了算法实现但是前期处理和LS不同，其实不算真正实现LS。有人用通俗易懂的话这样解释：首先，当一张图被导入到Lazy snapping中时，软件会自动采用watershed对该图进行处理。接下来，用户通过划线，确定F和B。如果从像素点的角度来看，一旦画了一条线，则这条线经过的像素点被称为“种子点”，这些“种子点”所涉及

2012-10-12 14:45:51 7077 4

原创直方图与通道分割

直方图实在是这个世界上最有用的工具之一了，做做统计做做均衡化，干啥都要用到它。下面给出自己用的一段简单的程序，将图像的H分量分离出来计算直方图：H分量分成16个等级int hsize = 16;float hranges[] = {0,180};const float* phranges = hranges;int ch[] = {0, 0};Mat hsv_src, h

2012-10-10 17:38:51 1534

原创 OpenCV 基础- Mat IplImage 最近用到的一些转换以及初始化

Mat 这个opencv2.0改版后，提出的结构由于会自己维护内存，基本不需要手动去将分配的空间释放，因此及其易用。不过有的函数，在以前的版本中存在，而在新版中没有后续维护，那么就需要将Mat转换成IplImage去运算，然后转换回来。一般的转换是：Mat gray_src;……IplImage pImg= IplImage(gray_src);IplImage * pIm

2012-10-10 15:31:51 5334

原创没有Photoshop 怎么做手写签

最近迷上手写签可是我的字不好看除了已经发布的字体以外如果我们还想用别人的字好像就不是那么容易的事情了起码你要装一些复杂的工具。那么如果你碰巧是个略懂编程的孩子用过opencv那么也许这也是件简单的事情。前情提要：有人问能不能弄来韩寒的字的手写签下午，我做了这样一件事：先找了一个文本，然后将想要的部分裁剪出来。找一张背景图。

2012-09-11 19:49:14 979

原创失败的交叉编译纪录

交叉编译自己并没有经验。于是编译出来的各种库都不能用。但是记录以下失败信息，为下次做准备。刚开始系统中对应的工具没有安装，因此安装如下。首先，下载mac port。然后安装tesseract需要的工具如下sudo apt-get install autoconf automake libtoolsudo apt-get install libpng12-devsudo

2012-07-20 15:55:12 22056 2

翻译 Leptonica

最近看到Leptonica，GIMP等，当时的感觉就是惊叹。这种惊叹就像以前我06年刚了解到OpenCV，10年刚了解到ROS时的感觉。但是Leptonica存在很久了，只是由于它很低调，一直没有认真的来了解它。Leptonica 是一个面向教学的开源网站，广泛的应用于图像处理和图像分析的应用中。说它广泛应用，可不是虚夸一句，在很多linux操作系统中，都自带了它的套件。但是在使用它的时候，由

2012-07-12 18:20:03 14503 2

转载图片搜索

当年想做图像搜索的时候，从书上得到的建议是，使用颜色分布描述符CLD 颜色结构描述符CSD 边缘直方图描述符EHD 区域描述符和轮廓描述符等按照MPEG-7来做。当时就晕了然后觉得是个很复杂的事情，没怎么好好做下去。其实原来那里这么复杂。国内的破书害死人啊，不懂的能不能不要在这些前沿方向乱指导。相似图片搜索的原理作者：阮一峰日期： 2011年7月21日

2012-07-09 14:20:43 2719 1

原创简单说说身边那些和ROS相关的人

其实，我还蛮懒的。对于技术博客，一直懒得写。所以常常是收集了一大堆资料，做了很多功课，然后就存封在电脑里了。最近更新blog，也不过是因为整理电脑，所以贴一些东西出来，没准可以帮帮其他的人。以后就可能很少贴ROS方面的东西了，其实ROS 只是工具，基于这些平台，还是每个学科本身的知识。上面也有很多聪明人的成果，所以真是挺棒的一件事情。现在不再专职在ROS平台上工作，但是有兴趣的话

2012-07-09 13:30:20 1906 4

原创 electric ros 版本资料列表

http://ros.informatik.uni-freiburg.de/roswiki/rosbag%282f%29Code%2820%29API.htmlhttp://www.willowgarage.com/pages/software/ros-platformhttp://www.ros.org/wiki/imu_drivers/ChangeListhttp://www.ro

2012-07-06 12:54:27 1330

原创 mit 手识别结果图

先记录ni.rosinstall 的内容 - git: {local-name: ni, uri: 'https://github.com/ros-pkg-git/ni.git', version: master}然后贴一张 mit包的结果图

2012-07-06 12:42:53 1521 1

原创 mit -kinect demo 包安装记录

http://www.ros.org/wiki/mit-ros-pkg/KinectDemosrosmake skeletal_tracker hand_interaction kgui piano impromptu_buttons --rosdep-install// 会缺少依赖的包svn co http://……hg clone https://kforge.ros.org/

2012-07-06 12:36:57 1976 1

原创 kinect ros 安装记录

更多资料参看 http://wiki.western.edu/mcis/index.php/Robotics-sum11/backup/Tutorialhttp://www.ros.org/wiki/mit-ros-pkg/KinectDemos/HandDetectionhttp://www.ros.org/wiki/openni_camerakinect ros

2012-07-06 12:31:22 2967

原创 ROS wiki 上包的目录列表

以前ROS wiki 上每个功能部分对应的包的信息资料。当时是2011年2月导出的，所以有的包可能没有了。有兴趣的朋友可以自己重新去wiki上导出最新的资料。手臂部分物品操作，抓取以下记录为2011年2月资料：http://www.ros.org/wiki/AllTutorials 如果想针对自己感兴趣的那一部分进行学习，请在网站的右上角输入关键字进行搜索，你会获得更多

2012-07-06 11:23:31 1488

原创 Graphviz ROS下如何保存节点图

用过ROS的人，对rxgraph 肯定都不陌生，想要看看当前运行的节点和他们的关系时，都会用这个指令来看看，--它是能对当前运行的系统中状态的图形化显示工具.看是不够的，咱总要写写文章，做做汇报吧，没有一个帅帅的图，怎么震撼别人哪。它支持通过Graphviz 的dot语言来生成不同的图片，Graphviz可是大名鼎鼎的贝尔实验室的几位牛人开发的一个画图工具。所以如果你想生成图片，可以打开r

2012-07-06 10:29:20 2215

空空如也

空空如也