PlanckScale1729-CSDN博客

原创 3D全景直播

我们的主页：奇点视觉全景技术是推动虚拟现实普及化的得力手段，而目前市面上的全景相机主要为二维全景拼接，没有深度感，缺少一个维度，因此很难产生真正的身临其境感。3D全景才是未来虚拟现实内容制作的真正王牌。但目前能制作高质量3D全景内容，甚至能够实时3D直播的产品仍鲜见于视野。我们现在的全景技术已经非常完善的产品化，性能、质量和稳定性都处于世界领先地位，已在安防行业成熟应用。并支持

2016-11-22 11:19:45 2261

原创玩玩三维重建

3D建模的软件N多，而基于照片的快速建模软件并不多，123D Catch算是很赞的一个，不需要任何技术背景便可轻松创建3D模型，但其是个完全的黑匣子，如何从照片一步步重建出3D模型的？VisualSFM和Meshlab两个软件让你了解三维重建的大致过程。

2015-03-16 08:58:40 10642 2

上一篇里说到，有两点对CUDA的计算能力影响甚大：数据并行，以及用多线程掩盖延迟。接下来我们要深入到其硬件实现，看一看这些机制是如何运作的。通常人们经常说某GPU有几百甚至数千的CUDA核心，这很容易让人联想到多核CPU。不过事实上两种“核心”是不一样的概念，GPU的CUDA核心只相当于处理器中的执行单元，负责执行指令进行运算，并不包含控制单元。可以类比到CPU核心的是流多处理器（Streaming Multiprocessor，简写为SM. Kepler中叫做SMX，Maxwell中叫做SMM），通常

2015-01-21 18:08:03 1304

原创 CUDA, 软件抽象的幻影背后

要充分发挥出硬件的极致性能，透过CUDA干净的编程模型，了解背后的底层机制是非常重要的。本文将从硬件层次出发，介绍各种CUDA优化策略.

2015-01-19 18:42:10 1081

原创 Dronecode Project:无人机的开源平台

两个月前，Linux Foundation 联合 12 家技术公司推出了Dronecode Project，意在整合分散的无人机项目资源，从而创造一个共同共享的无人机开源平台，为无人机开发者们提供操作系统、导航工具、飞行控制等方面的大量开源代码。

2015-01-18 18:14:46 2619

翻译用GraphLab Create快速体验深度学习

最近深度学习如日中天，虽然很强大，但其训练起来却是昂贵的，费时费力。最新发布的GraphLab Create 1.1 及1.2使深度学习变得超级简单。它不需要你自己在选择模型和调参上成为专家，就可以玩转神经网络。基于输入数据，neuralnet_classifier.create()函数会自动选择一个网络架构并设置合理的参数值。其实并非所有问题都得从头开始去训练一个深度模型，通过简单移除已训练好的DNN的输出层，将传播到输出层的信号作为特征喂给任何一种分类器便可完成我们的一些分类任务。

2015-01-12 09:31:35 1351

原创 2014，虚拟现实大爆炸

本文原载于我的主页：planckscale.info，转载于此。据 Venturebeat 的报道，《神庙逃亡》结合三星虚拟现实头戴显示器 Gear VR 推出《神庙逃亡 VR》了。游戏中，玩家通过头戴Gear VR查看游戏画面，通过倾斜身体或跳动躲避障碍。虽然三星的Gear VR仅售200美元，但遗憾的是，这货需要Galaxy Note 4手机为其提供显示与处理能

2015-01-09 19:59:08 1684 1

原创 Levenberg-Marquardt算法

Levenberg-Marquardt算法（下文简称LM算法）通常用于非线性最小二乘法的目标函数极小化。这是一个置信域方法（Trust-Region Method），为了防止步长太大而跳到非预期的局部极小值，这类算法自适应的调整步长。

2015-01-08 20:55:57 5102

原创算法描述与性能优化的解耦——Halide语言（1）

解耦工作的难度一定程度上取决于要解耦的两个概念是否能够清晰的区分开来。算法描述和性能优化的解耦是不容易的，因为一般说来这两个概念不易区分。但在图像处理这样的领域里，计算具有典型的模式（数据在pipeline上流动，被各个节点依次处理），我们仍然可以把二者很好地解耦。Halide就是这样一门语言。Halide是由MIT、Adobe和Stanford等机构合作实现的图像处理语言，它的核心思想即解耦算法和优化，事实也证明它是成功的，在各种实例中它均以几分之一的代码量实现出同等或者数倍于手工C++代码的效能

2015-01-03 10:15:58 6154 2

原创 3D重建山雨欲来

本文原载于我的主页：planckscale.info，转载于此。昨天说了3D全景，今天再搜了下，发现了freeD这个东东。说起来不新鲜，中文网络上这条信息也已经是一年前的了。这就是一个3D重建的典型应用，在体育场上利用多台（比如官网给出的16-28）高清相机在多个位置多个角度采集同一场景的图像，重建出3D模型。从Demo看重建质量真的不错，但不知实际运行效果如何。

2014-12-22 20:22:48 1345

原创酷技术：SamSung Project Beyond，实时3D全景

本文原载于我的主页：planckscale.info，转载于此。最近几个月各种实时全景拼接技术雨后春笋般冒了出来，看来一项技术到了瓜熟蒂落的时候，是挡也挡不住。今早无聊搜了下实时全景，还是把不关注技术新闻又懒于做技术推广的老夫吓了一跳。目前市面上大多数产品跟我们类似，无非是给拼接算法一个高性能实现，或者基于FPGA，或者基于CUDA。真正让人眼睛一亮的是三星最近推出的Project

2014-12-20 20:04:11 890

原创可触摸的全息影像—-让你在VR中有身临其境的体验

本文原载于我的主页：planckscale.info，转载于此。对我们人类来说，感受是可信赖的。虚拟现实总是飘渺无法捕捉的，然而据New Scientist消息，英国 Bristol 大学的Ben Long和他的同事们利用声波投影实现了“可触摸的全息影像”，将虚拟现实带入到我们的物理世界。给以触觉、视觉和声音这些真实感受会使人们更易沉浸到虚拟现实中，会给人们带来全新体验

2014-12-19 17:59:20 2283

原创图像拼接算法原理 2

2014-12-17 21:16:06 3446

原创多路视频实时全景拼接算法

本文原载于我们的主页，转载于此。多路视频实时全景拼接算法是我们比较成熟的产品算法，具体Demo可参见我们的Youku主页。功能本算法模块对来自多路摄像机的视频图像进行实时的无缝拼接融合，形成一路具有更宽视角的视频。特别的，可以输出360度全景视频，甚至360度*180度的球面全景。算法分为两部分，一部分为标定过程，在进行实时拼接前，通过拍摄场景图片，计算

2014-12-14 22:49:05 29398 37

翻译一张图胜千言万语：创建图像的自然描述

Google的图像描述系统，先用卷积神经网络处理影像，再用递归神经网络处理文字，从而生成图像的合理文字描述。并且在Pascal、Flickr8k、Flickr30k、SBU等公开的数据集上做了实验，产生的描述非常合理，结果具有鲁棒性。

2014-12-13 11:43:13 2770

翻译研究者们公布图像识别软件方面的最新进展

译自： “Researchers Announce Advance in Image-Recognition Software” from The New York Times两组科学家，各自独立工作，都研发出了能够识别、描述图像和视频内容的人工智能软件，它的精确度比以往任何时候都高，有时甚至可以模仿人类的理解水平。直到现在，所谓的计算机视觉在很大程度上仍被局限于识别单个物体对

2014-12-12 21:53:45 1275

原创共轭梯度（Conjugate Gradient ）笔记

本文为作者原创，原载于我们的主页，转载于此。这是一个关于共轭梯度法的笔记。请大家注意的是，这是个笔记，并不是一个教程，因此少不了跳跃和欠解释的地方。对CG方法了解不多的同学请移步这里。线性方程组和极小化问题一个关于对称矩阵的线性方程组等价于求解如下极小值问题：这很容易说明，我们微分目标函数得(1) 所以意味着.设为问题的解，为偏离

2014-12-12 21:48:27 2858

原创图像拼接算法原理 1

本系列文章为作者原创，初载于我们的Blog“额外维度”，转载于此。多路视频实时全景拼接Demo可见我们的youku主页。0. 引言图1,2,3. 两张图片的拼接图像拼接是计算机视觉中一个有趣的领域，它把来自多个不同视角相机的图像变换到同一视角下，无缝拼接成一张宽视野图像（比如360度全景图，甚至360度*180度的球面全景）。上图所

2014-11-24 15:08:10 8171 1

PlanckScale1729

原创 DIY 3D全景摄像机