4 zhaoyuyu_nudt

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 8w+

[EUG2] code笔记 :

文章目录一、代码结构二、代码(执行步骤)1、run.sh 、 run.py参数main1、初始化 label_data unlabeled_data2、 EUG 参数初始化3、 EUG 更新 训练 迭代过程EUG1、 train2、评估dataset4、伪标签估计一、代码结构二、代码(执行步骤)1、run.sh 、 run.py参数EF?init ?fea ?resume ???mainlog 为什么要用 EF ?total_step = ?EF 是啥?datase

2020-08-10 22:21:51

【强化学习】 有限马尔可夫决策过程ing

文章目录智能体-环境 交互接口目标和收益3、分幂 和持续性任务的统一表示4、 侧拉和价值韩素智能体-环境 交互接口状态转移概率状态动作 二元组的期望收益时间不长目标和收益3、分幂 和持续性任务的统一表示4、 侧拉和价值韩素...

2020-08-10 10:25:42

Pytorch :如何把print的参数存起来?

1、python 将print输出的内容保存到txt文件中import sysimport os class Logger(object): def __init__(self, filename="Default.log"): self.terminal = sys.stdout self.log = open(filename, "a") def write(self, message): self.terminal.write

2020-08-09 16:42:40

报告记录 -【强化学习】 多臂赌博机 (不全)

是什么?怎么解决?概念开发试探基本变量基本解决思路应用 : 图片推荐系统EE 开发与试探 和冷启动开发: 推荐狗试探: 推荐猫冷启动 : ????Qn 的增量描述Qn+1 写成了非平稳情况最近的奖赏比前面的奖赏更重要使用固定步长常见的赌博机算法朴素Epsilon-Greedy改进: 随着步数增加 逐渐 减少thetaOptimistic Initial Value尽可能让每个摇臂都被尝试几次, 从而避免收敛到局部最优早期的奖励 和后期的奖励, 越来越大。U

2020-08-08 15:56:33

报告记录-【强化学习】导论 (不全)

文章目录强化学习是什么问题马尔科夫决策过程状态收益部分可观测马尔科夫决策过程VS 监督学习、 无监督学习特点要素应用实例问题 井字棋强化学习方法:状态-价值表 (状态 + 获胜概率)选择动作更新价值强化学习早期历史1、 试错学习效应定律 1911快乐痛苦系统 1948minsky , 1960 , Steps toward AI自动学习机2、 最优控制理论动态规划马尔可夫决策过程 是动态规划的离散随机自适应动态规划 、Q学习算法3、 时序差分学习心理学的规律 可以应用过来 Minsky时序差分思想的跳

2020-08-08 15:36:41

深度学习: Epoch 是什么?

文章目录神经网络的训练梯度下降法Epochbatchsizeiterations神经网络的训练梯度下降法学习率: 步长更大= 学习率更高误差函数不断减小。如果训练数据过多, 无法一次性将所有数据送入计算。现将数据分成几个部分: batch分多个 batch , 逐一送入计算训练Epoch一个epoch , 表示: 所有的数据送入网络中, 完成了一次前向计算 + 反向传播的过程。由于一个epoch 常常太大, 分成 几个小的 baches .将所有数据迭代训练一次是不够的, 需要

2020-08-07 21:08:23

[UpdateNet]代码阅读笔记 : create_template.py

文章目录importbasenetclass SiamRPN(nn.Module)1、网络结构init2、反向传播3、SiamRPNBIG,SiamRPNVOT1、 super(SiamRPNBIG, self).__init__(size=2) 是什么?2、为什么SiamRPNBIG VOT OTB , 都引入了 SiamRPN 做参数 ,它的确有详细的网络结构。net_updtracker_updutils_updimportbasenetclass SiamRPN(nn.Module)1、网

2020-08-07 20:25:47

[UpdateNet]代码阅读笔记 :tracker_upd.py 模板更新方式 (core )

init , 使用 输入图像, 第一framework 的目标从, 和 tracker 初始化, 这里的net 指的是 siameseRPN 。track ,跟踪过程中 , 使用上一个frame的 state + 下一个frame 的图片, 使用当前 updatenet 模型 , 预测下一个frame的state .信息都包含在 state 里面 。initconfig : tracker 的超参数分别是什么意义呀???? instance_size 是啥?? 输入size .

2020-08-06 22:45:39

72.编辑距离 :给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。

我的思路:1、 先比较两个字符的数量 ,计算相差的数量2、 字符匹配, 循序匹配两个字符中最长字符串数量len§。3、 最少操作数 = | len(1) - len(2) |+ len(2) - len§word 1 = a []word 2 = b []构造矩阵, m = len(a) , n = len (b) A mnaibjfor i in len(a)for j in len (b )if a(i) = b(j) , Aij = 1? 如何把一个矩阵 转化成 单.

2020-08-06 20:09:28

sh 里面 import cv2 不成功 , 但是 pycharm 里面可以run

sh 脚本 需要设置 bash环境变量全局变量sh 是在系统上运行的exprot 一下控制台要注意环境设置。python 的全局变量opencv 的全局变量没有在命令行一定是这个原因查找 opencv2 import cv2 不行解决办法:激活conda虚拟环境后打开!!~~~...

2020-08-06 15:50:27

【论文筛选ing】RNN ways

参考文献Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking2016Project Page:http://guanghan.info/projects/ROLO/GitHub:https://github.com/wangxiao5791509/ROLO摘要:本文提出了一种新的方法进行空间监督 RCNN 来进行目标跟踪。我们通过深度神经网络来学习到 locations 的历

2020-08-06 14:42:51

【ReID based video 】2017 AMOC: accumulative motion context : 有监督

AMOC: Hao Liu, Zequn Jie, Karlekar Jayashree, Meibin Qi, Jianguo Jiang, Shuicheng Yan, Jiashi Feng. Video based person re-identification with accumulative motion context[J]. arXiv preprint arXiv:1701.00193,2017.没有开源。。基于累计运动内容的ReID相关文献[10][10] uses a

2020-08-06 10:20:53

【ing 】CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别?

CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的内部网络结构有什么区别?CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)DNN指的是包含多个隐层的神经网络,如图1所示,根据神经元的特点,可以分为MLP、CNNs、RNNs等,下文在区分三者的时候,都从神经元的角度来讲解。MLP是最朴素的DNN,CNNs是encode了空间相关性的DNN,RNNs是encode进了时间相关性的DNN。CNN 专门解决图像问题的,可用把它看作特征提取层,放在输入层上,最后用ML

2020-08-06 09:25:59

Vehicle Re-Identification 调研 and数据集(未)

多层前馈结构从大规模数据集学习层次特征,在图像分类识别任务中取得了出色的性能。目前基于 CNN 的车辆识别研究中,在采用端到端模式的识别方法在性能上达到一个瓶颈时,通常会采用 2 种方案提升性能:一种是结合浅层学习知识和深度特征完成分类识别;另一种是将相关的领域知识和浅层学习技术融入到深度网络中,构建一个新的端到端网络结构,从而提升图像分类的精度。数据集车辆识别常用公共数据集Stanford-Cars [51]、CompCar [66]、Vehicle Color [18]Stanford-Ca.

2020-08-06 09:09:25

LeedCode 刷题笔记 70: 斐波那契数列 : 爬楼梯 : 排列组合问题转化

题目假设你正在爬楼梯。需要 n 阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢?斐波那契数列以兔子繁殖为例子而引入,故又称为“兔子数列”,指的是这样一个数列:0、1、1、2、3、5、8、13、21、34、……在数学上,斐波那契数列以如下被以递推的方法定义:F(1)=1,F(2)=1,F(n)=F(n - 1)+F(n - 2)(n ≥ 3,n ∈ N*)在现代物理、准晶体结构、化学等领域,斐波纳契数列都有直接的应用,为此,美国数学会从 1963 年

2020-08-05 20:25:08

【MOT 多目标跟踪 综述 】(更新中)

运动目标跟踪(MOT)子系统(也称为多目标检测与跟踪-DATMO)负责检测和跟踪自动驾驶汽车周围环境中运动障碍物的姿态。该子系统对于使自主车辆做出决策和避免与潜在移动物体(如其他车辆和行人)碰撞至关重要。随着时间的推移,移动障碍物的位置通常是根据测距传感器(如激光雷达和雷达)或立体相机捕获的数据来估计的。单目摄像机的图像能够提供丰富的视觉信息,可以用来改进运动障碍假设。针对传感器测量的不确定性,采用Bayes滤波器(如Kalman和粒子滤波器)进行状态预测。MOT方法主要分为六类:传统的、基于模型的、

2020-08-05 12:56:54

【候选调研领域清单 】(填坑List )

文章目录高精定位地图SLAM车道线检测路径规划飞行集群复杂控制集群编队控制技术集群自愈合控制技术集群任务规划技术感知方向视觉测量非接触测量位姿测量视觉测距视觉着陆图像目标检测/跟踪视觉导航 VIO 视觉惯性里程计 等 不依赖GPS的视觉导航技术SLAM :基于激光雷达、 可见光、 IMU 的多传感器融合及常见场景构建技术无中心自组网通信自组织协同链路 : 适应快时变信道环境的物理层宽带通信算法、大规模节点分簇组网络路由协议高可靠性无人系统链路技术 : 自适应调频、快速路由简历方法、 切换测量值机器学习方向大

2020-08-05 11:16:07

【自动驾驶产业流程调研】(更新中)从招聘需求,观察自动驾驶领域行业概貌,及自动驾驶公司运作流程。

文章目录一、 首先查看各个岗位要求感知研发(融合预测)感知深度学习方向路径规划与决策控制算法高精地图研发仿真研发行为预测 与 轨迹预测机器学习基础设施搭建前端研发后端研发软件研发工程师-嵌入式软件研发工程师- 自动驾驶系统软件研发工程师 - 基础架构地图识别 提取二、各个岗位之间的关系三、汽车如何自动上路第一步、感知这个世界 (我是谁?)1、多传感器信息融合 (多种感官)1)视觉2) LiDAR2、目标识别 (目标检测)1)行人识别2) 车辆识别3) 其他物体及环境检测3、轨迹预测 (目标跟踪)1) 单目

2020-08-05 10:31:56

【多传感器融合】 综述 (待更新)

具体来讲,多传感器数据融合原理如下:(1)多个不同类型传感器(有源或无源)收集观测目标的数据;(2)对传感器的输出数据(离散或连续的时间函数数据、输出矢量、成像数据或一个直接的属性说明)进行特征提取的变换,提取代表观测数据的特征矢量Yi;(3)对特征矢量Yi进行模式识别处理(如聚类算法、自适应神经网络或其他能将特征矢量Yi变换成目标属性判决的统计模式识别法等),完成各传感器关于目标的说明;(4)将各传感器关于目标的说明数据按同一目标进行分组,即关联;(5)利用融合算法将目标的各传感器数据进行合成,

2020-08-05 10:30:46

【论文筛选】ReID候选调研对象 2020-08-04 (ing)

文章目录目前存在的问题 ReID1、表征学习: 类内变化、类间模糊2、数据泛化:在一个数据集中学习的模型,在新数据集中表现不佳3、训练速度:Loss难样本采样三元组损失(Triplet loss with batch hard mining, TriHard loss): 距离最远的正样本距离越来越小, 距离最近的正样本距离越来越大论文: Alexander Hermans, Lucas Beyer, Bastian Leibe. In defense of the triplet loss for per

2020-08-04 14:39:47

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。