自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 资源 (3)
  • 收藏
  • 关注

原创 【论文】Data-efficient Domain Randomization with Bayesian Optimization

基于域随机化的强化学习定义:主要增加了一个域参数分布,它决定了动力学模型的概率转移函数P。在某个确定的参数组合下,也就是生成一个特定的MDPs,此时的优化目标是在这个参数组合下的最大累积奖赏:本文提出的贝叶斯域随机化(BayRn),优化目标可以写成上下两层公式:这个目标方程怎么理解呢?首先看下层,这是一个标准的域随机化强化学习过程,通俗来说就是给定一个域参数分布 fai,从中采样形成多个MDPs(这是用采样近似期望),然后在每个MDPs中训练Agent,期望学到一个策略,能够最大化所有MD.

2022-01-05 11:07:30 391

原创 【论文】Active Domain Randomizatio

这篇论文是在传统的领域随机化(DR-Domain Randomization)的基础上提出的一篇改进论文,提出传统的领域随机化可能会导致次优的、高方差的策略,归因于对环境

2022-01-03 11:40:04 1715

原创 《结构信息论》——结构信息论Ⅰ:信息处理的数学原理

信息处理的数学定义:给定一个系统S,对于S的信息处理就是在S中区分规律和噪音。一个基本任务就是:从一个可观察的数据系统中编码出“规律”。1 香农的信息论给定一个概率分布p = (p1, p2, · · · , pn),则香农熵定义为:其中 p_i 表示 i 被选中的概率,而− log2 p_i 表示 i 自己的信息量。那么求和就可以得到概率分布 p 的信息量的期望(或者说不确定性大小)。香农的信息论是当前信息技术的理论基础,尤其在通信领域起着基石的重要作用,如下所示:它确定了信息

2021-12-28 21:41:22 1699 4

原创 【图神经网络】——“斯坦福CS224W”课程笔记(附1)

An Introduction to Snap.py: SNAP for Python

2021-12-28 21:40:21 708

原创 频繁模式挖掘——概述

频繁模式挖掘(Frequent Pattern Mining)

2021-12-28 21:39:52 2003

原创 【论文】Closing the Sim-to-Real Loop: Adapting Simulation Randomization with Real World Experience

本文主要介绍了对机器手臂动力学参数的分布进行学习,能更有效率的适应真实环境,从而缩小sim to real gap。论文原址:Closing the Sim-to-Real Loop: Adapting Simulation Randomization with Real World Experiencesim to real 问题在强化学习中被广泛研究,目前主要有以下几种研究方向:系统辨识(system identification)、领域适应(domain adaption)、参数随机化(pa.

2021-12-28 21:31:11 1357 1

原创 mujoco环境变量报错:Missing path to your environment variable.

mujoco在ubuntu终端可以运行,但是在pycharm中无法正常运行,会报错:此时需要在pycharm环境中手动加入环境变量:然后就可以成功在pycharm里面运行mujoco程序了!

2021-12-23 16:44:10 1050

原创 图数据链接汇总

收集一些图数据集收集一些常用的图数据集,包括生物医学、推荐系统、社交网络、电子商务等领域的数据。OGB数据集的排名表单图网络数据集

2021-12-20 12:37:55 159

原创 【剑指Offer刷题】——两个链表的第一个公共节点(52)

Leetcode刷题地址:https://leetcode-cn.com/problemset/lcof/题目输入两个链表,找出它们的第一个公共节点。如下面的两个链表:在节点 c1 开始相交。示例 1:输入:intersectVal = 8, listA = [4,1,8,4,5], listB = [5,0,1,8,4,5], skipA= 2, skipB = 3 输出:Reference of the node with value = 8 输入解释:相交节点的值为 8 (注意.

2021-03-14 16:43:35 88

原创 【图神经网络】——“斯坦福CS224W”课程笔记(三)

Motifs and structural Roles in Networks本节课主要讨论子图分解在图分析中的重要作用。1 简介图可以看作是由许多子图(subgraph)构建而成的。这些子图能够刻画和区分不同的图。例如下面这个电路图可以分解为许多子图。有一些固定的子图结构,这些子图反应了某种特殊的结构特征,因此我们需要了解和熟悉它们。这里列举了13种包含3个结点的有向子图(非同构的)。我们用一个“重要性”系数来表示某个子图在一个图中出现的频率程度(后面会有严格定义)。如果是正数表明出现频.

2021-03-07 17:02:37 1643

原创 【剑指Offer刷题】——复杂链表的复制(35)

Leetcode刷题地址:https://leetcode-cn.com/problemset/lcof/题目Solution 1哈希node和index,比较愚蠢。。。主要思路是两次遍历链表,用一个map存储每一个结点指针对应的index。第二次遍历时向前或向后增加到对应的index,然后更新random指针。时间:O(n + n * n/2) -> O(n^2);空间:O(n)。Node* copyRandomList(Node* head) { if (!head) r.

2021-03-03 23:06:28 122 2

原创 【剑指Offer刷题】——合并两个排序的链表(25)

Solution 1以其中一个链表作为基准链表,和另一个链表每个元素一一比较,在合适的位置修改指针,最终返回第一个链表。时间:O(n1 + n2),其中n1和n2分别代表两个链表的长度;空间:O(1)ListNode* mergeTwoLists(ListNode* l1, ListNode* l2) { if (!l1) return l2; else if (!l2) return l1; ListNode* first = l1; ListNode*

2021-03-03 09:38:48 89

原创 【死磕Python】——详解__hash__和__eq__的用法

当我们面对这样一个场景时,我们自定义了一个类,并从该类构建了很多对象,并且将该对象作为一个dict的key来使用,如以下所示。d = dict()t1 = TwoCommunity({"1", "2"}, {"3", "4"})t2 = TwoCommunity({"1", "2"}, {"3", "4"})d.setdefault(t1, 1.2)if d.get(t2): print(d.get(t2))其中类TwoCommunity定义如下。其中comi和comj为一个set,其

2021-03-01 19:50:54 649 1

原创 【剑指Offer刷题】——反转链表(24)

Leetcode刷题地址:https://leetcode-cn.com/problemset/lcof/题目定义一个函数,输入一个链表的头节点,反转该链表并输出反转后链表的头节点。示例:输入: 1->2->3->4->5->NULL输出: 5->4->3->2->1->NULL限制:0 <= 节点个数 <= 5000Solution 1将链表每个节点的指针存入一个数组,然后逆序调整每个指针的next指向。.

2021-02-25 19:59:19 94

原创 【剑指Offer刷题】——链表中倒数第k个节点(22)

Leetcode刷题地址:https://leetcode-cn.com/problemset/lcof/题目输入一个链表,输出该链表中倒数第k个节点。为了符合大多数人的习惯,本题从1开始计数,即链表的尾节点是倒数第1个节点。例如,一个链表有 6 个节点,从头节点开始,它们的值依次是 1、2、3、4、5、6。这个链表的倒数第 3 个节点是值为 4 的节点。示例:给定一个链表: 1->2->3->4->5, 和 k = 2.返回链表 4->5.Solutio.

2021-02-24 20:42:55 70

原创 【剑指Offer刷题】——数组中重复的数字(03)

Leetcode刷题地址:https://leetcode-cn.com/problemset/lcof/Solution 1排序再比较。int findRepeatNumber(vector<int>& nums) { sort(nums.begin(), nums.end()); for (int i=0; i<nums.size()-1; i++) { if (nums[i] == nums[i+1]) return nums[i];.

2021-02-23 21:06:40 73

原创 【图神经网络】——“斯坦福CS224W”课程笔记(二)

本文是我在学习斯坦福大学2019年秋季课程 “图机器学习”(图神经网络) 时所记录的笔记。课程资源如下列出,其中slides都可在官网找到;另斯坦福CS224w课程的学生记录了部分笔记在github上开源,可以作为学习参考。官网:http://snap.stanford.edu/class/cs224w-2019/课程视频:http://snap.stanford.edu/class/cs224w-videos-2019/课程笔记(英文):https://snap-stanford.github.i

2021-02-15 09:22:45 890 1

原创 【死磕Python】——Python处理时间的利器【datetime】

在python编程中我们常常需要处理时间和日期信息,例如需要获取当前时间、生成特定字符串格式的时间信息等等。python为我们提供了一个现成的标准库——datetime,内置了许多有用的类和函数,现整理如下。1 datetime标准库datetime库中有一个同名的类——datetime类,采用该类可以做很多工作。timestamp时间戳。首先我们要了解日期和时间在计算机中是如何表示的。我们看到的日期都是像xxxx年xx月xx日的形式,但在计算机中并不是以这种字符串的形式来存储时间的。而是以一种非常

2021-02-05 16:14:03 222

原创 【图神经网络】——“斯坦福CS224W”课程笔记(一)

图基础图可以看作实体及其关系的组成实体:又称结点,N关系:又称边,E系统:又称网络或图,G ( N , E )网络通常表示真实系统,图是网络的一种数学表示。实际上很多情况我们并不区分这两个概念。在解决不同问题的时候,选择最适合的、正确的网络表示。如何来定义一个图无向图。例如社交软件中的好友,双向关系;有向图。例如github中Follower,是单向关系。度。无向图中只包含度的概念,即和某个node相连的边的个数;有向图中包含出度和入度的概念,出度就是从这个结点出发指向其他结点边的个数

2021-02-04 12:44:00 1061

原创 《量子纠缠:从量子物质态到深度学习》学习笔记

1、信息在物理学领域的概念: 信息不是一个单纯的数学概念,而是与物质和能量一样基本的物理概念。2、量子纠缠的概念: 如果两个微观粒子的整体波函数不能够被写成各部分的直积,那么它们之间就存在纠缠。3、本文的主要思想和写作目的: 从量子纠缠的视角审视深度学习,从而反馈机器学习的发展。4、深度学习 用最简短的话概括,就是函数近似(Function ...

2018-08-07 15:29:48 869

原创 吴恩达ML课程 笔记总结(二)—— 单变量线性回归

1、模型及概念的建立对于单变量的线性回归问题,首先会给定一个数据集,这个数据集中只包含了一个输入变量和对应的输出变量。我们所要做的工作是建立一个预测函数h,然后用预测函数去拟合数据集,使得该函数能够较好的反应给定数据集的走向(换句话说,能够很好的拟合数据集)。终极目标是使得该函数能够对于给定的新的输入,产生较好的输出(较好的预测结果)。 例如预测房价模型,预测函数h能够使得给定的房子大小而给...

2018-08-06 11:41:43 533

原创 吴恩达ML课程 笔记总结(五)——logistic 回归

1、分类

2018-08-03 14:21:06 137

原创 吴恩达ML课程 笔记总结(四)——多变量线性回归

这节的主要内容来啦: 1. 多元变量引入 2. 梯度下降算法在多元变量的情况下的实现 3. 梯度下降算法的实际应用:特征缩放1、多元变量之前我们都是只有一个对应的输入x和对应输出y的线性回归问题,这一节我们将要学习多变量的(即存在x1,x2,x3…)的线性回归问题。如图是预测房价模型的多变量表示: 因此我们可以将预测函数h表示成下面的形式: 同样根据我们之前学习的矩阵,我...

2018-08-01 11:37:22 317

原创 吴恩达ML课程 笔记总结(一)

吴恩达ML课程 笔记总结(一)大二暑假学点新东西(⊙﹏⊙),总结了一些AndrewNg课程的笔记,也参考了网上一些大牛的总结,希望大家能一起学习!本节的主要内容是: 1. 机器学习的定义以及举例 2. 机器学习的分类——监督学习和非监督学习 3. 对于两种学习方式的进一步说明和分类一、机器学习的定义 如果用P来测量程序在任务T中的性能。若一个程序利用经验E在任务T中获得了...

2018-08-01 10:39:31 888

斯坦福_图机器学习_CS224W_课程讲义.zip

斯坦福_图机器学习(图神经网络)_CS224W_课程讲义(包含homework)

2021-02-04

网络爬虫入门程序示例

一个简单的网络爬虫程序,可以帮助大家入门学习和使用

2018-08-02

MSP-EXP430F5529

这是对于MSP-EXP430F5529的学习文档,包含有基本的驱动程序,实例代码。

2018-05-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除