唯与痴想-CSDN博客

原创【论文】Data-efficient Domain Randomization with Bayesian Optimization

基于域随机化的强化学习定义：主要增加了一个域参数分布，它决定了动力学模型的概率转移函数P。在某个确定的参数组合下，也就是生成一个特定的MDPs，此时的优化目标是在这个参数组合下的最大累积奖赏：本文提出的贝叶斯域随机化（BayRn），优化目标可以写成上下两层公式：这个目标方程怎么理解呢？首先看下层，这是一个标准的域随机化强化学习过程，通俗来说就是给定一个域参数分布 fai，从中采样形成多个MDPs（这是用采样近似期望），然后在每个MDPs中训练Agent，期望学到一个策略，能够最大化所有MD.

2022-01-05 11:07:30 391

原创【论文】Active Domain Randomizatio

这篇论文是在传统的领域随机化（DR-Domain Randomization）的基础上提出的一篇改进论文，提出传统的领域随机化可能会导致次优的、高方差的策略，归因于对环境

2022-01-03 11:40:04 1715

原创《结构信息论》——结构信息论Ⅰ：信息处理的数学原理

信息处理的数学定义：给定一个系统S，对于S的信息处理就是在S中区分规律和噪音。一个基本任务就是：从一个可观察的数据系统中编码出“规律”。1 香农的信息论给定一个概率分布p = (p1, p2, · · · , pn)，则香农熵定义为：其中 p_i 表示 i 被选中的概率，而− log2 p_i 表示 i 自己的信息量。那么求和就可以得到概率分布 p 的信息量的期望（或者说不确定性大小）。香农的信息论是当前信息技术的理论基础，尤其在通信领域起着基石的重要作用，如下所示：它确定了信息

2021-12-28 21:41:22 1699 4

原创【图神经网络】——“斯坦福CS224W”课程笔记（附1）

An Introduction to Snap.py: SNAP for Python

2021-12-28 21:40:21 708

原创频繁模式挖掘——概述

频繁模式挖掘(Frequent Pattern Mining)

2021-12-28 21:39:52 2003

原创【论文】Closing the Sim-to-Real Loop: Adapting Simulation Randomization with Real World Experience

本文主要介绍了对机器手臂动力学参数的分布进行学习，能更有效率的适应真实环境，从而缩小sim to real gap。论文原址：Closing the Sim-to-Real Loop: Adapting Simulation Randomization with Real World Experiencesim to real 问题在强化学习中被广泛研究，目前主要有以下几种研究方向：系统辨识（system identification）、领域适应（domain adaption）、参数随机化（pa.

2021-12-28 21:31:11 1357 1

原创 mujoco环境变量报错：Missing path to your environment variable.

mujoco在ubuntu终端可以运行，但是在pycharm中无法正常运行，会报错：此时需要在pycharm环境中手动加入环境变量：然后就可以成功在pycharm里面运行mujoco程序了！

2021-12-23 16:44:10 1050

原创图数据链接汇总

收集一些图数据集收集一些常用的图数据集，包括生物医学、推荐系统、社交网络、电子商务等领域的数据。OGB数据集的排名表单图网络数据集

2021-12-20 12:37:55 159

原创【剑指Offer刷题】——两个链表的第一个公共节点（52）

Leetcode刷题地址：https://leetcode-cn.com/problemset/lcof/题目输入两个链表，找出它们的第一个公共节点。如下面的两个链表：在节点 c1 开始相交。示例 1：输入：intersectVal = 8, listA = [4,1,8,4,5], listB = [5,0,1,8,4,5], skipA= 2, skipB = 3 输出：Reference of the node with value = 8 输入解释：相交节点的值为 8 （注意.

2021-03-14 16:43:35 88

原创【图神经网络】——“斯坦福CS224W”课程笔记（三）

Motifs and structural Roles in Networks本节课主要讨论子图分解在图分析中的重要作用。1 简介图可以看作是由许多子图（subgraph）构建而成的。这些子图能够刻画和区分不同的图。例如下面这个电路图可以分解为许多子图。有一些固定的子图结构，这些子图反应了某种特殊的结构特征，因此我们需要了解和熟悉它们。这里列举了13种包含3个结点的有向子图（非同构的）。我们用一个“重要性”系数来表示某个子图在一个图中出现的频率程度（后面会有严格定义）。如果是正数表明出现频.

2021-03-07 17:02:37 1643

原创【剑指Offer刷题】——复杂链表的复制（35）

Leetcode刷题地址：https://leetcode-cn.com/problemset/lcof/题目Solution 1哈希node和index，比较愚蠢。。。主要思路是两次遍历链表，用一个map存储每一个结点指针对应的index。第二次遍历时向前或向后增加到对应的index，然后更新random指针。时间：O(n + n * n/2) -> O(n^2)；空间：O(n)。Node* copyRandomList(Node* head) { if (!head) r.

2021-03-03 23:06:28 122 2

原创【剑指Offer刷题】——合并两个排序的链表（25）

Solution 1以其中一个链表作为基准链表，和另一个链表每个元素一一比较，在合适的位置修改指针，最终返回第一个链表。时间：O(n1 + n2)，其中n1和n2分别代表两个链表的长度；空间：O(1)ListNode* mergeTwoLists(ListNode* l1, ListNode* l2) { if (!l1) return l2; else if (!l2) return l1; ListNode* first = l1; ListNode*

2021-03-03 09:38:48 89

原创【死磕Python】——详解hash和eq的用法

当我们面对这样一个场景时，我们自定义了一个类，并从该类构建了很多对象，并且将该对象作为一个dict的key来使用，如以下所示。d = dict()t1 = TwoCommunity({"1", "2"}, {"3", "4"})t2 = TwoCommunity({"1", "2"}, {"3", "4"})d.setdefault(t1, 1.2)if d.get(t2): print(d.get(t2))其中类TwoCommunity定义如下。其中comi和comj为一个set，其

2021-03-01 19:50:54 649 1

原创【剑指Offer刷题】——反转链表（24）

Leetcode刷题地址：https://leetcode-cn.com/problemset/lcof/题目定义一个函数，输入一个链表的头节点，反转该链表并输出反转后链表的头节点。示例:输入: 1->2->3->4->5->NULL输出: 5->4->3->2->1->NULL限制：0 <= 节点个数 <= 5000Solution 1将链表每个节点的指针存入一个数组，然后逆序调整每个指针的next指向。.

2021-02-25 19:59:19 94

原创【剑指Offer刷题】——链表中倒数第k个节点（22）

Leetcode刷题地址：https://leetcode-cn.com/problemset/lcof/题目输入一个链表，输出该链表中倒数第k个节点。为了符合大多数人的习惯，本题从1开始计数，即链表的尾节点是倒数第1个节点。例如，一个链表有 6 个节点，从头节点开始，它们的值依次是 1、2、3、4、5、6。这个链表的倒数第 3 个节点是值为 4 的节点。示例：给定一个链表: 1->2->3->4->5, 和 k = 2.返回链表 4->5.Solutio.

2021-02-24 20:42:55 70

原创【剑指Offer刷题】——数组中重复的数字（03）

Leetcode刷题地址：https://leetcode-cn.com/problemset/lcof/Solution 1排序再比较。int findRepeatNumber(vector<int>& nums) { sort(nums.begin(), nums.end()); for (int i=0; i<nums.size()-1; i++) { if (nums[i] == nums[i+1]) return nums[i];.

2021-02-23 21:06:40 73

原创【图神经网络】——“斯坦福CS224W”课程笔记（二）

本文是我在学习斯坦福大学2019年秋季课程 “图机器学习”（图神经网络）时所记录的笔记。课程资源如下列出，其中slides都可在官网找到；另斯坦福CS224w课程的学生记录了部分笔记在github上开源，可以作为学习参考。官网：http://snap.stanford.edu/class/cs224w-2019/课程视频：http://snap.stanford.edu/class/cs224w-videos-2019/课程笔记（英文）：https://snap-stanford.github.i

2021-02-15 09:22:45 890 1

原创【死磕Python】——Python处理时间的利器【datetime】

在python编程中我们常常需要处理时间和日期信息，例如需要获取当前时间、生成特定字符串格式的时间信息等等。python为我们提供了一个现成的标准库——datetime，内置了许多有用的类和函数，现整理如下。1 datetime标准库datetime库中有一个同名的类——datetime类，采用该类可以做很多工作。timestamp时间戳。首先我们要了解日期和时间在计算机中是如何表示的。我们看到的日期都是像xxxx年xx月xx日的形式，但在计算机中并不是以这种字符串的形式来存储时间的。而是以一种非常

2021-02-05 16:14:03 222

qq_41614419的博客

原创【论文】Data-efficient Domain Randomization with Bayesian Optimization

原创【论文】Active Domain Randomizatio

原创《结构信息论》——结构信息论Ⅰ：信息处理的数学原理

原创【图神经网络】——“斯坦福CS224W”课程笔记（附1）

原创频繁模式挖掘——概述

原创【论文】Closing the Sim-to-Real Loop: Adapting Simulation Randomization with Real World Experience

原创 mujoco环境变量报错：Missing path to your environment variable.

原创图数据链接汇总

原创【剑指Offer刷题】——两个链表的第一个公共节点（52）

原创【图神经网络】——“斯坦福CS224W”课程笔记（三）

原创【剑指Offer刷题】——复杂链表的复制（35）

原创【剑指Offer刷题】——合并两个排序的链表（25）

原创【死磕Python】——详解hash和eq的用法

原创【剑指Offer刷题】——反转链表（24）

原创【剑指Offer刷题】——链表中倒数第k个节点（22）

原创【剑指Offer刷题】——数组中重复的数字（03）

原创【图神经网络】——“斯坦福CS224W”课程笔记（二）

原创【死磕Python】——Python处理时间的利器【datetime】

原创【图神经网络】——“斯坦福CS224W”课程笔记（一）

原创《量子纠缠：从量子物质态到深度学习》学习笔记

原创吴恩达ML课程笔记总结（二）—— 单变量线性回归

原创吴恩达ML课程笔记总结（五）——logistic 回归

原创吴恩达ML课程笔记总结（四）——多变量线性回归

原创吴恩达ML课程笔记总结（一）

斯坦福_图机器学习_CS224W_课程讲义.zip

网络爬虫入门程序示例

MSP-EXP430F5529

空空如也