自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 收藏
  • 关注

原创 强化学习DQN系列小结

文章目录DQN前言基本模型DQN数学记号公式推导算法流程Nature DQN优化思想算法流程三大优化Double DQN优化思想算法流程Dueling DQN优化思想Prioritized Replay DQN优化思想总结参考文献DQN前言DQN 作为 value-based 的强化学习方法,擅长处理离散情境下的强化学习问题。其本质是 deep learning 版本的 Q-learning,所以其基本模型和 Q-learning 类似,基于TD时间差分设置目标函数,并 ϵ−greedy\epsilo

2021-02-22 16:36:43 585 4

原创 Breif Introduction for Reinforcement Learning (Background Info)

文章目录Breif Introduction for Reinforcement Learning (UPDATING)Markov ChainMarkov Decision ProcessValue function: Bellman EquationBasic SolutionsDynamic Programming (?)Policy IterationValue IterationPros andc ConsMonte CarloMonte Carlo Policy EvalutionMote Ca

2021-01-18 16:57:01 326

原创 手搓编译器(1)——词法分析器

文章目录词法分析器字符处理注释及字符串预处理词法分析器词法分析器的实现参考了 cppreference翻译阶段词法分析分为以下几个阶段字符处理注释及字符串预处理符号处理字符处理为了解决转义字符可能对编译产生的影响,所以先进行一次处理,只保留如下四类字符保留10个数字字符(0-9)26个小写字母(a-z),26个大写字母(A-Z)29个标点字符 _ { } [ ] # ( ) < > % : ; . ? * + - / ^ & | ~ ! = , \ " '换

2020-10-20 16:07:17 735

原创 Replay:The 2016 ICPC Shenyang Regional Contest (Training)

ABCDEFGHIJKLM[2016 Shenyang] 2020/9/10⭕⭕⭕⭕⭕ReplayAsolved by sanshuiii 0:03 (+)签到Bsolved by sanshuiii 0:06 (+)签到Csolved by sanshuiii && idyllic && DexHxr 1:49 (+)矩阵快速幂Esolved by sanshuiii 3:27...

2020-09-26 22:11:32 151

原创 Replay:The 2017 ICPC Shenyang Regional Contest (Training)

ABCDEFGHIJKLM2017 Shenyang 2020/9/10⭕⭕⭕⭕⭕⭕ReplayFsolved by idyllic 0:58 (-1)找规律打表Gsolved by sanshuiii 3:03 (-7)基环树上倍增做字符串哈希,log比较字符串长度Isolved by idyllic 0:14 (+)Ksolved by DexHxr 0:15 (+)Lsolved by DexHxr 1...

2020-09-26 22:06:31 147

原创 Replay:The 2020 CCPC Preliminary Online

ABCDEFGHIJKLM2020 CCPC Preliminary 2020/9/20⭕⭕⭕⭕⭕⭕Replay:Bsolved by sanshuiii. 1:15 (1 try)人均Min25Csolved by sanshuiii. 0:18 (1 try)签到,简单讨论即可Esolved by sanshuiii. 2:40 (9 try)multi-nim模型,因数分解后变成NIM和,用pollard-r...

2020-09-22 12:13:09 167

原创 Replay:The 2018 ICPC Asia-East Continent Final Contest (Training)

ABCDEFGHIJKL2018 EC FINAL 2020/9/15⭕⭕⭕⭕⭕Replay:Csolved by sanshuiii. 4:50 (10 tries)枚举平方因子,判断模平方因子的余数,CRT求出所有可能的结果,然后暴力算200位看是否匹配被卡常了,hxr预判断0的数量超过某个阈值的时候直接认为不合法,成功卡过Dsolved by sanshuiii. 0:07 (1 try)签到Fsolved by...

2020-09-22 12:02:26 143

原创 Replay:The 2017 ICPC Hongkong Regional Contest (Training)

ABCDEFGHIJK2017 Hongkong 2020/9/15⭕⭕⭕⭕⭕⭕⭕⭕Replay:Asolved by sanshuiii . 1:46 (1 try)从小到大枚举x,从大到小枚举y,双指针,复杂度 O(n)O(n)O(n) ; 高精度用py解决Bsolved by DexHxr . 2:18 (3 tries)扫描线Csolved by sanshuiii. 3:34 (1 try)枚举旋转和翻折判断关...

2020-09-16 20:43:25 125

原创 Replay:The 2019 ICPC Nanjing Regional Contest (Training)

11

2020-09-12 14:50:20 282

原创 Replay:The 2018 ICPC Shenyang Regional Contest (Training)

11

2020-09-12 14:47:50 109

原创 Replay:The 2019 ICPC Asia-East Continent Final Contest (Training)

ABCDEFGHIJKLM2019 EC FINAL (2020/9/9)⭕✔⭕✔⭕✔⭕✔⭕Replay:Asolved by sanshuiii. 0:07(1 try)枚举中点直接得到解析解,复杂度 O(mn)O(mn)O(mn)Bupsolved by idyllicCsolved by idyllic. 3:11 (1 try)发现模p意义下迪利克雷卷积有着类似于数论意义下费马小定理的性质,直接求 inv(k...

2020-09-10 12:38:33 193 1

原创 训练记录

ABCDEFGHIJKLM2019 EC FINAL12345678910111213

2020-09-09 12:25:29 128

原创 成为组合博弈master之路——SG和他们好朋友们

文章目录成为组合博弈master之路引言组合博弈定义第一个实例:Bash Game题目描述题目分析题目解法基本解法必胜态,必败态NP局势动态规划/拓扑排序NIM和——SG函数第二个实例:[nim游戏]题目描述题目分析题目解法SG定理SG函数求解NIM游戏与游戏和NIM积——高维NIM游戏第三个实例:[Switch lights]题目描述题目分析题目解决高维NIM积SG的变体形式ANTI-SG(SJ)MULTI-SG异常边界:一个子游戏获胜就获胜一些常见的非典型单游戏组合博弈形式举例阶梯博弈威佐夫博弈结语引用

2020-07-16 13:50:54 316

原创 NLP笔记 CS224n (6) —— RNN 和 Language Model

传送门笔者在总结时跳过了第3,4,5节课。其中第3,4节课分别介绍了神经网络和反向传播,笔者假定读者有着基本的机器学习和神经网络相关的知识,所以掠过了这两章内容。其中第5节课介绍了语法结构,但是因为与笔者目前方向不一致,故略去。本节为第6节课,介绍了Language Model并且以此为契机引入了RNN模型。Language Model 语言模型天气预报说今天下雨,所以出门要________语言模型要做的事情,就是给出一段文字,由模型生成其后的内容。语言模型是NLP领域内一个bench mark

2020-07-06 21:04:04 173

原创 NLP笔记 CS224n (2) —— 词向量与词传感器

传送门Word2VecOptimization梯度下降,随机梯度下降。实质上是无监督学习,每个batch的最小单位可以是一组word2word的映射,输入值是一个中心词,输出值是一个其对应的outside词,要学习是从中心词要其对于outside词的映射,训练结束后只需要过程中的隐藏层信息,即词向量。More Detials of Word2Vec一个词要两个向量的原因?为了更容易优化,但是一个也行事后可以对两个向量取平均值两种变种模型Skip Grams 即由中心词预测上下文

2020-07-04 17:48:56 139

原创 NLP笔记 CS224n(1)—— 词向量

词向量NLP 处理文本,所以在进行处理之前,要先解决文本的表示。文本由词组成,本文讨论了表示词汇的几种方案。WordNet这种方法基于如下思想:用词汇的意义来代表词。所以我们可以建立若干个集合,每个集合代表一组同义词,每个词都可以映射到某个集合中,表示这个词汇的意思。其优点在于可以很好的处理词汇之间的联系,即同义词。但是缺点同样明显:忽略了同义词之间的差异,忽略了一词多义性难以迭代更新,忽略词语的新含义基于主观判断需要专家进行手动构造不能准确计算词汇间的相关性Discrete Sym

2020-07-02 16:43:24 155

原创 Codeforces Round #646 F - Rotating Substrings (1363F)

Rotating Substrings题意给定两个等长的字符串 a,ba,ba,b (长度至多2000),对第字符串 aaa 可以做如下操作:将一个字串向右旋转一格,问最少几次操作将其变成 bbb 字符串。观察旋转操作过于丑陋,事实上观察容易发现,对区间 [l,r][l,r][l,r] 旋转,等价于将 ara_rar​ 移到 ala_lal​ 前面,此外没有影响。分析先考虑可行性,显然如果两个字符串各个字符数量不一致则无解,反之一定有解。再分析如何求解最优解。事实上旋转操作可以视为将一个元素挑

2020-06-12 13:40:33 165

原创 成为计算几何master之路——记算法竞赛中常用的计几算法及思想

本文介绍了算法竞赛中常用的计算几何算法及思想,为了力求简单粗暴,部分算法和常见算法在实现和常数上可能有出入,但是在复杂度和正确性上均有保证。

2020-05-08 12:42:38 1875

原创 Nordic Collegiate Programming Contest 2019 部分题解

目录[Nordic Collegiate Programming Contest 2019] 部分题解(FGIK)[Flow Finder]题意分析“界面”重新分析结论Nordic Collegiate Programming Contest 2019 部分题解(FGIK)前言,做国外的比赛感觉好像难度上比国内同时期的比赛要简单一点,但是在这种情况下出线的国内的队伍却不能轻松wf捧杯,感觉有点...

2020-05-03 12:23:48 344

原创 求三点共圆求圆心半径及其推导(三角形外心)

文章目录问题引入问题分析公式推导代码实现例题高维情况三维三角形外心n维度三角形外心问题引入给定二维平面上三个不共线的点 A(x0,y0),B(x1,y1),C(x2,y2)A(x_0,y_0),B(x_1,y_1),C(x_2,y_2)A(x0​,y0​),B(x1​,y1​),C(x2​,y2​), 求出他们形成的圆的圆心和半径。问题分析计算几何问题常用数形结合解决,不妨设圆心 O(x,...

2020-03-24 17:58:50 3228

原创 高维偏序问题降维的有力武器——cdq分治

目录问题引入陌上花开[1]题面分析预备知识偏序和全序问题引入陌上花开1题面若干个元素有三个属性a,b,ca,b,ca,b,c,问多少对数对(i,j)(i,j)(i,j)满足 ai≤aj,bi≤bj,ci≤cja_i\leq a_j , b_i\leq b_j , c_i\leq c_jai​≤aj​,bi​≤bj​,ci​≤cj​分析如此类问题可以视为一个多维偏序问题,偏序即满足自反...

2020-03-22 21:00:53 571

原创 Codeforces Round #610 (Div. 2) 解题报告

1282A - Temporarily unavailable这个题目大家都会写,主要是怎么写比较优美。考虑被覆盖的长度:左端应该是两者左端的较大值;右端应该是两者右端的较小值。如果两者相交不难验证正确性。如果不相交,其值必定为负,也不难验证。于是有答案:∣r1−l1∣−max(0,min(r2,r1)−max(l1,l2))|r_1-l_1|-max(0,min(r_2,r_1)-max(l_...

2019-12-28 21:26:09 414

原创 CodeForces CF #499 Div.2 赛后补题

非常痛苦,在做第一题的时候有一点小问题,结果居然一开始提交过了。。。闭着眼睛锁了题目就去往后做了,结果被hack了,流下痛苦的泪水。赛时真是好水的数据啊。。。A.Stage这就是一道签到题。题意是给你一串长度为N的字符串,要求选取M个组装成一个新的字符串,并且这个新的字符串单调增(’b’&amp;amp;amp;amp;gt;’a’)且字典上相邻的字母不能相邻(’a’后面不能是’b’),求字符串的和最小值,不存在就返回-...

2019-10-05 22:10:03 346 2

原创 新生欢乐红包赛题解

A.EASY0本体考察选手是否会写代码,取模后分类讨论即可。#include<bits/stdc++.h>using namespace std;int main(){ int x; cin>>x; x%=4; if(x==1)cout<<"0 A"<<endl; if(x==3)cout<<"2 A"<<...

2019-08-11 16:21:50 179

原创 Codeforces Round #573 (Div. 2) 解题报告

A.Tokitsukaze and Enhancementhttp://codeforces.com/contest/1191/problem/A本题主要考察选手是否会写代码,穷举即可。#include<bits/stdc++.h>using namespace std;int main(){ int x; cin>>x; x%=4; if(x==1)c...

2019-07-13 13:31:01 116

原创 Codeforces Educational Codeforces Round 67

codeforces Educational Round 67A.Stickers and ToysB.Letters ShopC.Vasya And ArrayD.Subarray SortingE.Tree Painting

2019-07-05 14:40:02 172

原创 Codeforces #562 Div.1解题报告

A.二分+贪心http://codeforces.com/contest/1168/problem/A题目意思是,给你一个n元数组(ai&lt;ma_i&lt;mai​<m),每次操作,你可以任选一些元素,使其+1 再对m取模。问至少多少次操作可以使得这个数列单调不减。先看数据范围,1e5数量级,那么上限是nlogn的算法。不难发现答案满足单调性质,所以我们考虑二分答案...

2019-05-29 16:28:54 141

原创 数学0基础看懂FFT

读这篇文章的前置条件1.了解函数,多项式等概念2.了解复数以及其乘法运算3.会写代码(其实不会的人也不会来看这篇文章?)因为在看其他fft的教程的时候复数读完就不知道在说啥了,读了好多篇又抄了std才大致了解,所以通俗的讲一下fft是啥,主要是确定一下概念,梳理一下思路。一些更基础的内容就不再赘述了,如果遇到不知道复数是什么之类的,那可以看一下其他的教程。什么是FFT法法塔(FFT)全...

2019-03-27 21:28:25 514

原创 tensorflow自定义结构初步

0.摘要对输入值x,标签y,模型参数c,我们希望习得一个最优的Model-c满足y=Model(x,c)。机器学习的任务就是要确定这个Model中的参数。但是因为Model的形状(如层数,节点个数等)是离散的,处理起来相对麻烦,所以我们在这里只讨论可导的参数c(tensorflow的一个优势就在于可以自动求导)。我们希望对于一个确定确定的模型Model,我们要找到这样的c满足c=argmin(l...

2019-01-27 16:18:27 271

原创 python axis参数解析

在遇到形如tf.argmax(logits, axis=-1)的代码时,axis参数的含义非常容易令人疑惑。在二维情形下,axis=0表示求每列的最大值的下标,axis=1表示求每行最大值的下标。但是在更高维度下呢?我们不妨假设数组A满足A.shape=(2,4,8,16),研究A生成的数组(Ax=argmax(A,axis=x))的shape,结果如下表所示:A0.shapeA1....

2019-01-27 13:56:20 903

原创 解不定方程(从HDU1356说起)

传送门:http://acm.hdu.edu.cn/showproblem.php?pid=1356由题意,就是要解一个不定方程ax+by=d,要求(abs(x)+abs(y))最小。一.exgcd先从exgcd说起。由裴蜀定理可知,ax+by=gcd(a,b)必定存在整数解(x,y)。那么有:ax+by=gcd(a,b)=gcd(b,a%b)=bx'+(a%b)y' (1.1)其中...

2018-11-11 14:38:31 476 1

原创 二分专题

B - 连续子段http://poj.org/problem?id=2018先分析问题,要去找平均值最大的字段。显然穷举是会超时的,正面考虑的变量太多,所以我们希望从反面入手,去把他变成一个存在性的问题。那么这个问题就是要找到这样一个ans,满足:其中len为连续区间I的长度,对公式变形得:即:这样我们就把一个动态的len去掉了,对于每一个确定了ans,我们都有一个...

2018-11-05 18:04:24 144

原创 背包问题总结

前几天hxn问我洛谷上一道P2014选课的题目,然后我看着脑子也犯迷糊了,所以重新学习一下《背包九讲》,写个笔记留作纪念。Section I 01背包&amp;amp;amp;完全背包这两种背包非常有意思,01背包的顺序是V…0,而完全背包的顺序是0…V。其背后的原理是,V…0所用的状态都是没有取过当前物品的状态,而0…V所用的状态是可能取过任意个当前物品的状态。所用他们dp的顺序完全相反。01Packi...

2018-11-05 15:01:04 675

原创 POJ #10.27

3264 Balanced Lineuphttp://poj.org/problem?id=3264线段树求区间最值裸题,值得注意的是求最大最小没必要两次去求,因为对于一个确定的区间,无论是求最大值,最小值,区间和,区间平方和还是其他随便什么东西,最终访问到的节点永远是确定的那几个。所以可以用一个全局变量保存所要的答案,然后递归求解就可以了。#include&lt;iostream&gt;...

2018-10-27 11:20:57 115

原创 CodeForces CF #517 Div.2

A. Golden Plate水题,公式都不用推,循环就完事了。http://codeforces.com/contest/1072/problem/Aint n,m,k; cin&amp;amp;amp;gt;&amp;amp;amp;gt;n&amp;amp;amp;gt;&amp;amp;amp;gt;m&amp;amp;amp;gt;&amp;amp;amp;gt;k; int ans=0; while(k--){ ans+=2*n+2

2018-10-25 09:40:16 186

原创 CodeForces CF #508 Div.2

A. Equality http://codeforces.com/contest/1038/problem/Ahash,min,没有其他内容了,滴,签到完成B. Non-Coprime Partition http://codeforces.com/contest/1038/problem/B给你一个数n,希望你把它分成两组,满足两组数各自的和的GCD&gt;1。先看数据规模...

2018-09-10 14:01:07 223

原创 CodeForces CF #503 Div.2

今天继续讲述我的掉分之路=。=A. New Building for SIS给你一个n栋楼,每栋楼高度为h。在对任意x满足a&amp;amp;amp;amp;lt;=x&amp;amp;amp;amp;lt;=b,有在x楼有楼梯,连接相邻的两个楼。然后是k组询问,回答两个坐标之间的最短路径的长度。设两个坐标为(x1,y1),(x2,y2)。这题有点类似于求曼哈顿距离,所以我们把横坐标和纵坐标分开来看。那么对于横坐标而言,距离必定是fabs(...

2018-08-12 12:46:16 264

原创 计算几何-通过叉积判断向量旋转方向

今天刷cf的时候看到一道凸包的裸(其实并不裸)题。但是我发现我不会求凸包,所以我就是学习了一下Graham扫描法。学到一半发现我不会判断向量的旋转方向,于是我又去学习了一下叉乘。作为蒟蒻的我看了半天看不懂,所以我决定写一个连我这样的蒟蒻都能看得懂的便于理解的指北(雾)。先上结论:对于两根向量a(x1,y1),b(x2,y2),如果a X b = x1*y2-x2*y1&amp;amp;gt;0,那么顺时针转,...

2018-08-10 18:16:25 10454 2

原创 Codeforces Round #502 ( Div. 1 + Div. 2)

A.The Rank手速题,给你一堆人的成绩,问你其中第一个人的总分排第几(总分相同按出现顺序排)。那保存第一个人的成绩,先放在第一名,然后后面每有一个成绩比他高的,排名就加一。最后复杂度是O(n)。我手贱,打了个结构体,大家就当没看见。struct stu{ int id,a,b,c,d; } s[1005]; bool operator &amp;gt; (stu x,...

2018-08-09 18:31:09 148

原创 Codeforces Educational Codeforces Round 48

模拟题真实难..呕A.Death Note题意,给你一本书和一个m,每页上可以写m个名字,写满就要翻页。再给你n个数字,第i天要写ai个名字。问你每天各要翻几页?模拟题,没啥好说的。B.Segment Occurrences题意,给你两个字符串s和t。问在s的[l,r]中t出现的次数是多少。又是模拟题,为了方便起见,我们考虑从s中的i位置开始接下来的连续的一串字母是不是和t相同...

2018-08-04 14:57:17 229

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除