自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(108)
  • 收藏
  • 关注

原创 【动画图解微积分笔记】 (一) -1.概述 (附B站视频)

声明:部分内容来自于慕课,公开课等的课件,仅供学习使用。如有问题,请联系删除。部分内容来自电子科技大学,北京大学,清华大学,北航,复旦大学等的教材和课件课程视频: B站视频 https://www.bilibili.com/video/BV1V44y1j7vX概述1. 概述   课是围绕微积分的中心而设计的,函数,极限,导数和积分,既有连续的又有离散的。还会学到它们在工程学,物理,生物和社会科学方面是如何发挥作用的2. 章节 2.1 第一章:函数    在第一章内 我们会学习

2022-02-01 19:04:51 1970

原创 【人工智能学习笔记】 1.1数学分析(一) -3.实数系的连续性与数列极限

声明:部分内容来自于慕课,公开课等的PPT课件,仅供学习使用。如有问题,请联系删除。部分内容来自电子科技大学,北京大学,清华大学,北航等的课件数列极限概念引入:求圆的面积 A1,A2,A3,...,An,...⇒A_1,A_2,A_3,...,A_n,...\RightarrowA1​,A2​,A3​,...,An​,...⇒无穷次逐步逼近过程1.数列定义   按自然数编号依...

2021-01-24 20:38:10 244

原创 【人工智能学习笔记】 1.1数学分析(一) -2.映射与函数

导数   导数是有一些物理的瞬时速度等的应用中抽象出来的,和平均速度对应。   平均速度=ΔsΔt=s(t0+Δt)−s(t0)Δt=v‾\large\frac{\Delta s}{\Delta t}=\frac{s(t_0+\Delta t)-s(t_0)}{\Delta t} =\overline{v}ΔtΔs​=Δts(t0​+Δt)−s(t0​)​=v   瞬时速度=ΔsΔt...

2021-01-24 18:24:11 419

原创 【人工智能学习笔记】 1.1数学分析(一) -1.集合及其运算

集合及其运算   数学以其严谨而富有逻辑性闻名于世,其严谨性在于交代清楚问题,对象,概念以及关系等方方面面的事务。而现代数学最为关键的两个部分就是集合论和公理化,故集合的重要性不言而喻。 集合论诞生于十九世纪创始人是格奥尔格·康托尔德国数学家1845.3.3-1918.1.6集合的概念   在朴素集合论中,不能精确地定义什么是集合。我们只能给出集合的直观描述:具有某种属...

2021-01-24 10:27:25 549

原创 人工智能笔记之专业选修课4.1.5 - 博弈论 11.贝叶斯博弈场景-拍卖,合作博弈论

贝叶斯博弈(Bayesian Games)当我们讲拍卖 auctions时,我们会想到1885年的木刻,它展示了澳大利亚墨尔本的茶叶拍卖。有一个戴着礼帽的人,站在房间的前面,他手里拿着一个木槌,他可能会用一种诙谐的声音说话。在某个时刻,他敲下木槌,某个人赢得了一些茶。不过拍卖是非常现实的东西。...

2020-03-21 17:35:02 680

原创 人工智能笔记之专业选修课4.1.5 - 博弈论 10.博弈学习,虚构博弈简介,无悔学习简介,后悔匹配简介

博弈学习(learning)我们会看学习在重复博弈中的两种学习类型虚构博弈 (fictitious play)无悔学习(no-regret learning) ,尤其是一个算法叫后悔匹配 (regret matching)目前这个话题量非常大首先我们应该认识到在博弈论中的学习,与其他一些学科中的学习是相当不同的。比如 在机器学习,人工智能,计算机科学或者统计学优化中。单个...

2020-03-20 22:32:11 1784

原创 人工智能笔记之专业选修课4.1.5 - 博弈论 9.重复博弈,效用,随机博弈

重复博弈(repeated games)当我们考虑世界上绝大部分互动时,其中很多不止会发生一次市场上的公司 它们与竞争对手活动政治同盟国决定如何与其他国家谈判,它们是否应该有冲突等等朋友,你会交换吗,你会在朋友需要帮助时帮助他们吗?你需要时他们会帮你吗?如果你有对你非常好的朋友,你更有可能回报。像这样的一些东西可能涉及到重复互动。比如工人在日复一日的团队生产中,你需...

2020-03-20 20:58:22 727

原创 人工智能笔记之专业选修课4.1.5 - 博弈论 8.完全信息扩展式博弈,子博弈

完全信息扩展式博弈perfect information extensive-form games是一种涉及时间的博弈。

2020-03-20 19:23:35 360

原创 人工智能笔记之专业选修课4.1.5 - 博弈论 7.极大极小策略,相关均衡

极大极小策略MAXMIN strategies在零和博弈的背景下特别有意义。实际上对所有博弈都会很有意义。简单地说,是参与者在假设其他参与者要给他难堪下,最大化他们的回报。更为一般地定义极大极小策略是:最大化我最坏情况下结果的一个策略。极大极小值或安全水平,就是极大极小策略保证的回报the maxmin strategy, is a strategy that maximizes m...

2020-03-19 21:31:50 2872 1

原创 人工智能笔记之专业选修课4.1.5 - 博弈论 6.严格劣势策略

严格劣势策略 strictly dominated strategies在稳定性和预测上analyzing games in terms of stability, in terms of predicting. ,人们可以想到各种不同的方式来分析博弈。而人们会做什么,遵循什么逻辑是分析博弈的另一个重要方式, 也能给我们一些洞见。核心思想是当我们考虑博弈论里的理性时,基本的前提为:人们总是希望...

2020-03-19 20:20:38 1976

原创 人工智能笔记之专业选修课4.1.5 - 博弈论 5.计算纳什均衡难点,复杂度层级,Lemke-Howson算法,PPAD

计算纳什均衡难点compute a Nash equilibrium纳什均衡早期历史:1928年约翰·冯·诺依曼 (John von Neumann),现代博弈论的奠基人之一:研究证明了零和博弈 (zero sum game) 中存在纳什均衡。在证明过程中 他使用了布劳威尔不动点定理需要用到在线性规划中计算不动点的算法一个是但泽 (Danzig) 的算法,相当于我们现...

2020-03-19 16:42:19 3714

原创 人工智能笔记之专业选修课4.1.5 - 博弈论 4.占优,帕累托最优理论,混合策略

占优帕累托最优理论帕累托最优的定义经典博弈中的帕累托最优混合策略:

2020-03-17 13:54:53 458

原创 人工智能笔记之专业选修课4.1.5 - 博弈论 3.纳什均衡

纳什均衡分析凯恩斯的选美比赛博弈每个玩家都选择1到100之间的一个整数然后你有一群参与者那个选择的整数最接近平均数的2/3的人赢得这个比赛其余人一无所得平局会按均匀分布随机确定胜者策略推理第一次游戏第二次游戏纳什均衡总结纳什均衡最优反应假设你是博弈中的一位参与者,并假设你知道其他参与者的策略,那我们可以选择对你来说最好的。这个行动就是最优回应...

2020-03-17 08:27:01 641

原创 人工智能笔记之专业选修课4.1.5 - 博弈论 2.经典囚徒困境等经典博弈场景

经典囚徒困境两个囚徒 选择合作或不合作?不合作被称为背叛(defect)如果他们合作 他们得到结果A如果都背叛 他们会得到另一个结果D 不过A比D更优然而如果他们合作失败 其中一方选择合作 一方背叛那么选择合作的人得到最差的结果而背叛的人得到可能的最优结果博弈竞争模型是一个概念非常清晰的纯粹竞争例子在这个情况中 只有两个参与者 两个参与者的收益是互补的因而 他们通常加起...

2020-03-16 21:46:59 461

原创 人工智能笔记之专业选修课4.1.5 - 博弈论 1.退避机制,博弈基本概念,重要元素,形式

博弈论博弈论研究的是两位自利者的策略性互动。博弈论在经济学,计算机科学 ,政治学,心理学以及其他学科都非常重要。同时考虑这些互动如何为一些人所结构化,是为是计算机体系获取更好的收益。Backoff GameTCP协议中的退避机制 (backoff mechanisn)...

2020-03-16 20:50:03 809 1

原创 人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 9.社交网络,社区

社交网络社区:社交网络中的一个重要问题是识别“社区”。社区是指具有非同寻常的强连通性的节点子集(节点可以是构成网络的人或其他实体)。把社交网络看成图,称为社会图 social graph网络和社区目标:聚类局部性 locality:指社会网络的节点和边趋向于聚为社区的这种性质。社会网络的基本特点:(1)一大堆试题参与了网络的构成。(2)网络实体之间至少存在一种关系。(3)对于...

2020-03-05 21:11:43 328

原创 人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 8.推荐系统,大数据注意事项

推荐系统分类基于内容的系统(Content-Based System) 目前的主流这类系统主要考察的是推荐项的性质。例如,如果一个用户观看了同一类型的电影的多部电影,那么系统就会将数据库中的同一类型的电影推荐给该用户。协同过滤系统(Collaborative Filtering System) 目前的主流这类系统通过计算用户或/和项之间的相似度来推荐项。与某用户相似的用户所...

2020-03-05 14:58:30 215

原创 人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 7.在线算法,贪心算法,完美匹配

在线算法on-line在线on-line 算法通常会包含一个“贪心算法”(greedy)的方法算法的工作流程:一开始先进行离线 off-line 算法首先,将算法所需要的所有数据准备好然后,算法以任意次序访问数据最后,算法输出结果然而很多情况下并不能获取全部的的数据,举个极端的例子,我们必须在每个流元素到达之后就以输出方式对查询进行应答。于是我们必须在对将来...

2020-03-05 13:04:49 297

原创 人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 6.聚类,K-Means++

聚类 clustering点,空间和距离点(point) 集是一种适合于聚类的数据集,每个点都是某空间下的对象能够进行聚类的所有空间下都有一个距离测度(distance metices),即给出空间下任意两点的距离.聚类方法层次结构 Hierarchical::凝聚式 Agglomerative(自下而上 bottom up)):最初,每个点都是一个群集反复结合“最...

2020-03-04 22:14:14 209

原创 人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 5.PageRank技术

PageRank技术使用PageRank技术可以用来对抗词项作弊(term spam)。问题:词项作弊。是一种欺骗搜索引擎让其相信一个本来不相关的页面,使其排名靠前的技术。解决方案:使用PageRank技术来模拟web冲浪者的行为,这些冲浪者从随机页面出发,每次从当前页面随机选择出链前行,该过程可以迭代多次。最终,这些冲浪者会在页面上汇合。较多冲浪者访问的网页重要性被认为高于那些高于那些较少...

2020-03-04 21:09:23 408

原创 人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 4.概念(分组和聚合,Jaccard,分布式文件系统,距离测度)

分组和聚合Group and Aggregation给定关系R,分组是指按照属性集合(分组属性)G中值对元祖进行分割。然后对每个组的值按照某些其他属性进行聚合。通常允许的聚合运算包括SUM,COUNT,AVG,MIN和MAX,每个运算的意义都非常明显。MIN和MAX运算要求聚合的属性类型必须具有可比性,如数字或者字符串类型,而SUM和AVG则要求属性的类型能够进行算数运算。关系R上的分组-聚...

2020-03-04 14:36:19 243

原创 人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 3.关联规则,频繁项集

关联规则探索目标:确定同时购买的几样物品方法:处理通过以下渠道收集的销售数据条形码扫描仪以查找依赖关系经典法则:如果有人购买尿布和牛奶,那么他/她就可能买啤酒如果在尿布旁边发现六包,不要感到惊讶!定义频繁项集 frequent itemsets关联规则 Association rules::信心,支持,兴趣用于查找频繁项集 frequent itemsets的算法...

2020-03-04 10:45:31 210

原创 人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 2.大规模计算介绍,MapReduce介绍,Spark介绍

数据挖掘的大规模计算商品硬件问题挑战:您如何分配计算?我们怎样才能使分布式的编写变得容易程式?机器故障:一台服务器可以使用3年(1,000天)如果您有1,000台服务器,则预计每天1台存在问题使用1M机器,每天有1000台机器发生故障!问题和解决方案问题:通过网络复制数据需要时间理念:将计算带入数据多次存储文件以提高可靠性Spark / Hadoop解决了...

2020-03-03 22:32:07 146

原创 人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 1.介绍

数据挖掘数据包含价值(value)和知识,而我们要做的事就是要提取知识数据需要三部分:1.存储(系统课程)2.管理(数据库课程)3.分析数据 ANALYZED (此数据挖掘课程的目标)数据挖掘 ≈ 大数据 ≈ 预测分析 ≈ 数据科学 ≈ 机器学习Data Mining ≈ Big Data ≈ Predictive Analytics ≈ Data Science ≈ Machi...

2020-03-03 13:30:02 402

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 12.无模型预测,蒙特卡罗强化学习

无模型预测Model-Free Prediction蒙特卡罗强化学习Monte-Carlo Reinforcement Learning从经历完整的经验序列来估计状态值 MC methods learn directly from episodes of experience无模型,不清楚MDP的状态转移和奖励MC is model-free: no knowledge of MDP...

2020-03-02 21:58:45 181

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 11.价值迭代,预测和控制问题解决方案汇总

最优化原则Principle of Optimality价值迭代的定义Value Iteration反复的迭代的过程。最短路径的例子此类情况是在不知道终点在哪儿的情况。 从初始状态0开始出发,逐步扩散迭代直到找到最短路径。预测和控制问题解决方案汇总...

2020-03-02 20:22:25 182

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 10.策略评估,策略迭代

策略评估 Policy Evaluation问题:评估策略π\piπ Problem: evaluate a given policy π\piπ解决方案:贝尔曼期望的迭代应用 Solution: iterative application of Bellman expectation backupv1→v2→...→vπv_1 → v_2 → ... → v_\piv1​→v2​→......

2020-03-02 12:45:59 226

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 9.动态编程概述,动态规划

动态规划Planning by Dynamic Programming定义动态: 时间或者顺序方面的特性。意味着可以一步步的进行Dynamic sequential or temporal component to the problemsuch as step by step编程:像数学家一样优化线性问题Programming optimising a “program”, i.e...

2020-03-02 11:05:27 245

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 8.最优价值函数,最佳策略

最优价值函数最优状态价值函数v∗(s)v_*(s)v∗​(s) optimal state-value function是所有状态价值函数中的最大值最优行动价值函数q∗(s,a)q_*(s,a)q∗​(s,a) optimal action-value function是所有行动价值函数中的最大值最佳策略如何寻找到最佳策略:学生MDP例子中的最佳策略...

2020-03-01 23:56:22 867 1

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 7.马尔科夫决策过程

马尔科夫决策过程Markov Decision ProcessMDP加入行动action 后,才可以用于实施决策。A Markov decision process (MDP) is a Markov reward process with decisions. It is an environment in which all states are Markov定义是一个<S,...

2020-03-01 23:28:10 192

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 6.马尔科夫奖励过程

马尔科夫奖励过程Markov Reward Process可以视为带有value function 价值判断的过程由一个<S,P,R,γ><S,P, R, \gamma ><S,P,R,γ>元组tuple构成R:是奖励函数 Rs=E[Rt+1∣St=s]R_s = \mathbb{E} [R_{t+1} | S_t = s]Rs​=E[Rt+1​∣St​...

2020-03-01 20:51:11 300

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 5.马尔科夫过程

马尔科夫决策过程Markov Decision Processes(MDP)MDP被描述成一个针对于强化学习的环境 Markov decision processes formally describe an environment for reinforcement learning完全可观察环境,我们在一个已知状态下 Where the environment is fully ...

2020-03-01 14:22:07 362

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 4.智能体分类,规划,预测和控制等简介

智能体分类Categorizing RL agents基于价值 Value BasedNo Policy (Implicit)Value Function基于行动决策 Policy BasedPolicyNo Value Function结合价值和行动决策 Actor CriticPolicyValue Function无模型 Model Fr...

2020-02-29 23:46:54 187

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 3.行动决策,价值函数,模型,迷宫问题

行动决策 policy行动决策 A policy is the agent’s behaviour是状态到行动的映射 It is a map from state to action, e.g.选择的决策 Deterministic policy: a=π(s)a = \pi(s)a=π(s)随机的解决 Stochastic policy:π(a∣s)=P[At=a∣St=s]\pi (...

2020-02-29 23:05:54 192

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 2.状态,智能体的组件

状态 state:State is the information used to determine what happens nextFormally, state is a function of the history:状态state则是关于历史记录history的函数St=f(Ht)S_t =f(H_t)St​=f(Ht​)状态有三种定义:1.environment ...

2020-02-29 21:10:50 364 1

原创 人工智能教程 - 专业选修课程4.3.5 - 强化学习 1.强化学习简介,三要素,历史记录

强化学习简介Reinforcement learning强化学习是多学科交叉的学科机器学习最优化控制奖励系统条件作用以及条件反射实验离散数学博弈论效用理论和有限理论强化学习和其他机器学习范式有什么区别?What makes reinforcement learning different from other machine learning paradigms?1.强...

2020-02-29 15:44:40 631

原创 人工智能教程 - 学科基础课程2.6 - 机器学习导论 18.大规模机器学习,高性能计算方法,在线学习机制简介

大规模机器学习large scale machine learning在机器学习中,决定因素往往不是算法最优,而是谁的训练数据最多。得到一个高性能的机器学习系统的最佳途径,如果你采用低偏差的学习算法,并进行大量的数据进行训练...

2020-02-28 23:12:35 173

原创 人工智能教程 - 学科基础课程2.6 - 机器学习导论 17.协同改进过滤算法,均值归一化

协同改进过滤算法将会把 x 和 θ\thetaθ 初始化为小的随机值。用梯度下降或者其他的高级优化算法把这个代价函数最小化。用一个具有一些参数 θ\thetaθ 的用户,以及一部学习得到的特征 x的电影,来预测该用户给电影的评分。向量化实现协同过滤算法也叫做 低秩矩阵分解 low rank matrix factorization均值归一化Mean normalizat...

2020-02-28 19:35:12 129

原创 人工智能教程 - 学科基础课程2.6 - 机器学习导论 16.推荐系统,基于内容推荐算法,协同过滤

推荐系统是机器学习中的一个重要的应用。推荐系统的特征对于学习算法的性能有很大的影响。预测电影评分例子:有 5 部电影和 4 个用户,要求用户为电影打分。基于内容的推荐算法content based recommendations每部电影都有两个特征x1,x2x_1,x_2x1​,x2​可以根据特征和参数,生成空缺值的预测值...

2020-02-28 18:29:36 197

原创 人工智能教程 - 学科基础课程2.6 - 机器学习导论 15.异常检测,密度估计,高斯分布,算法,实数评价法

异常检测Anomaly detection举个飞机制造厂商的例子其实类似于生产线的QA 质量控制测试密度估计小于阈值,异常点大于阈值,正常应用较为广泛的实际上有欺诈异常检测,也有制造业欺诈高斯分布 Gaussian distribution也叫正态分布 normal distribution方差 variance高斯分布例子参数估计样本的密度估计dens...

2020-02-28 10:29:50 202

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除