4 nudt_oys

尚未进行身份认证

An AC a day,keeps WA away~

等级
博文 280
排名 1w+

AdaBoost算法原理及实现

AdaBoost算法输入:训练数据集T={(x1,y1),(x2,y2),…,(xN,yN)}T={(x1,y1),(x2,y2),…,(xN,yN)}T=\{(x_1,y_1),(x_2,y_2),\dots,(x_N,y_N)\},其中xi∈X⊆Rnxi∈X⊆Rnx_i\in\mathcal{X}\subseteq\mathbb{R}^n,yi∈{−1,+1}yi∈{−1,+1}y_...

2018-07-14 17:57:42

K-Means算法及Python实现

聚类是一种无监督学习,它将相似的对象划分到同一个簇中。通过这样的划分,每个簇可能对应一些潜在的类别。例如,西瓜可以被划分为“深色瓜”、“浅色瓜”、“有籽瓜”和“无籽瓜”等,这些概念对于聚类算法而言事先是未知的。基于不同的学习策略,人们设计出很多类型的聚类算法,下面我们主要介绍K-Means聚类算法并使用Python实现它。相似度计算前面提到,聚类算法视图将相似的对象归为同一簇,不相似的...

2018-06-17 16:54:33

Kaggle入门之房屋价格预测

房价预测:高级回归技术竞赛描述要求一个购房者描述心目中的好房子,他们可能不会从地下室的高度或者与铁路的远近开始说起。这个训练赛的数据集证明,价格谈判比卧室或栅栏数量更重要。数据集中共有79个解释性变量描述了住宅的每一个方面,比赛要求是对每个房子的最终价格进行预测。第一步:检查源数据集首先引用numpy、pandas等必要模块,然后通过pandas的read_csv函数读入训练数据和

2018-01-17 15:22:07

Logistic Regression原理及Python实现

1.问题引入相信大家都接触过分类问题,尤其是二元分类。例如现在有一些患者(训练集)的身体情况以及是否患有心脏病的数据,要求我们根据这些数据来预测其他患者(测试集)是否患有心脏病。这是比较简单的一个二元分类问题,使用线性分类器或许会取得不错的效果。但在实际生活中,我们感兴趣的往往不是其他患者是否会犯病,而是他犯心脏病的概率是多少。很直观的想法是收集患者犯病的概率,然后利用回归模型进行概率预测。但是我

2018-01-03 21:12:05

10行代码实现线性回归

1.基本形式给定由dd个属性描述的示例x=(x1;x2;...;xd)\mathbf{x}=(x_1;x_2;...;x_d),其中xix_i是x\mathbf{x}在第ii个属性上的取值,线性模型试图学得一个通过属性的线性组合来进行预测的函数,即:f(x)=w1x1+w2x2+...+wdxd+bf(\mathbf{x})=w_1x_1+w_2x_2+...+w_dx_

2017-12-21 20:29:11

《机器学习基石》课程笔记(4)

LearningisImpossible?考虑如下二元分类的例子:给出5条数据,设计一个算法找出一个g∈Hg\inH并且所有的g(xn)=yng(\mathbf{x}_n)=y_n,并且说明gg和理想的那个ff是否近似。既然输入xn\mathbf{x}_n有3个维度,那么输入一共只有8种情况,而输出有2种情况,一共有28=2562^8=256种输入输出组合。我们可以找到一些h∈H

2017-12-20 11:11:11

Kaggle入门之泰坦尼克号生还率预测

这是Kaggle上的一道入门题目,旨在让我们了解机器学习的大致过程。题目链接:Titanic:MachineLearningfromDisaster题目大意:当年泰坦尼克号的沉没造成了很多人的死亡,救生艇不足是造成如此多人死亡的主要原因。尽管能否活下来要看运气,但是有些群体的存活概率比其他人更高。现在给出一些乘客的信息,包括他最后是否生还。根据这些信息,我们要对其他乘客是否生还进行预测。

2017-12-17 16:33:20

NumPy基础:数组和矢量计算

NumPy(NumericalPython的简称)是高性能科学计算和数据分析的基础包。它的部分功能如下:-ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组-用于对整组数据进行快速运算的标准数学函数(无需编写循环)-用于读写磁盘数据的工具以及用于操作内存映射文件的工具-线性代数、随机数生成以及傅里叶变换功能-用于集成由C、C++、F

2017-12-11 17:56:13

CCF CSP 2014年12月第2题 Z字型扫描(模拟水题)

问题描述试题编号:201412-2试题名称:Z字形扫描时间限制:2.0s内存限制:256.0MB问题描述:问题描述  在图像编码的算法中,需要将一个给定的方形矩阵进行Z字形扫描(ZigzagScan)。给定一个n×n的矩阵,Z字形扫描的过程如下图所示:  对

2017-12-02 10:51:17

CCF CSP 2016年12月第2题 工资计算 (模拟 || 打表)

问题描述试题编号:201612-2试题名称:工资计算时间限制:1.0s内存限制:256.0MB问题描述:问题描述  小明的公司每个月给小明发工资,而小明拿到的工资为交完个人所得税之后的工资。假设他一个月的税前工资(扣除五险一金后、未扣税前的工资)为S元,则他应交的个人

2017-11-14 20:56:19

CCF CSP 2015年12月第3题 画图 (模拟+DFS或BFS)

问题描述试题编号:201512-3试题名称:画图时间限制:1.0s内存限制:256.0MB问题描述:问题描述  用ASCII字符来画图是一件有趣的事情,并形成了一门被称为ASCIIArt的艺术。例如,下图是用ASCII字符画出来的CSPRO字样。

2017-11-11 18:44:13

CCF CSP 2016年04月第4题 游戏 (BFS)

问题描述试题编号:201604-4试题名称:游戏时间限制:1.0s内存限制:256.0MB问题描述:问题描述  小明在玩一个电脑游戏,游戏在一个n×m的方格图上进行,小明控制的角色开始的时候站在第一行第一列,目标是前往第n行第m列。  方格图上有一些方格是始终安全

2017-11-08 22:09:24

LeetCode 399 Evaluate Division(BFS)

Equationsaregivenintheformat A/B=k,where A and B arevariablesrepresentedasstrings,and k isarealnumber(floatingpointnumber).Givensomequeries,returntheanswers.Iftheansw

2017-11-07 17:43:31

《机器学习基石》课程笔记(2)

PerceptronHypothesisSet对于银行是否发送信用卡的问题,把每位顾客的年龄、年收入等特征看成一个向量x=(x1,x2,...xd)\mathbf{x}=(x_1,x_2,...x_d),计算顾客每个特征与权重的乘积之和,如果结果大于某个阈值(threshold),那么就发送信用卡,否则不发送信用卡。根据以上的信息,我们就可以得到一个线性形式的hh,它属于假设集合

2017-11-05 20:30:20

《机器学习基石》课程笔记(3)

LearningwithDifferentOutputSpaceYY输出空间实际应用二元分类Y={−1,+1}Y=\{-1,+1\}信用卡分发或不分发、识别垃圾邮件和非垃圾邮件、病人有病或没病、广告是否盈利、答案是否正确多元分类Y={1,2,3,...,K}Y=\{1,2,3,...,K\}手写字体分类、图片识别、垃圾邮件更详细的分类回归Y=RY=

2017-11-04 15:50:41

CCF CSP 2016年9月第3题 炉石传说(模拟)

问题描述试题编号:201609-3试题名称:炉石传说时间限制:1.0s内存限制:256.0MB问题描述:问题描述  《炉石传说:魔兽英雄传》(Hearthstone:HeroesofWarcraft,简称炉石传说)是暴雪娱乐开发的一款集换式卡牌游戏(如下图所示)

2017-11-01 20:27:19

LeetCode 146 LRU Cache(list+unordered_map实现LRU缓存算法)

Designandimplementadatastructurefor LeastRecentlyUsed(LRU)cache.Itshouldsupportthefollowingoperations: get and put.get(key) -Getthevalue(willalwaysbepositive)ofthekeyi

2017-10-28 12:17:53

CCF CSP 2017年3月第2题 学生排队(STL运用)

问题描述试题编号:201703-2试题名称:学生排队时间限制:1.0s内存限制:256.0MB问题描述:问题描述  体育老师小明要将自己班上的学生按顺序排队。他首先让学生按学号从小到大的顺序排成一排,学号小的排在前面,然后进行多次调整。一次调整小明可能让一位同学出队,

2017-10-26 22:52:21

C++STL中vector(可变大小数组)用法总结

标准库类型vector表示某种类型对象的集合,集合中每个对象都有一个与之对应的索引,用以访问对象。要想使用vector,必须包含头文件vector,并且需要声明usingstd::vector。/*--------------------创建和初始化vector对象--------------------*//*创建一个包含T类型元素的空vector*/vector<T>v1;/*用v1来创

2017-10-25 21:37:43

独立任务最优调度(双机调度)问题

用两台处理机AA和BB处理nn个作业。设AA和BB处理第kk个作业的时间分别为aka_k和bkb_k。由于各个作业的特点和机器性能的关系,对某些作业,在AA上的处理时间长;而对另一些作业,在BB上的处理时间更长。一台处理机在某个时刻只能处理一个作业,而且作业处理是不可中断的,每个作业只能被处理一次。现在要找出一个最优调度方案,使得nn个作业被这两台处理机处理完毕的时间和最少。    本题是一个独立任

2017-10-20 20:07:06
奖章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!