自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 收藏
  • 关注

转载 L1与L2正则化

L1与L2正则化1. L2 正则化直观解释2. L1 正则化直观解释3. L1 与 L2 解的稀疏性4. 正则化参数 λ机器学习中,为了避免过拟合,最常用的一种方法是使用使用正则化,例如 L1 和 L2 正则化。1. L2 正则化直观解释L2 正则化公式非常简单,直接在原来的损失函数基础上加上权重参数的平方和:其中,Ein 是未包含正则化项的训练样本误差,λ 是正则化参数,可调。其物理意...

2019-10-08 16:56:31 257

原创 欠拟合和过拟合的一般解决方法

欠拟合和过拟合的一般解决方法欠拟合与过拟合解决欠拟合(高偏差)的方法1.模型复杂化2.增加更多的特征,使输入数据具有更强的表达能力3.调整参数和超参数4.增加训练数据往往没有用5.降低正则化约束解决过拟合(高方差)的方法1.增加训练数据数2.使用正则化约束3.减少特征数4.调整参数和超参数5.降低模型的复杂度6.使用Dropout7.提前结束训练欠拟合与过拟合欠拟合是指模型在训练集、验证集和测...

2019-10-08 16:39:41 3083

原创 机器学习-随机森林

机器学习-随机森林随机森林的定义随机森林的特点随机森林的生成1)每棵树随机抽取训练样本为什么要随机抽样训练集?为什么要有放回地抽样?2)每棵树随机选择训练特征3)每棵树都尽最大程度的生长,并且没有剪枝过程。随机森林分类效果(错误率)与两个因素有关:袋外错误率(oob error)随机森林的定义随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一...

2019-10-08 16:25:03 514

原创 python中的lambda函数与sorted函数

python中的lambda函数与sorted函数举例注意lambda常用使用场景1.函数式编程:2.Python中最常见的filter筛选、map小刷子、reduce合并,都可以用lambda表达式来生成sorted()函数排序1 简单列表(list)排序2 字典(dict)的键(key)排序3 字典(dict)的值(value)排序(使用lambda函数)4列表(list)内嵌套列表(list...

2019-10-06 22:52:21 5507 5

转载 机器学习-逻辑回归

机器学习-逻辑回归分类和回归任务的区别逻辑回归不是回归用回归的方法解决分类问题判别函数选定阈值最大似然估计求解交叉熵损失函数总结分类和回归任务的区别我们可以按照任务的种类,将任务分为回归任务和分类任务.那这两者的区别是什么呢?按照较官方些的说法,输入变量与输出变量均为连续变量的预测问题是回归问题,输出变量为有限个离散变量的预测问题成为分类问题.通俗一点讲,我们要预测的结果是一个数,比如要通...

2019-10-06 22:28:16 238

原创 机器学习-线性回归

机器学习-线性回归概述损失函数线性回归模型求解线性回归模型的特点概述线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w’x+e,e为误差服从均值为0的正态分布。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量...

2019-10-06 21:44:20 187

转载 机器学习-朴素贝叶斯分类器

机器学习-朴素贝叶斯分类器概述定义贝叶斯方法朴素贝叶斯算法算法原理优缺点优点缺点应用文本分类其他概述朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。朴素贝叶斯分类器(Naive Bayes Classifier 或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法简单。理论上,NBC模型与其他分类方法相...

2019-10-06 20:55:35 1322

转载 常用的数据结构

常用的数据结构数据结构研究对象数据的逻辑结构数据的物理结构数据存储结构分类线性结构非线性结构常用的数据结构数组(Array)栈( Stack)队列(Queue)链表( Linked List)树( Tree)图(Graph)堆(Heap)散列表(Hash)数据结构数据结构(data structure)是带有结构特性的数据元素的集合,它研究的是数据的逻辑结构和数据的物理结构以及它们之间的相互关...

2019-10-06 19:30:34 538

转载 物联网基础知识点

物联网基础知识点什么是物联网?特征关键技术射频识别技术传感网M2M系统框架云计算应用挑战技术标准的统一与协调管理平台问题成本问题安全性问题什么是物联网?物联网(The Internet of Things,简称IOT)是指通过各种信息传感器、射频识别技术、全球定位系统、红外感应器、激光扫描器等各种装置与技术,实时采集任何需要监控、 连接、互动的物体或过程,采集其声、光、热、电、力学、化 学、生...

2019-10-06 17:43:42 6719

原创 物联网协议之:MQTT协议

物联网协议之:MQTT协议简介工作原理:MQTT消息的QOSMQTT的消息类型MQTT控制报文格式简介MQTT协议(Message Queuing Telemetry Transport),遥信消息队列传输,是IBM公司于1999年提出的,现在最新版本是3.1.1。MQTT是一个基于TCP的发布订阅协议,设计的初始目的是为了极有限的内存设备和网络带宽很低的网络不可靠的通信,非常适合物联网通信。...

2019-10-06 17:09:40 565

原创 计算机网络基础面试题

计算机网络基础面试题1.OSI七层模型2.TCP/IP协议模型以及各层协议3.DNS解析过程4.TCP与UDP的区别5.TCP三次握手与四次挥手三次握手四次挥手6.对称加密与非对称加密7.HTTP协议之响应8、Http和Https的区别1.OSI七层模型OSI(Open System Interconnection)应用层:网络服务与最终用户的一个接口。表示层:数据的表示、安全、压缩。(在...

2019-10-06 16:33:41 1323

原创 Python面试题

Python面试题Q.1. Python 的特点和优点Q.2. 列表和元祖的区别Q.3. 解释 Python 中的三元表达式Q.4. Python 中如何实现多线程Q.5. 继承Q.6. Python 管理内存Q.7. 当退出 Python 时是否释放所有内存分配Q.8. 什么是 Python 字典?Q.9. 负索引Q.10. 如何随机打乱列表中元素,要求不引用额外的内存空间Q.11. 解释 Py...

2019-10-06 12:50:11 317

原创 机器学习-支持向量机(SVM)

机器学习-支持向量机(SVM)概述理论线性分类损失函数核方法标准算法线性SVM(linear SVM)1. 硬边距(hard margin)2. 软边距(soft margin)非线性SVM(nonlinear SVM)数值求解1. 内点法(Interior Point Method, IPM)2. 序列最小优化(Sequential Minimal Optimization, SMO)3. 随机...

2019-10-05 23:29:38 1747

原创 机器学习-决策树(ID3、C4.5)

机器学习-决策树(ID3、C4.5)概述画法剪枝决策树的优缺点ID3算法纯度信息熵信息增益C4.5 算法信息增益率悲观剪枝离散化处理连续属性处理缺失值小结概述决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,...

2019-10-05 22:25:40 889

原创 面试准备(知识点总结等)【中移物联网-算法岗】

为面试做准备【中移物联网-算法岗】自我介绍基本信息本科经历硕士研究方向、获奖、项目、论文自我评价:专业技能、具备能力项目介绍ETC数据分析裂缝检测数据库数据库面试题https://blog.csdn.net/qq_25041667/article/details/102003330数据预处理几种聚类算法原理及比较几种简单机器学习算法原理聚类算法评价指标FOA...

2019-10-05 17:39:00 1224 1

原创 数据预处理(数据审核、缺失值处理、标准化正则化、降维等)

数据预处理(数据审核、缺失值处理、标准化正则化、降维等)概述预处理内容数据审核数据筛选数据排序数据方法去除唯一属性处理缺失值数据标准化数据正则化特征选择(降维)概述数据预处理(data pre-processing)是指在主要的处理以前对数据进行的一些处理。现实世界中数据大体上都是不完整,不一致的脏数据,无法直接进行数据挖掘,或挖掘结果差强人意。为了提高数据挖掘的质量产生了数据预处理技术。数...

2019-10-03 22:24:33 5700

原创 机器学习-降维(SVD、PCA)

机器学习-降维(SVD、PCA)奇异值分解(SVD)主成分分析(PCA)降维是机器学习中很重要的一种思想。在机器学习中经常会碰到一些高维的数据集,而在高维数据情形下会出现数据样本稀疏,距离计算等困难,这类问题是所有机器学习方法共同面临的严重问题,称之为“维度灾难”。另外在高维特征中容易出现特征之间的线性相关,这也就意味着有的特征是冗余存在的。基于这些问题,降维思想就出现了。奇异值分解(SVD)...

2019-10-03 22:03:00 467

原创 数据库面试题(基本概念、索引、事务)

一、基本概念1.主键、外键主键数据库表中对储存数据对象予以唯一和完整标识的数据列或属性的组合。一个数据列只能有一个主键,且主键的取值不能缺失,即不能为空值(Null)。外键在一个表中存在的另一个表的主键称此表的外键。2.触发器触发器是保证数据完整性的一种方法,它是与表事件相关的特殊的存储过程,它的执行不是由程序调用,也不是手工启动,而是由事件来触发,比如当对一个表进行操作(...

2019-10-03 18:20:18 485

原创 Tableau基础入门

Tableau基础入门超市数据源添加工作表工作表连接:内连接、左连接、右连接、全连接字段拆分自定义拆分工作表添加行、列类别、子类别利用颜色展示利润情况自定义组别名智能显示地图筛选器散点图标记趋势线(右键-趋势线)P值过大,无意义排除离群点查看数据复制为交叉表销售额变化不同年份的每月变化趋势...

2019-09-28 21:51:43 212

原创 IP地址(定义、分类、掩码及保留地址)

IP地址(定义、分类、掩码及保留地址)IP定义IP协议数据包分片地址A类地址B类地址C类地址D类地址E类地址无类地址掩码保留地址IPIP,全称互联网协议地址,是指IP地址,意思是分配给用户上网使用的网际协议(英语:Internet Protocol,IP)的设备的数字标签。常见的IP地址分为IPv4与IPv6两大类。定义IP地址是IP协议提供的一种统一的地址格式,它为互联网上的每一个网络和...

2019-09-08 21:15:53 5309 1

原创 递归算法【原理及经典应用举例】

递归算法递归算法简单递归问题举例递归算法递归,就是在运行的过程中调用自己。构成递归需具备的条件:子问题须与原始问题为同样的事,且更为简单;不能无限制地调用本身,须有个出口,化简为非递归状况处理。在数学和计算机科学中,递归指由一种(或多种)简单的基本情况定义的一类对象或方法,并规定其他所有情况都能被还原为其基本情况。简单递归问题举例斐波纳契数列(Fibonacci Sequen...

2019-09-05 15:18:52 2970

原创 常用的8中排序算法【性能比较、算法原理、Python实现】

常用的8中排序算法【性能比较、算法原理、Python实现】性能比较插入排序直接插入排序希尔排序选择排序直接选择排序堆排序交换排序冒泡排序快速排序归并排序基数排序性能比较往往评价一个排序算法的好坏往往可以从下边几个方面入手:(1)时间复杂度:即从序列的初始状态到经过排序算法的变换移位等操作变到最终排序好的结果状态的过程所花费的时间度量。(2)空间复杂度:就是从序列的初始状态经过排序移位变换的...

2019-09-04 10:26:09 357

原创 【赛码】(基本算法-难度2)回文串【Python】

【赛码】(基本算法-难度2)回文串【Python】题目描述输入描述输出描述输入样例输出样例判断字符串是否为回文串(一)判断字符串是否为回文串(二)能否通过添加一个字符使之成为回文串关于字符串列表的相互转换切片取值超出索引范围时不报错,返回空值题目描述给定一个字符串,问是否能够通过添加一个字母将其变成“回文串”。 “回文串”是指正着和反着读都一样的字符串。如:”aa”,”bob”,”testse...

2019-09-03 15:53:22 641

原创 【赛码】(基本算法-难度2)下楼我最快【Python】

【赛码】(基本算法-难度2)下楼我最快【Python】题目描述输入描述输出描述输入样例输出样例输出电梯和小楼梯的最小值题目描述小赛是一名机智的程序员,他的机智主要表现在他下楼的速度特别快( > c < )。小赛的家住在第n层,他可以选择从电梯下楼(假设只有小赛一个人会用电梯)或者走楼梯下楼。当前电梯停在第m层,如果他从电梯下到第1层,需要:电梯先到达这一层->开门-&gt...

2019-08-31 15:21:18 172

原创 【赛码】(基本算法-难度2)行编辑器【Python】

【赛码】(基本算法-难度2)行编辑器【Python】题目描述输入描述输出描述输入样例输出样例遇到 ## :删除前两位, #:删除前一位, @:将本行已经收到的都删除掉题目描述你知道行编辑器吗?不知道也没关系,现在我会告诉你:1如果你收到一个‘#’,那么你应该删掉一个你已经收到的字符,不包括‘#’;2如果你收到‘@’,那么你应该把你收到的一整行都删掉。(‘#’和‘@’都为不可见字符。)你明白了吗...

2019-08-31 15:18:01 222

原创 【赛码】(基本算法-难度2)研究生考试【Python】

【赛码】(基本算法-难度2)研究生考试【Python】题目描述输入描述输出描述输入样例输出样例列表直接输出题目描述欢迎大家参加奇虎360 2016校招在线招聘考试,首先预祝大家都有个好成绩!我相信参加本次在线招聘考试的有不少研究生同学。我们知道,就计算机相关专业来说,考研有4门科目,分别是政治(满分100分),英语(满分100分),数学(满分150分)和专业课(满分150分)。某校计算机专...

2019-08-31 15:13:22 474

原创 【赛码】(基本算法-难度2)公交车乘客【Python】

【赛码】(基本算法-难度2)公交车乘客【Python】题目描述输入描述输出描述输入样例输出样例列表题目描述一个公交车经过n个站点,乘客从前门上车,从后门下车。现在统计了在第i个站,下车人数a[i],以及上车人数b[i]。问公交车运行时候车上最多有多少乘客。输入描述第一行读入一个整数n(1<=n<=100),表示有n个站点接下来n行,每行两个数值,分别表示在第i个站点下车人数...

2019-08-31 15:08:25 839

原创 【美团】(数据开发面试)二分法求开方【Python】

【美团】(数据开发面试)二分法求开方【Python】题目描述输入描述输出描述输入样例1输出样例1输入样例2输出样例2二分法题目描述给定一个整数,求其开方后的整数位输入描述一个整数,如:5输出描述开方后的整数位输入样例15输出样例12输入样例210输出样例23二分法#coding=utf-8import sysn = int(input()...

2019-08-30 20:30:07 215

原创 【快手】(笔试)版本升级判定【Python】

【快手】(笔试)版本升级判定【Python】题目描述输入描述输出描述输入输出用0补为定长题目描述给定两个版本号,只有在版本号更高的时候,才可以升级。【.】号作为分割符使用,版本号中只有数和.号。输入描述第一行为m(1<=m<=100000),表示测试组数,接下来mm行,表示m次查询。每行两个版本号,空格分隔。一个版本号中最多只会出现3个【.】。每个版本号中数字1<...

2019-08-26 15:29:22 258

原创 【快手】(笔试)合并内容流【Python】

【快手】(笔试)合并内容流【Python】题目描述输入描述输出描述对于符合条件的元素:.append()题目描述合并两个内容流,实现隔4个插入1个,如果合并完还有剩下,则加内容流尾部输入描述第一行表示第一种类型的内容,第二行表示第二种类型的内容,字符数量<=100,空格分隔。比如说1 2 3 4 5 6 7 8 9a b c输出描述合并两种内容流,输出1 2 3 4 ...

2019-08-25 22:48:52 226

原创 【京东】(数据分析工程师-笔试)姓名排序【Python】

【京东】(数据分析工程师-笔试)姓名排序【Python】题目描述输入输出样例输入样例输出使用字典统计姓氏并排序题目描述马上就开学了,教务处的老师拿到了新生的名单,现在他需要根据考生的姓名录入一个拼音版的新名单。老师录入时,需要输入姓和名(例如:ZHANG SAN,字母均为大写,姓名以空格隔开),并且要将这些人按一定规则排序。排序方式如下:首先,按照该形式出现的次数排序,即:姓出现次数多的...

2019-08-25 16:23:41 356

原创 【京东】(数据分析工程师-笔试)最优打字策略【Python】

【京东】(数据分析工程师-笔试)最优打字策略【Python】题目描述输入输出样例输入样例输出只考虑大小写变换就转换(18%)贪心算法(100%)题目描述在英文的输入中,我们经常会遇到大小写切换的问题,频繁切换大小写会增加我们按键的次数,也会降低我们的打字策略。众所周知,切换大小写有两种方式,一种是按下“Caps locks”,也就是大写锁定键,这样一来,之后的输入模式都会被切换。另一种是同时...

2019-08-25 15:48:26 371

原创 【美团】(数据方向-笔试)月份天数【Python】

【美团】(数据方向-笔试)月份天数【Python】题目描述输入输出样例输入样例输出月份天数(Python)题目描述使用编程的基本语法(不能使用编程语言中专用的日期处理类及方法),根据所输入的月份,年份输出当月的实际天数输入第一个参数为月份,如1代表1月,2代表2月第二个参数为月份,如2018代表2018年,2019代表2019年(参数见均以空格隔开)输出输出当月的实际天数样...

2019-08-22 17:41:54 239

原创 【美团】(数据方向-笔试)棋子翻转【Python】

【美团】(数据方向-笔试)棋子翻转【Python】题目描述输入样例输出样例棋子翻转(Python)题目描述在4x4的棋盘上摆满了黑白棋子,黑白两色的位置和数目随机其中左上角坐标为(1,1),右下角坐标为(4,4)现在依次有一些翻转操作,要对一些给定支点坐标为中心的上下左右四个棋子的颜色进行翻转,请计算出翻转后的棋盘颜色。给定两个数组A和f,分别为初始棋盘和翻转位置。其中翻转位置共有3个。请...

2019-08-22 17:34:14 1800 1

原创 【猿辅导】(数据开发工程师-面试)求二叉树的最大链路和【Python】

【猿辅导】(数据开发工程师-面试)求二叉树的最大链路和【Python】题目描述输出关于二叉树二叉树的三种遍历方式(Python)广度优先遍历输出所有链路计算最大链路和题目描述已知一个满二叉树如下,最所有链路的最大链路和 4 / \ 2 7 / \ / \ 9 ...

2019-08-22 17:23:27 416

原创 【作业帮】(数据开发工程师-面试)统计字符串出现的次数以及其对应的值的和【Python】

【作业帮】(数据开发工程师-面试)统计字符串出现的次数以及其对应的值的和【Python】题目描述输出方法一:最直观,‘简单’(当下只能想到这样的笨办法...)字典求和列表内字典值相加列表,使用字典方法实现对应值相加题目描述已知列表如下,统计列表中第一列中的字符串出现的次数以及其对应值的和a,1b,2c,3a,2b,3输出[[‘b’, 2, 5], [‘c’, 1, 3], ...

2019-08-21 15:07:41 206

原创 【猿辅导】(数据开发工程师-面试)求两个字符串的最大公共子串【Python】

【猿辅导】(数据开发工程师-面试)求两个字符串的最大公共子串【Python】题目描述示例方法一:建立一个二维数组,保存连续位相同与否的状态方法二:遍历不同长度的所有子串题目描述求两个字符串的最大公共子串示例输入:asdfbdsdfdsasdfasddsdfsaoesdf输出:4dsdf方法一:建立一个二维数组,保存连续位相同与否的状态def getNumofCommo...

2019-08-20 14:32:36 440

原创 【猿辅导】(数据开发工程师-面试)求两个超长数字字符串的和【Python】

【猿辅导】(数据开发工程师-面试)求两个超长数字字符串的和【Python】题目描述方法一:分别把每个字符串按位转换为数字,然后相加方法二:翻转字符串,逐位相加(注意进位)方法三:与方法二同理,未反转,反向遍历题目描述求两个超长数字字符串的和(直接相加会发生溢出)‘123…0’‘333…9’(综合了别人的方法)方法一:分别把每个字符串按位转换为数字,然后相加这个方法主要是将两个省略了某...

2019-08-20 14:18:59 743

原创 【字节跳动】(测试工程师-面试)求阶乘的累加和【Python】

【字节跳动】(测试工程师-面试)求阶乘的累加和【Python】题目描述输入描述输出描述示例1方法一:双层循环方法二:递归题目描述求1!+2!+3!+……+n!输入描述输入n的值(整数)输出描述输出1至n的阶乘的累加和示例1输入:4输出:33方法一:双层循环sum = 0a = int(input('请输入整数n:'))for i in range(1, a+1):...

2019-08-18 19:42:29 2703

原创 【360】(数据分析师)表面积【Python】

【360】(数据分析师)表面积【Python】题目描述输入描述输出描述示例1求数学期望题目描述将长N*M厘米的短形区域分成N行M列(每行每列的宽度均为1厘米),第i行第j列的位置上叠放Ai,j个边长为1厘米的正方体(1<=Aij<=100)所有正方难题就组成了一个立体图形,每个正方体六个面中部分会被其他正方体遮挡,未被遮挡的部分的总面积即为该立方体图形的表面积,那么该立体图形的表面...

2019-08-15 22:06:42 318

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除