自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 task9

导论在前面的学习中,我们探讨了一系列简单而实用的回归和分类模型,同时也探讨了如何使用集成学习家族中的Bagging思想去优化最终的模型。Bagging思想的实质是:通过Bootstrap 的方式对全样本数据集进行抽样得到抽样子集,对不同的子集使用同一种基本模型进行拟合,然后投票得出最终的预测。我们也从前面的探讨知道:Bagging主要通过降低方差的方式减少预测误差。那么,本章介绍的Boosting是与Bagging截然不同的思想,Boosting方法是使用同一组数据集进行反复学习,得到一系列简单模型,..

2021-04-17 21:21:12 144

原创 集成学习(中)task2

投票法的思路投票法是集成学习中常用的技巧,可以帮助我们提高模型的泛化能力,减少模型的错误率。举个例子, 在航空航天领域,每个零件发出的电信号都对航空器的成功发射起到重要作用。如果我们有一个二进制 形式的信号:11101100100111001011011011011在传输过程中第二位发生了翻转10101100100111001011011011011这导致的结果可能是致命的。一个常用的纠错方法是重复多次发送数据,并以少数服从多数的方法确定 正确的传输数据。一般情况下,错误总是发生在局部,因此融合多

2021-04-13 08:05:02 194

原创 Task5的学习内容是“掌握基本的分类模型

Task5的学习内容是“掌握基本的分类模型2.2 使用sklearn构建完整的分类项目(1) 收集数据集并选择合适的特征:在数据集上我们使用我们比较熟悉的IRIS鸢尾花数据集。from sklearn import datasetsiris = datasets.load_iris()X = iris.datay = iris.targetfeature = iris.feature_namesdata = pd.DataFrame(X,columns=feature)data[‘targ

2021-03-27 14:00:52 1536

原创 第二章:机器学习基础-task4

(5) 对模型超参数进行调优(调参):在刚刚的讨论中,我们似乎对模型的优化都是对模型算法本身的改进,比如:岭回归对线性回归的优化在于在线性回归的损失函数中加入L2正则化项从而牺牲无偏性降低方差。但是,大家是否想过这样的问题:在L2正则化中参数 ???? 应该选择多少?是0.01、0.1、还是1?到目前为止,我们只能凭经验或者瞎猜,能不能找到一种方法找到最优的参数 ???? ?事实上,找到最佳参数的问题本质上属于最优化的内容,因为从一个参数集合中找到最佳的值本身就是最优化的任务之一,我们脑海中浮现出来的算法

2021-03-24 19:23:57 184

原创 2021-03-22

什么是弱监督学习

2021-03-22 21:31:49 920

原创 2021-03-15

集成学习之机器学习基础:1.导论什么是机器学习?机器学习的一个重要的目标就是利用数学模型来理解数据,发现数据中的规律,用作数据的分析和预测。数据通常由一组向量组成,这组向量中的每个向量都是一个样本,我们用 ???????? 来表示一个样本,其中 ????=1,2,3,…,???? ,共N个样本,每个样本 ????????=(????????1,????????2,…,????????????,????????) 共p+1个维度,前p个维度的每个维度我们称为一个特征,最后一个维度 ???????? 我们称

2021-03-15 21:49:00 77

原创 23 26 33

23. 合并K个升序链表给你一个链表数组,每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中,返回合并后的链表。示例 1:输入:lists = [[1,4,5],[1,3,4],[2,6]]输出:[1,1,2,3,4,4,5,6]解释:链表数组如下:[1->4->5,1->3->4,2->6]将它们合并到一个有序链表中得到。1->1->2->3->4->4->5->6示例 2:输入:lists =

2021-01-19 08:30:54 68

原创 16最接近的三数之和 21

16最接近的三数之和class Solution: def threeSumClosest(self, nums: List[int], target: int) -> int: n=len(nums) if n==3: #只有三个数直接相加 return nums[0]+nums[1]+nums[2] d=float('inf') nums=sorted(nums) ans=0

2021-01-18 08:33:48 68

原创 leetcode task4 --15三数之和

15三数之和给你一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?请你找出所有和为 0 且不重复的三元组。注意:答案中不可以包含重复的三元组。示例 1:输入:nums = [-1,0,1,2,-1,-4]输出:[[-1,-1,2],[-1,0,1]]示例 2:输入:nums = []输出:[]示例 3:输入:nums = [0]输出:[]class Solution: def threeSum(self

2021-01-15 08:27:23 67

原创 Leecode刷题第三天

Leecode刷题第三天11盛最多水的容器给你 n 个非负整数 a1,a2,…,an,每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线,垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0) 。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。说明:你不能倾斜容器。思路:算法流程: 设置双指针 ii,jj 分别位于容器壁两端,根据规则移动指针(后续说明),并且更新面积最大值 res,直到 i == j 时返回 res。指针移动规则与证明: 每次选定

2021-01-14 08:24:09 95

原创 leetcode刷题第一天

leetcode刷题第二天task22两数相加2两数相加给你两个 非空 的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储 一位 数字。请你将两个数相加,并以相同形式返回一个表示和的链表。你可以假设除了数字 0 之外,这两个数都不会以 0 开头。class Solution: def addTwoNumbers(self, l1: ListNode, l2: ListNode) -> ListNode: dummy = p =

2021-01-11 07:22:32 113

原创 【数据分析】数据加载及探索性数据分析1

这里写自定义目录标题如果数据是常量值,则必须提供索引。将重复该值以匹配索引的长度。检索多个值 标签用中括号包裹当索引没有对应的值时,可能出现缺失数据显示NaN(not a number)的情况行名排序 降序列名排序 降序选取所有出生日期大于等于1998年的数据, 这里是字符串比较选取所有出生日期大于等于1997年小于1999年的数据选取所有出生日期大于等于1997年小于1999年的数据选取所有出生日期大于等于1997年或者姓名为张三的数据另一种选取方式(不推荐, 实测效率比上面低)选择字段值为指定内容的数据

2020-08-19 09:53:17 209 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除