自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 资源 (1)
  • 收藏
  • 关注

原创 kylin 编译(kylin-3.0.x-hadoop3.1)解决kylin 404错误

文章目录题外话kylin运行环境kylin 编译过程1.去kylin GitHub上下载分支kylin-3.0.x-hadoop3.1源码2.导入idea修改pom.xml3.修改于guava相关框架一些的方法4.kylin build in centos7题外话kylin编译过程真的是太苦涩了,塌了无数坑,耗时无数。大概因为我是第一次编译源码。真的是感受深刻,学习颇多。最后还把HBASE编译了一遍,如果你的kylin安装好了运行不报错,就是打开网页报404错误,大概率是HBASE出了问题。我绕了一大圈

2021-05-05 23:22:48 702 1

原创 Java-Python对垒之质数计算

文章目录Java 实现Python 实现结论Java 实现class PrimeNumber{ public static void main(String[] args) { long start=System.currentTimeMillis(); int count=0; label:for(int i=1;i<=100000;i++){ for (int j=2;j<=Math.sqrt(i);j++) { if(i%j==0){ contin

2020-06-07 18:42:16 250

原创 泰坦尼克号生存数据分析及建模

文章目录1. 数据维度介绍2.提出问题3.数据分析1.船员生存情况概览2.生存情况与性别之间的关系3.生存情况与乘客等级之间的关系4.年龄与乘客生存情况的关系5.年龄、性别、乘客等级与生存率之间的关系4.建模学习1.数据清洗2.哑变量处理3.划分数据,训练模型、模型预测5.总结1. 数据维度介绍该数据集主要以下维度:PassengerId => 乘客IDSurvived=>是...

2020-04-15 11:56:18 3362 4

原创 Airbnb短租房源数据分析

文章目录1 数据集背景2 分析思路3 短租房价格分析4 短租房地理位置分布分析5 房屋类型分析6 结论1 数据集背景本数据集来自 Airbnb 于 2019 年 4 月 17 日公开的北京地区数据(总共包含了28449家短租房的信息)。数据均来源于 Airbnb 网站的公开信息,不包含任何个人隐私数据。该数据集包含listings,calendar,reviews等数据集,本次主要分析lis...

2020-04-09 16:26:51 4457 3

原创 使用Packet Tracer对不同网段组网模拟

文章目录1. 不同网段通信2.软件模拟设备配配置参数3.测试1. 不同网段通信处于同于一个网段的电脑通过集线器或者交换机可以实现互相通信,处于不同网段的电脑就需要通过路由器来实现,这里可以通过Cisco的Packet Tracer软件来模拟这一过程。注:不同网段是指两个局域网的ip地址的网络号不同。2.软件模拟设备配配置参数这里使用的四台电脑,两台服务器,两个交换机。三个路由器。框中圈的...

2020-03-01 10:02:45 2096

原创 哑编码的两种方法

1.使用pd的replace方法例如:使用replace方法将j将值替换’Fully Paid’为1,这种方法一般标签二值化的时候用df.loan_status.value_counts()#先查看该列的值的类别数目df.loan_status.replace(‘Fully Paid’,value=int(1),inplace=True)2.使用pd.Categorical().code...

2020-02-24 21:20:08 841

原创 AdaBoost scikit-learn相关参数

1.AdaBoostClassifierbase_estimator:弱分类器对象,默认为CART分类树DecisionTreeClassifier;algorithm:SAMME和SAMME.R;SAMME表示构建过程中使用样本集分类效果作为弱分类器的权重;SAMME.R使用对样本集分类的预测概率大小作为弱分类器的权重。由于SAMME.R使用了连续的概率度量值,所以一般迭代比SAMME快...

2020-02-18 20:32:07 424 1

原创 KNN scikit-learn相关参数

KNeighborsClassifier & KNeighborsRegressorweights:样本权重,可选参数: uniform(等权重)、distance(权重和距离成反比,越近影响越强);默认为uniform。n_neighbors:邻近数目,默认为5。algorithm:计算方式,默认为auto,可选参数: auto、ball_tree、kd_tree、brute;推荐...

2020-02-17 20:59:31 208

原创 递归思想的应用-根据二叉树的中序遍历和前序遍历重建二叉树

如题输入某二叉树的前序遍历和中序遍历的结果,请重建出该二叉树。假设输入的前序遍历和中序遍历的结果中都不含重复的数字。例如输入前序遍历序列{1,2,4,7,3,5,6,8}和中序遍历序列{4,7,2,1,5,3,8,6},则重建二叉树并返回。解题思想前序遍历是根左右,中序遍历是左跟右。根据前序遍历可知道这棵树的根是1,中序遍历就可以的得到,1的中序遍历左子树为{4,7,2},中序遍历右子树为{...

2020-02-14 14:56:43 112

原创 递归

1.自己调用自己2. 参数满足一个条件时,函数不再执行(递归的出口,否则出现死循环)3.例子def sum_2(n): if n == 1: # 递归出口 return 1 else: temp = sum_2(n-1) return n+tempprint(sum_2(4)) #10...

2020-02-12 20:37:04 80

原创 Python多进程

文章目录Python多进程Multiprocessing使用简介-1Process多进程的几种方法LockPoolQueuePython—队列、生产者消费者模型Python多进程• 用multiprocessing替代Thread• multiprocessing库的出现很大程度上是为了弥补thread库因为GIL低效的缺陷。它完整的复制了一套thread所提供的接口方便迁移。唯一的不同就是...

2020-02-10 20:24:07 83

原创 进程与线程

文章目录进程与线程threading使用简介-1threading使用简介-2threading使用简介-3threading使用简介-4进程与线程进程是程序执行的最小线程一个进程由多个线程组成进程之间相互独立,同一个进程各线程共享内存空间包括代码段、数据集、堆等)及一些进程级的资源(如打开文件和信号),某进程内的线程在其它进程不可见;调度和切换:线程上下文切换比进程上下文切换要快得多...

2020-02-10 20:16:40 79

原创 GBDT scikit-learn相关参数

文章目录1.GradientBoostingClassifier2.GradientBoostingRegressor1.GradientBoostingClassifierloss:给定损失函数,可选对数似然函数deviance和指数损失函数exponential;默认为deviance;不建议修改。n_estimators :最大迭代次数,值过小可能会导致欠拟合,值过大可能会导致过拟合,...

2020-02-08 23:04:37 545

原创 记录几个特别有意思的python练习题

文章目录1.反转列表2.从列表 [True,1,0,‘x’,None,‘x’,False,2,True] 中删除元素‘x’3. 删除列表中索引号为奇数(或偶数)的元素。4. 若 a = [1,2,3],令 b = a,执行 b[0] = 9, a[0]亦被改变。为何?如何避免?5.将二维结构 [[‘a’,1],[‘b’,2]] 和 ((‘x’,3),(‘y’,4)) 转成字典。6.将 0.0077...

2020-01-15 21:32:03 793

原创 python浮点数四舍五入方法小记

文章目录1 round()方法2 格式化字符串的方法2.1 format 格式化函数2.2 %运算符3 总结python中的四舍五入很诡异,据说有着这样的规则:“四舍六入五平分”,“五平分”就是根据取舍的位数前的小数奇偶性来判断,奇偶平分,符合公平性原则(四舍五入不是公平的)。1 round()方法内置函数round( x [, n]),如果不给n值返回整数值。(以下代码基于python3...

2020-01-07 01:00:48 339

原创 机器学习(7)之支持向量机(SVM)

文章目录1 知识回顾1.1 梯度下降法1.2 拉格朗日乘子法1.2.1 对偶问题1.3 KKT条件1.3.1 KKT条件总结1.4 最优化问题的求解1.5 距离知识回顾1.6 感知器模型2 SVM2.1 线性可分SVM2.1.1 算法流程2.1.1 算法总结2.2 SVM的软间隔模型2.2.1 算法流程2.2.1 算法总结1 知识回顾1.1 梯度下降法导数:一个函数在某一点的导数描述了这个函...

2020-01-06 12:40:12 515

原创 机器学习(6)之聚类算法(k-means\Canopy\层次聚类\谱聚类)

文章目录1 聚类的定义1.1 距离公式(相似度)1.2 聚类的思想2 K-means算法2.1 K-means算法的思考2.2 总结3 二分K-Means算法4 K-Means++算法4.1 K-Means||算法5 Canopy算法5.1 应用场景6 Mini Batch K-Means算法7 层次聚类方法7.1 AGNES算法中簇间距离7.2 层次聚类优化算法8 密度聚类8.1 DBSCAN算...

2020-01-03 23:32:19 1309

原创 机器学习(5)之集成学习(RF\AdaBoost\GBDT)

文章目录1 集成学习的思想1.1 Bagging简介1.2 Boosting简介1.3 Stacking简介2 随机森林(Random Forest)2.1 算法流程2.2 Extra Tree2.3 TRTE2.4 Isolation Forest(IForest)2.5 总结3 AdaBoost3.1 算法原理3.2 算法的构建过程3.3 总结4 GBDT4.1 算法原理4.2 GBDT回归算...

2020-01-03 12:28:49 338

原创 机器学习(4)之决策树

文章目录1 比特化(Bits)2 信息熵2.1 信息量2.2 信息熵的意义2.3 条件熵3 决策树的概念3.1 决策树的构建3.2 决策树的特征属性3.3 决策树分割属性3.4 决策树量化纯度3.5 决策树的停止条件3.6 决策树算法效果的评估4 ID3算法5 C4.5算法6 CART算法7 分类树和回归树8 决策树的优化策略8.1 剪枝优化9 总结1 比特化(Bits)假设现在随机变量X...

2020-01-02 12:46:55 257

原创 机器学习(3)之KNN算法

文章目录算法原理算法步骤KNN三要素KNN算法实现方式KD Tree的构建KD tree查找最近邻算法原理K近邻(K-nearst neighbors, KNN)是一种基本的机器学习算法,所谓k近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。KNN在做回归和分类的主要区别在于最后做预测的时候的决策方式不同。KNN在分类预测时,一般采用多数表决法;而在做回归预...

2020-01-01 17:35:18 252

原创 机器学习(2)之回归算法

机器学习(2)之回归算法什么是回归算法线性回归似然函数/对数似然函数目标函数/损失函数常用的其他目标函数线性回归的过拟合Ridge回归(岭回归)LASSO回归Elasitc Net算法(弹性网络算法)模型效果判断机器学习调参梯度下降算法批量梯度下降算法(BGD)随机梯度下降算法(SGD)小批量梯度下降法(MBGD)什么是回归算法有监督算法解释变量(x)与观测值(因变量y)之间的关系最终结...

2019-12-31 11:52:53 435

原创 机器学习(1)之基本概念

机器学习(1)之基本概念机器学习的定义算法中的基本参数对算法的数据的常规描述机器学习分类有监督学习无监督学习半监督学习机器学习开发流程数据收集与存储数据预处理特征提取模型构建模型测试评估投入使用(模型部署与整合)迭代优化机器学习的定义根据已有的数据进行算法选择,并基于算法和数据构建模型,最终对未来进行预测。算法中的基本参数输入: x∈χ(属性值)输出:y∈Y(目标值)获得一个目标函...

2019-12-29 00:03:38 280

原创 一个有趣的问题:如何将一个正数分解成质数相乘

背景将一个正整数分解质因数。例如:输入90,打印出90=233*5。快捷键撤销:Ctrl/Command + Z重做:Ctrl/Command + Y加粗:Ctrl/Command + B斜体:Ctrl/Command + I标题:Ctrl/Command + Shift + H无序列表:Ctrl/Command + Shift + U有序列表:Ctrl/Command + Sh...

2019-08-25 00:38:20 959

原创 用python判断一个数开方是否为有理数

用python判断一个数开方是否为有理数一道网上的题思路开方判断函数代码一道网上的题一个整数,它加上100后是一个完全平方数,再加上168又是一个完全平方数,请问该数是多少?思路我的思路是用while大循环→if 循环→开方函数判断→if break 结束运行开方判断函数开方取整→判断取整后平方是否等于 原数代码如果有不对的地方请大家批评指正!import mathdef j...

2019-08-17 16:39:05 2532

数控编程课程设计

数控专业的编程。本文档主要介绍ug编程。介绍ug建模到制作数控程序的整个过程

2014-02-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除