3 code_carrot

尚未进行身份认证

暂无相关简介

等级
TA的排名 6w+

数据挖掘学习笔记:思维导图(未完)

2020-05-13 13:49:57

机器学习_学习笔记:逻辑回归(Logistic Regression)的Python实现

"""逻辑回归模型的假设是:h_θ(x) = g(θ^T @X),X代表特征向量,g代表逻辑函数一个常用的逻辑函数为 S 形函数(sigmoid function)公式为:g(z) = 1 / (1 + e^(-z))逻辑回归的代价函数J(θ) = 1/m *(Cost(h_θ(x^(i)),y^(i))) i∈[1,m],m个样本求和 Cost(h_θ(x^(i)),y^(i...

2020-05-07 03:12:52

数据挖掘学习笔记:数值预测代码实践

目录线性回归回归树K近邻线性回归"""简单的线性回归例子"""from sklearn import linear_modelX = [[0, 0], [1, 1], [2, 2]]y = [0, 1, 2]reg = linear_model.LinearRegression()reg.fit(X, y) # 训练模型 X-training data;y...

2020-05-05 01:45:51

机器学习_学习笔记:正规方程的python实现

"""利用正规方程求解向量θθ为n+1个参数组成的(列)向量θ=[θ_0,θ_1,θ_2,...,θ_n].T T:转置"""import numpy as npdef normalEqn(X, y): """ numpy.linalg模块包含线性代数的函数。 使用这个模块,可以计算逆矩阵、求特征值、解线性方程组以及求解行列式等 :param ...

2020-05-05 01:39:09

数据挖掘学习笔记:分类算法

目录积极的方法(Eager Method)懒惰的方法(Lazy Method)积极的方法(Eager Method)定义:当需要进行预测时,直接使用该模型,不必再访问原始训练数据集举例:决策树、贝叶斯分类懒惰的方法(Lazy Method)定义:不需要事先学习分类模型,当需要预测时,根据预测样本的特性,和已知训练数据集中的数据进行类别的判断举例:K近邻分类...

2020-04-29 02:44:20

机器学习_学习笔记:监督学习和无监督学习

目录监督学习分类回归无监督学习聚类监督学习其基本思想是,我们数据集中的每个样本都有相应的“正确答案”, 再根据这些样本作出预测。分类其目标是推出一组离散的结果回归即通过回归来推出一个连续的输出无监督学习没有给算法正确答案来回应数据集中的数据。聚类在无监督学习中,我们已知的数据。看上去有点不一样,不同于监督学习的数据的样子,即无监督学习中没...

2020-04-26 16:25:43

机器学习_学习笔记:单变量线性回归

单变量线性回归形如 只含有一个输入变量/特征,这样的问题叫做单变量线性回归问题。代价函数梯度下降确定参数θ_0,θ_1,...,θ_n

2020-04-26 16:21:00

Python学习笔记:爬虫.content和.text区别

requests对象的get和post方法都会返回一个Response对象,这个对象里面存的是服务器返回的所有信息,包括响应头,响应状态码等。其中返回的网页部分会存在.content和.text两个对象中。.content中间存的是字节码 .text存的是.content编码后的字符串一般来说 .text直接用比较方便 返回的是字符串 但是有时候会解析不正常导致返回的是一堆乱码这时用....

2020-04-22 02:06:18

数据挖掘学习笔记:分类之决策树分类 -- ID3算法 / C4.5算法 / CART算法

ID3

2020-04-15 23:30:50

数据挖掘学习笔记:关联规则的生成方法

为每个频繁项集l, 生成非空子集s; 若满足

2020-04-12 23:07:43

数据挖掘学习笔记:频繁项集的典型挖掘方法

逐层发现算法Apriori需要多次扫描数据,对于大数据量不友好主要步骤1. k=12. 统计每个k项候选集的支持度,找出频繁的k项集:Lk3. 利用频繁的k项集生成k+1项候选集(Candidate itemset ):Ck+14. k=k+1; 转至步骤2如何生成候选项集?性质1:给定最小支持度阈值minsup,一个频繁项集的所有非空子集 都是频繁的。Apr...

2020-04-12 21:14:56

数据挖掘学习笔记:频繁模式和关联规则

关联规则挖掘是从交易数据库、关系数据库以及其他的数据集中发现项或对象的频繁模式(frequent patterns)、关联( associations)的过程。支持度(support)支持度指交易包含项集X的概率(百分数) support(x) = count(x) / |D| * 100%其中D的模表示交...

2020-04-12 20:58:06

数据挖掘学习笔记:数据预处理

Q:为什么要进行数据预处理?A:原因:数据在搜集时由于各种原因可能存在缺失、错误、不一致等问题; 用于描述对象的数据有可能不能很好地反映潜在的模式; 描述对象的属性的数量可能有很多,有些属性是无用的或者冗余的数据预处理的任务一、数据规范化数据规范化又称标准化(standardization),通过将属性的取值范围进行统一,避免不同的属性在数据分析的过程中具有不平等的地...

2020-04-10 22:28:07

Anaconda:在Pycharm中使用Anaconda的解释器

我先从我的认识简单总结一下,搭建Python环境的常见模式是安装一个Python的IDE(集成开发环境)再使用pip或conda等命令安装特别扩展的第三方包,常见的Python IDE/平台简单列举如下:(1) Python自带的IDE —— IDLE,优点是小巧,缺点是需要另外安装很多Python包;(2) Anaconda平台,优点是已包含很多Python第三方包,使用比较方便,缺点是...

2020-04-07 22:35:50

数据挖掘学习笔记:余弦相似性

定义余弦相似性(余弦相似度):通过计算两个向量的夹角余弦值来评估他们的相似性。0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是-1。从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。两个向量有相同的指向时,余弦相似度的值为1;两个向量夹角为90°时,余弦相似度的值为0;两个向量指向完全相反的方向时,余弦相似度的值为-1。这结果是与向量的长度无关的,仅仅与...

2020-04-07 12:54:45

数据挖掘学习笔记:scikit-learn库安装

安装方法有两种:第一种:直接安装anaconda,已包含多种所需的库第二种:使用pip命令安装pip install scikit-learn※windows系统在安装scikit-learn库之前需要先安装numpy库和scipy库,且对版本有要求如图中所示,需要已安装的numpy版本>=1.11.0,scipy版本>=0.17.0※查询已安装的版本(可显示...

2020-04-07 00:19:34

数据挖掘学习笔记:混合属性的邻近性度量

混合类型相异度计算的思想:按不同类型的属性(如数值型,二元变量,名义变量等),根据各自类型的计算方法计算之后再加权求和。关于指示符(即 权重):指示符为0有两种情况...

2020-04-06 16:44:40

数据挖掘学习笔记:序数属性的邻近性度量

序数属性:有序先映射成[0,1]的数值属性,再选择数值属性的邻近性度量的计算方法计算例子

2020-04-05 20:52:14

数据挖掘学习笔记:数值属性的邻近性度量

数值属性的相异性侧度:距离闵可夫斯基距离特殊形式

2020-04-05 20:31:41

Anacoda:parentpoller.py:116: UserWarning: Parent poll failed.

打开spyder看到错误提示:D:\ANACONDA_EXE\lib\site-packages\ipykernel\parentpoller.py:116: UserWarning: Parent poll failed.If the frontend dies, the kernel may be left running. Please let us know about your...

2020-04-05 13:24:37

查看更多

勋章 我的勋章
  • 签到达人
    签到达人
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 阅读者勋章Lv2
    阅读者勋章Lv2
    授予在CSDN APP累计阅读博文达到7天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。
  • 原力新人
    原力新人
    在《原力计划【第二季】》打卡挑战活动中,成功参与本活动并发布一篇原创文章的博主,即可获得此勋章。