1 Steven·简谈

尚未进行身份认证

博观而约取,厚积而薄发

等级
TA的排名 1w+

机器学习从入门到放弃?只因没遇到 sklearn

随着技术越来越成熟,机器学习的门槛也慢慢降低了,对初学者越来越友好,就比如本文要介绍的 sklearn,解决了很多开发问题。它包含了很多封装好的方法,直接调用就可以构建模型了,结果清晰可见,输入数据...

2020-05-11 10:19:07

sklearn文本聚类分析

面对如今的大数据时代,各种各样的信息令人眼花缭乱,你根本不知道哪些信息是自己所需要的,而一个个看又会浪费很多时间,更不用说对一大堆信息进行分类或总结了。对于聚类处理,这里使用 birch...

2020-05-10 19:04:15

sklearn垃圾邮件识别

垃圾邮件识别,算是一个二分类问题,也是一个相对简单的文本分类问题。这里使用sklearn库进行训练,使用其集成的各种优秀算法,帮助我们快速区分大量烦人的垃圾邮件...

2020-05-03 14:53:44

sklearn库的使用步骤

sklearn是目前python中十分流行的用来实现机器学习的第三方包,其中包含了多种常见算法如:决策树,逻辑回归、集成算法等。即使你还不太懂机器学习的具体过程,依旧可以使用此库进行机器学习操作,因为其对各种算法进行了良好的封装,可以在不了解算法实现过程的情况下使用算法,所以可以把 sklearn 库当作学习过程中的一个过度,如果你想快速建立一个模型,这也是一个不错的选择。数据导入skle...

2020-04-30 22:09:12

基于Simulink的一阶、二阶系统动态响应分析

一阶系统和二阶系统是机械工程控制里面最基本的系统,任何高阶系统均可化为零阶、一阶、二阶系统等的组合,因此对一阶系统、二阶系统的动态响应分析对研究工程控制问题和各种复杂系统有着重要意义...

2020-03-01 17:03:09

你也能看懂的:蒙特卡罗方法

蒙特卡罗方法,也称统计模拟方法,是1940年代中期由于科学技术的发展和电子计算机的发明,而提出的一种以概率统计理论为指导的数值计算方法。是指使用随机数(或更常见的伪随机数)来解决很多计算问题的方法蒙特卡罗方法可以粗略地分成两类:一类是所求解的问题本身具有内在的随机性,借助计算机的运算能力可以直接模拟这种随机的过程。另一种类型是所求解问题可以转化为某种随机分布的特征数,比如随机事件出现的概率,或...

2020-02-12 19:16:37

你也能看懂的:主成分分析法

主成分分析(PCA)是一种统计分析、简化数据集的方法。它利用正交变换来对一系列可能相关的变量的观测值进行线性变换,从而投影为一系列线性不相关变量的值,这些不相关变量称为主成分。具体地,主成分可以看做一个线性方程,其包含一系列线性系数来指示投影方向。PCA对原始数据的正则化或预处理敏感(相对缩放)。概念主成分分析就是对数据进行降维操作,这样在面对多变量大样本的数据时可以明显地减少工作量,而...

2020-02-12 15:31:36

你也能看懂的:线性规划

线性规划 ( Linear Programming ,简称LP )特指目标函数和约束条件皆为线性的最优化问题。在作业研究中所面临的许多实际问题都可以用线性规划来处理,特别是某些特殊情况,例如:网路流、多商品流量等问题,都被认为非常重要。 目前已有大量针对线性规划算法的研究。 很多最优化问题算法都可以分解为线性规划子问题,然后逐一求解。概念线性规划问题其实一直陪伴着我们,上中学时有一类题目...

2020-02-12 10:36:58

你也能看懂的:K-Means 聚类算法

k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有...

2020-02-11 20:26:30

你也能看懂的:灰色关联分析算法

灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,其基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了曲线间的关联程度。通常可以运用此方法来分析各个因素对于结果的影响程度,也可以运用此方法解决随时间变化的综合评价类问题,其核心是按照一定规则确立随时间变化的母序列,把各个评估对象随时间的变化作为子序列,求各个子序列与母序列的相关程度,依照相...

2020-02-11 16:54:09

你也能看懂的:灰色预测算法

灰色预测是就灰色系统所做的预测。所谓灰色系统是介于白色系统和黑箱系统之间的过渡系统。其具体的含义是:如果某一系统的全部信息已知为白色系统,全部信息未知为黑箱系统,部分信息已知,部分信息未知,那么这一系统就是灰色系统。相关概念白色系统:指一个系统的内部特征的完全已知的,即系统信息是完全公开的黑色系统:与白色系统相反,指一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加...

2020-02-11 10:46:33

你也能看懂的:粒子群优化算法

粒子群优化算法(PSO)最初是模拟鸟群觅食行为而发展起来的一种基于群体协作的随机搜索算法。而通过对动物社会行为的观察,发现在群体中对信息的社会共享提供一个演化的优势,并以此作为开发算法的基础。通过加入近邻的速度匹配、并考虑了多维搜索和根据距离的加速,形成了 PSO 的最初版本。概念设想这样一个场景:一群鸟在随机搜索食物,而这个区域里只有一块食物。所有的鸟都不知道食物在哪里,但是他们知道当...

2020-02-10 21:51:14

你也能看懂的:退火算法

模拟退火算法来源于固体退火原理,是一种基于概率的算法,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小,即在局部最优解能概率性地跳出并最终趋于全局最优。参考了金属冶炼的退火过程。模拟退火的过程假设一个人在一群山峰中的某一个位置,他想要找一个最低点,只需要一直往比自己位置...

2020-02-10 16:00:31

你也能看懂的:遗传算法

遗传算法是计算数学中用于解决最优化的搜索算法,是进化算法的一种。进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择以及杂交等。其本质是一种高效、并行、全局搜索的方法,能在搜索过程中自动获取和积累有关搜索空间的知识,并自适应地控制搜索过程以求得最佳解。相关术语 (了解)概念意...

2020-02-10 12:45:04

TensorFlow2.0中Tensor的数据统计

张量通常较大,直接观察数据很难获得有用信息,通过获取这些张量的统计信息可以较轻松地推测张量数值的分布张量范数在神经网络中,范数常用来表示张量的权值大小,梯度大小等常用范数:1 −范数,定义为向量 x 的所有元素绝对值之和2 −范数,定义为向量 x ...

2020-01-26 16:46:38

2019年总结:不忘初心

在此之前,我一直是一个技术索取者,在互联网上查找各种各样的资源来解决遇到的问题。但当我自己围绕某一个知识点写点东西时,才发现这并不是一件简单的事情,需要花费大量的精力,而我文笔又欠佳,有时候还要思考某个字是否运用恰当...

2020-01-25 23:15:53

TensorFlow2.0常用激活函数

激活函数是神经网络中一个十分重要的组成部分,它可以对神经元的接收信息进行非线性变换,将变换后的信息输出到下一层神经元激活函数给神经元引入了非线性因素,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中构造数据import tensorflow as tfimport matplotlib.pyplot as pltx = tf.linspace(-5....

2020-01-24 10:30:18

TensorFlow2.0中Tensor的合并与拆分

合并将多个张量在某个维度上合并为一个张量,可以使用拼接和堆叠操作实现,拼接操作并不会产生新的维度,仅在现有的维度上合并,而堆叠会创建新维度。拼接: tf.concat(tensors, axis)tensors:保存了所有需要合并的张量 Listaxis:指定需要合并的维度索引合并时输入张量的维数必须匹配,并且除 axis 外的所有维数必须相等举个例子:>>> im...

2020-01-23 10:52:03

TensorFlow2.0中Tensor的维度变换

在张量的操作中,维度变换是最重要的操作之一,为了满足不同场景的运算需求,可以任意切换数据的形式。现列举一些常用方法,以方便查看。张量变形在总数据量不变的情况下,将其变换为不同的组合形式,且将此数据平铺时排列顺序不改变举个例子:>>> import tensorflow as tf>>> x = tf.range(24) # 生成一组连续整数向量&g...

2020-01-04 03:07:25

TensorFlow2.0中Tensor的索引与切片

构建数据使用随机数据: import tensorflow as tfx = tf.random.normal([3, 5, 4, 2]) # 创建一组4维张量 xtf.Tensor: id=11, shape=(3, 5, 4, 2), dtype=float32, numpy=array([[[[ 2...

2019-12-16 23:46:19

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 签到王者
    签到王者
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 技术圈认证
    技术圈认证
    用户完成年度认证,即可获得
  • 推荐红人
    推荐红人
    发布高质量Blink获得高赞和评论,进入推荐栏目即可获得
  • 阅读者勋章Lv2
    阅读者勋章Lv2
    授予在CSDN APP累计阅读博文达到7天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。
  • 原力新人
    原力新人
    在《原力计划【第二季】》打卡挑战活动中,成功参与本活动并发布一篇原创文章的博主,即可获得此勋章。
  • 分享达人
    分享达人
    成功上传6个资源即可获取