4 DemonHunter211

尚未进行身份认证

暂无相关描述

等级
TA的排名 121

使用Python下载各大网站视频资源库:you-get教程

1.环境:WindowsPython3you-get2.安装:在cmd命令提示符输入:pipinstallyou-get这里可以看到我已经安装you-get版本了,先前没有安装过的会出现另外一个提示,Successfullyinstalledyou-get…3.支持的视频网址:SiteURLVideos?Images?Audios?You...

2019-09-11 17:49:57

浅谈对机器学习方法(决策树,SVM,KNN最近邻,随机森林,朴素贝叶斯、逻辑回归)的理解以及用SKLEARN工具实现文本分类和回归方法

一、决策树  定下一个最初的质点,从该点出发、分叉。(由于最初质点有可能落在边界值上,此时有可能会出现过拟合的问题。二、SVM  svm是除深度学习在深度学习出现之前最好的分类算法了。它的特征如下:  (1)它既可应用于线性(回归问题)分类,也可应用于非线性分类;  (2)通过调节核函数参数的设置,可将数据集映射到多维平面上,对其细粒度化,从而使它的特征从二维变成多维,将...

2019-09-06 13:43:39

蒙特卡罗方法入门

本文通过五个例子,介绍蒙特卡罗方法(MonteCarloMethod)。一、概述蒙特卡罗方法是一种计算方法。原理是通过大量随机样本,去了解一个系统,进而得到所要计算的值。它非常强大和灵活,又相当简单易懂,很容易实现。对于许多问题来说,它往往是最简单的计算方法,有时甚至是唯一可行的方法。它诞生于上个世纪40年代美国的"曼哈顿计划",名字来源于赌城蒙特卡罗,象征概率。二...

2019-09-06 10:33:08

Kubernetes一键部署利器 kubeadm

《深入剖析Kubernetes-09从容器到容器云谈谈Kubernetes的本质》kubeadm简化部署操作,仅需要以下2个操作即可创建一个k8s集群#创建一个Master节点$kubeadminit#将一个Node节点加入到当前集群中$kubeadmjoink8s每个组件都是一个独立的二进制文件,部署过程无非就是将二进制跟配置文件分...

2019-09-02 17:52:30

k8s与各网络插件集成(flannel calico canal kube-router romana cni-genie)

如果多次换不同网络插件实验,每次实验前先把/etc/cni/net.d/目录下文件清空 rm-rf/etc/cni/net.d/*复制代码 flannel#创建flannel目录下载相关文件mkdirflannel&&cdflannelwgethttps://raw.githubusercontent.com/coreos/flanne...

2019-09-02 17:48:31

Kubernetes集群的部署方式及详细步骤

一、部署环境架构以及方式第一种部署方式1、针对于master节点将APIServer、etcd、controller-manager、scheduler各组件进行yuminstall、编译安装或者展开安装的方式手动直接安装在master节点主机上,作为系统级守护进程运行。2、针对于node节点将kube-proxy、kubelet、docker、flannel各组件进行...

2019-09-02 17:44:43

基于SnappyData构建实时数据仓库

做数据仓库的同学会面临三大问题:性能、稳定性、准确性,归根结底还是性能问题;框架的天花板以及sql复杂度、计算资源的紧张都会导致数据仓库的性能受到挑战,随着业务的积累,性能的问题变的越来越明显,性能差直接导致整个数仓集群的稳定性差,经常出问题的数仓自然也就会数据不准,所以解决上述3个问题,应优先解决性能问题。介绍SnappyData是一个基于内存的数据库,和redis不同的是Snapp...

2019-08-27 10:36:17

clickhouse简单了解及使用

一、clickhouse:日处理记录数:十亿级1.开源的列式存储的数据管理系统2.支持线性扩展3.简单方便4.高可靠性5.容错(支持多主机异步复制,可以跨多个数据中心部署,单个节点或整个数据中心的停机时间不会影响系统的读写性能)二、关键功能-应用场景特性:深度存储广告网络和RTB采用列式存储向量化查询执行电信数据压缩数据压缩电子商务基于磁盘的存储,大部分列式存储...

2019-08-27 10:22:07

[译]快速上手:在R中使用XGBoost算法

你知道XGBoost算法是一种现在在数据科学竞赛的获胜方案很流行的算法吗?那么,他比传统的随机森林和神经网络算法强在哪里呢?广义上来说,它在效率,准确性,可行性都更有优势(接下来我们将会详细讨论)。在最近的几年中,模型预测已经变得越来越快速和准确了。我记得我曾花费数个小时在为某个模型构建特征工程上,模型却仅仅提升了几个百分点。现在,这些大量困难的问题都被更好的算法所解决。从技术...

2019-08-25 19:57:07

关于梯度下降算法的的一些总结

目录:1.前言2.正文  2.1梯度2.2梯度下降算法2.2.1批量梯度下降算法2.2.2随机梯度下降算法3.参考文献1.前言  这篇随笔,记录的是个人对于梯度算法的些许理解.由于充斥着太多关于梯度算法的各种说明软文,所以呢?本文是从一个实例出发,来逐步使用各种算法进行求解,并顺便试...

2019-08-25 19:57:01

Apache Parquet 与Apache ORC简介

1.列存储的优势传统的RDBMS大多使用的行存储方式,现如今随着大数据技术的发展,对于存储的要求越来越高,列存储相对有自己明显的优势:列数据相对来说比较类似,压缩比更高;一般的查询只涉及几列,列存储的查询性能也更高;可以方便地新增列等。在某些场景下,选择列存储是非常不错的选择,从节省存储的角度来说就非常吸引人了。目前,比较有名的开源实现有ApacheParquet和Apache...

2019-08-25 19:56:53

Adaboost详解(附带基本公式推导)

Adaboost详解第一次写博客,本人数学基础不是太好,如果有幸能得到读者指正,感激不尽,希望能借此机会向大家学习。这一篇的大部分内容都来自于《机器学习》这本书,以及自己的一些见解。MathJax还不会用,so公式都是我用MathType打出来后截图生成的。预备知识:这一部分主要是谈一谈Boosting的概念和原理,以及Adaboost中涉及到的基础数学公式即定理的推导。弱...

2019-08-25 19:56:46

使用Eclipse编写Spark应用程序(Scala+Maven) scala ide for eclipse

对Scala代码进行打包编译时,可以采用Maven,也可以采用sbt,相对而言,业界更多使用sbt。本教程介绍如何在Ubuntu中使用Eclipse来开发scala程序(使用Maven工具),在Spark2.1.0,scala2.11.8下验证通过。使用Eclipse,我们可以直接运行代码,省去许多繁琐的命令。(相关文章:如何在Ubuntu中使用Eclipse来开发sca...

2019-08-25 19:56:38

直接在eclipse上安装Scala IDE

安装Scala和安装Java差不多,如果你有eclipse和JDK那么直接点下一步就好。就是安装包有点大,整个240多MB。进入官方下载页面如下:

2019-08-25 19:55:18

ClickHouse集群安装

172.16.120.100ck_server_100(shard1)172.16.120.101ck_server_101(shard1)zk_server_101172.16.120.102ck_server_102(shard2)zk_server_102172.16.120.103ck_server_103(shard2)zk_server_1031.安装...

2019-08-23 11:35:49

clickhouse与mysql查询速度对比

数据准备工作:MySQL创建准备对比的表Bigtable并建立索引CREATETABLEBigtable(consumption_idVARCHAR(255),member_idINT(11),fans_idINT(11),bill_dateDATE,moneyVARCHAR(255),people_numINT(8),dish_nameVARCH...

2019-08-23 11:34:36

linux bash Shell特殊变量:Shell $0, $#, $*, $@, $?, $$和命令行参数

在linux下配置shell参数说明前面已经讲到,变量名只能包含数字、字母和下划线,因为某些包含其他字符的变量有特殊含义,这样的变量被称为特殊变量。例如,$表示当前Shell进程的ID,即pid,看下面的代码:$echo$$运行结果29949特殊变量列表变量含义$0当前脚本的文件名$n传递给脚本或函数的参数。n是一个数字,表示第几个...

2019-08-15 11:03:04

k8s构建java应用

上一节中了介绍了minikube的安装以及一个简单的hello-wordservice的部署,下面主要介绍如何部署一个java应用构建基础镜像1.构建centos镜像1.1构建之前,需要先安装docker>brewinstalldocker由于已经安装了minikube,它默认已经启动了一个内置的dockerdaemon,所以我们可以直接修改docker...

2019-08-12 17:47:09

scala之map操作史上最全

Map(映射)是一种可迭代的键值对(key/value)结构。所有的值都可以通过键来获取。Map中的键都是唯一的。Map也叫哈希表(Hashtables)。Map有两种类型,可变与不可变,区别在于可变对象可以修改它,而不可变对象不可以。默认情况下Scala使用不可变Map。如果你需要使用可变集合,你需要显式的引入importscala.collection.mutabl...

2019-08-09 17:17:32

shell截取字符串的方法

shell中截取字符串的方法有很多中,${expression}一共有9种使用方法。${parameter:-word}${parameter:=word}${parameter:?word}${parameter:+word}上面4种可以用来进行缺省值的替换。${#parameter}上面这种可以获得字符串的长度。${parameter%word}最小限度从后面截取wor...

2019-08-09 15:20:31

查看更多

勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 1024超级勋章
    1024超级勋章
    授予原创文章总数达到1024篇的博主,感谢你对CSDN社区的贡献,CSDN与你一起成长。
  • 勤写标兵Lv3
    勤写标兵Lv3
    授予每个自然周发布7篇到8篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。