1 try to stay simple

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 21w+

机器学习前端展示好用工具之streamlit

http://blog.hubwiz.com/2019/11/07/streamlit-manual/

2020-04-13 15:06:40

ROC及AUC二值分类判断标准

https://blog.csdn.net/yinyu19950811/article/details/81288287

2020-04-13 15:03:14

Kimball维度建模

https://www.jianshu.com/p/daab50a23c56

2020-04-09 14:40:54

sql-server使用存储过程进行机器学习

https://www.cnblogs.com/joyanli/p/12529459.html

2020-04-02 14:19:40

sql server

创建:https://blog.csdn.net/Lesour/article/details/88914198(1)主数据文件用来存储数据库的数据和数据库的启动信息。每个数据库必须有且只有一个主数据文件,其扩展名为.mdf。实际的主数据文件都有两种名称:操作系统文件名和逻辑文件名(在sql语句中会用到)。(2)辅助数据文件用来存储数据库的数据,可以扩展存储空间。一个数据库可以有多个辅助...

2020-04-02 10:58:22

CountVectorizer参数

https://zhuanlan.zhihu.com/p/37644086

2020-03-31 10:33:06

nlp--ngram模型和常见数据平滑方法(避免有的词从未出现)

http://52opencourse.com/111/%E6%96%AF%E5%9D%A6%E7%A6%8F%E5%A4%A7%E5%AD%A6%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86%E7%AC%AC%E5%9B%9B%E8%AF%BE-%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%EF%BC%88...

2020-03-31 09:58:24

异常值检测

https://baijiahao.baidu.com/s?id=1619431536284756645&wfr=spider&for=pc

2020-03-27 13:24:11

Mnist explaination--introduce to tensorflow

MNIST For ML BeginnersThis tutorial is intended for readers who are new to both machine learning and TensorFlow. If you already know what MNIST is, and what softmax (multinomial logistic) regression i...

2020-03-26 18:44:36

SVM

SVM 核函数概念简介:https://blog.csdn.net/Wisimer/article/details/89573319?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158511433319724811849788%2522%252C%2522scm%2522%253A%252220140713.130056874…...

2020-03-25 14:11:39

如何理解softmax

系数是这个Wij,训练模型主要是为了求出Wijhttps://blog.csdn.net/weixin_35770067/article/details/103565192?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522158509102919724847023355%2522%252C%2522scm%2522%253A%252...

2020-03-25 10:42:29

深度神经网络(DNN)反向传播算法(BP)

https://www.cnblogs.com/pinard/p/6422831.html

2020-03-23 14:08:53

感知机原理

https://www.cnblogs.com/pinard/p/6042320.html

2020-03-23 13:43:27

yarn框架运行过程

Mapreduce1.0缺点:只有一个Jobtracker,存在单点故障的问题,jobtracker任务过重,内存开销大,上限4000个节点资源分配不合理,把CPU分成slot,mapslot 和reduceslot不能互用于是提出了Yarn(hadoop2.0)Yarn基本就是对Mapreduce1.0的功能进行了拆分:Jobtracker负责的资源管理任务交给Yarn中Resour...

2020-03-19 10:29:25

MapReduce概念详解

数据处理能力提升的两种路线:1.单核CPU从单核到双核到四核八核,2分布式并行编程随着 CPU制作工艺达到天花板,现在分布式并行编程有了发展,分布式并行编程就是借助一个集群通过多台机器同时处理大规模数据集。谷歌提出了mapreduce,apache做了开源实现,一个HDFS和Mapreduce合称为MapReduce,谷歌提出之前实际也有分布式并行编程MapReduce优点:每个节点都...

2020-03-17 11:47:53

HIVE-分区表详解以及实例

http://dblab.xmu.edu.cn/blog/1876-2/#more-1876

2020-03-13 20:41:37

hbase错误: 找不到或无法加载主类 org.apache.hadoop.hbase.util.GetJavaProperty SLF4

ttps://blog.csdn.net/pycrossover/article/details/102627807

2020-03-13 19:37:53

ubuntu14下hive操作

service mysql startmysql -u hadoop -p#mysql中创建create database hive; #保存hive元数据与hive-site.xml中localhost地址对应grant all on . to hive@localhost identified by ‘hive’; #将数据库所有权限给hive用户,hive是hive-site.xml...

2020-03-13 15:49:31

structure streaming输入源之Kafka源实现

用生产者程序每0.1s生成一个单词写入kafka一个主题中,spark消费者程序每隔8s对收到的单词词频统计,把结果输出到kafka的另一个主题中#启动kafka,zookeeper终端cd /usr/local/kafkabin/zookeeper-server-start.sh config/zookeeper.properties#新建终端,不要关上一个,kafka终端cd /us...

2020-03-05 20:08:47

structure streaming输入源之File源实现

文件放入到给定目录的操作应该具有原子性,即不能长时间在给定目录下打开文件写入内容,而是应该写入到临时文件后移动文件到给定目录下步骤:1.创建程序生成jason格式的file源测试数据2.创建程序对数据进行统计#!/usr/bin/env python3#-*-coding: utf8-*-import osimport shutilimport randomimport tim...

2020-03-05 18:08:06

查看更多

勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。