8 赵大寳Note

尚未进行身份认证

我要认证

公众号:赵大寳Note(ID:StateOfTheArt),跟我一起探索世界

等级
TA的排名 1w+

AUC

AUC: Area Under Curve, 默认为ROC(receiver operating characteristic curve) Curve, 也可以指定PR(Precision Recall) curve。由于ROC曲线的X轴为False Positive Rate,Y轴为True Positive Rate,AUC是可以指 随机给定一个正样本和一个负样本,分类器输出该正样本为正的 比 输出该负样本为正 要大的概率,即 AUC = P(P_tpr > P_fpr).AUC的计算方法

2020-06-16 19:45:50

DeePray:深度学习推荐算法新基建

开源项目 DeePray 发布啦!针对推荐算法,特别是点击率预估领域目不暇接的诞生新模型现状,如何将心仪模型快速应用于领域内一直是一项棘手的问题,DeePray这个项目通过统一构建数据流水线,提供各类网络层组件,在此之上,以模块化设计,用组件之砖,搭建各类网络之模型,并以灵活配置式的方式提供调用接口,你也可以在DeePray的基础上,选用各类组件模块,就像玩乐高积木一样建造你自己的模型。deepray.model目录下已实现LR、FM、FFM、DeepFM、Wide&Deep、Deep&Cr

2020-06-05 21:32:05

Spark伪分布式环境配置与Scala、Java、Python编程实例

本文通过收集Spark中的基本概念、在Mac上配置伪分布式环境并分别用Python、Scala、Java三种语言独立编程实现了分布式版的WordCount程序以进行测试学习,来熟悉Spark的常用操作。本文原发布于:https://fuhailin.github.io/Spark-Tutorial/ ,关注我的公众号"赵大寳Note"(ID:StateOfTheArt),回复“HelloSpa...

2020-03-09 01:00:52

在Mac上配置HBase伪分布式娱乐环境

HBase是运行在Hadoop分布式文件系统HDFS上进行数据存储的开源非关系型分布式数据库,2020年我尝试在Mac上配置一个伪分布式的v2.2.3 HBase环境,看看能不能进行一些基本的读写操作,以便熟悉一下分布式数据库有什么特点。三种运行模式单机模式Hbase不使用HDFS,仅使用本地文件系统ZooKeeper与Hbase运行在同一个JVM中伪分布式模式所有进程...

2020-03-04 22:25:17

在Mac上配置Hadoop伪分布式娱乐环境

去年我曾发文记录如何在Ubuntu上配置伪分布式版的Hadoop3娱乐环境:https://fuhailin.github.io/Hadoop-Install/ ,通过配置Hadoop娱乐环境你可以熟悉Hadoop的一些基本概念与操作方式,后来我的Dell被我玩坏了,也就没法在Ubuntu上顺畅娱乐了,后来一狠心入手了现在MacBook Pro,希望它能皮实耐操一点。今天我们继续在MacOS配置一...

2020-02-29 00:34:09

整理Sigmoid~Dice常见激活函数,从原理到实现

本文首发于我的个人博客:激活函数:https://fuhailin.github.io/activation-functions/并同步于我的公众号:赵大寳Note(ID:StateOfTheArt),回复关键词【激活函数】下载全部代码。激活函数之性质1. 非线性:即导数不是常数。保证多层网络不退化成单层线性网络。这也是激活函数的意义所在。2. 可微性:保证了在优化中梯度的可计算性。虽...

2020-02-21 10:39:03

智能投顾

招行聪明定投怎么做的?均线偏离法:以均线为基准线,当指数低于均线时加大定投额;当指数高于均线时减少定投额。实现在低点时多买,高点时少买,充分利用市场行情的变化,从而摊薄建仓成本,获取更高收益。https://zhuanlan.zhihu.com/p/52827083智能节流器:财富号为基金公司提供了“智能节流器”,提供拼图模式、组件库、模块库,用AI帮基金公司做智能合图,这就相当于给基金公司...

2019-07-24 18:01:14

IPFS

IPFS——它能取代HTTP协议?现有的web协议——HTTP协议实际上已经存在很多问题。我这里引用官网https://ipfs.io/的介绍:HTTP效率低下,服务器成本昂贵使用HTTP协议从一台计算机服务器上一次只能下载一个文件,而不是同时从多台计算机中获取文件。通过P2P方式的视频传输可以节省带宽成本的60%。历史文件被删除网页的平均使用寿命为100天,大量的网站文件不能得以长期...

2019-07-23 15:46:08

tensorflow:input pipeline性能指南

以tf.data优化训练数据 Google开发者大会2018tensorflow:input pipeline性能指南

2019-06-10 19:08:46

【Leetcode】K sum problem

1. Two SumBruteForce首先我们可以想到一个暴力破解的方法,每两个数字之间求和看是不是目标值,时间复杂度为O(n2)O(n^2)O(n2)vector<int> twoSum_BruteForce(vector<int> &nums, int target){ vector<int> res; for (int i...

2019-06-08 15:42:05

MinGW

MinGWMinGW(Minamalist GNU For Windows)MinGW安装MinGW(Minamalist GNU For Windows)MinGW(Minamalist GNU For Windows)是个精简的C/C++编译器,它实际上是将经典的开源C语言编译器GCC移植到了Windows下今天才知道MinGW安装配件还可以通过命令行的方式,MinGW安装下载MinG...

2019-06-08 14:07:11

c++类实例化的两种方式:new与不new的区别

new创建类对象与不new区别A a;A * a = new a();以上两种方式皆可实现类的实例化,有new的区别在于:前者在堆栈中分配内存,后者为动态内存分配,在一般应用中是没有什么区别的,但动态内存分配会使对象的可控性增强。不加new在堆栈中分配内存大程序用new,小程序直接申请只是把对象分配在堆栈内存中new必须delete删除,不用new系统会自动回收内存起初刚...

2018-10-22 20:38:47

tensorflow中常用的计算操作

1、tf.reduce_sum从tensor的维度上面计算元素之和tf.reduce_sum( input_tensor, # 输入 axis=None, # 表示在哪个维度进行sum操作。 keepdims=None, # 表示是否保留原始数据的维度,False相当于执行完后原始数据就会少一个维度。 name=None, reduction_ind...

2018-10-22 19:09:45

【剑指Offer】24. 二叉搜索树的后序遍历

题目描述:输入一个整数数组,判断该数组是不是某二叉搜索树的后序遍历的结果。如果是则输出Yes,否则输出No。假设输入的数组的任意两个数字都互不相同。思路:1、序列的的最后一个数字是根节点2、二叉搜索树左子树的节点都比根节点小,右子树的节点都比根节点大。C++递归与非递归实现代码:#include <iostream>#include <vector>#in...

2018-10-20 23:05:15

gpustat : Linux下面监控GPU状态

nvidia-smi是 Nvidia 显卡命令行管理套件,基于 NVML 库,旨在管理和监控 Nvidia GPU 设备。nvidia-smi 的输出这是 nvidia-smi 命令的输出,其中最重要的两个指标:显存占用GPU 利用率显存占用和 GPU 利用率是两个不一样的东西,显卡是由 GPU 计算单元和显存等组成的,显存和 GPU 的关系有点类似于内存和 CPU 的关系。这里推荐...

2018-10-17 15:41:18

Tensorboard 6006端口无法访问的问题

1 、写一个简单实例,完成tensorboard 日志输出功能,示例代码如下:import tensorflow as tf input1 = tf.constant([1.0, 2.0, 3.0], name='input1')input2 = tf.Variable(tf.random_uniform([3]), name='input2')output = tf.add_n([in...

2018-10-16 14:24:56

python正则表达式从字符串中提取数字

python从字符串中提取数字使用正则表达式,用法如下:## 总结## ^ 匹配字符串的开始。## $ 匹配字符串的结尾。## \b 匹配一个单词的边界。## \d 匹配任意数字。## \D 匹配任意非数字字符。## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符)。## x* 匹配0次或者多次 x 字符。## x+ 匹配1次或者多次 x 字符。...

2018-10-15 17:42:39

计算广告学

计算广告学目标:将流量转化为利润,尽可能使推荐的广告被用户点击。专业术语:CTR:Click-Through-Rate,点击通过率。把一个广告所有曝光出来的次数作为总次数,把用户点击并查看广告的次数占总次数的比例叫点击率。CTR=Click times / Show times点击率是条件概率:可以表示为:Pro(click=yes |ad, page, user, time, regi...

2018-10-08 15:53:18

笔试笔记

1、一个盒子中装有黑白两色球,其中3只红球,2只黑球,如果不放回的依次取两次球,第二次取到红球的概率?解:解:解:当第一次取到红球时,第二次取到红球的概率 P=35⋅24=310P=\frac{3}{5}\cdot \frac{2}{4}=\frac{3}{10}P=53​⋅42​=103​当第二次取到黑球时,第二次取到红球的概率P=25⋅34=310P=\frac{2}{5}\cdot \f...

2018-09-22 00:19:53

C++中的平方、开方、绝对值怎么计算

#include<math.h>//平方pow()inta=pow(4,2);//4的平方=16//开方intb=pow(4,0.5);//4的平方根=2intc=sqrt(4);//4的平方根=2

2018-09-11 21:47:53

查看更多

勋章 我的勋章
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 原力探索
    原力探索
    参与《原力计划【第二季】——打卡挑战》的文章入选【每日精选】的博主将会获得此勋章。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。