10 文宇肃然

尚未进行身份认证

我要认证

心之所向 无有不敌

等级
TA的排名 800

Tableau必知必会之如何定制个性调色板

虽然Tableau的颜色搭配功能非常强大,可供选择的颜色也是多种多样的。可是,有些用户会有自己的一套配色方案,或者是要增加一些Tableau调色板上没有的颜色。有办法解决吗?打开“我的Tableau存储卡”文件夹在该文件夹的最下方有一个“Preferences”文件,用TXT格式打开这个文件。查询颜色值在RBG颜色查询对照表中找到你惯用的配色方案中所有颜色的颜色值,例如挑选了白色(#FFFFFF)与黑色(#000000)添加代码往第一步打开的文件中添以下的几.

2020-09-19 07:01:51

胶囊网络(Capsule)实战——keras算法练习

Capsule是深度学习之父hinton在2017年提出来的一个较为轰动的网络结构。capsule这个结构主要的特点是:Vector in Vector out——向量进,向量出,而普通的神经元(Neuron)是Vector in Scalar out——向量进,标量出。capsule输出的向量比Neuron输出的标量表达出更丰富的特征。下图台湾大学的李宏毅老师对capsule解读的slide。Neuron的输出标量只能表示到是否存在鸟嘴。 capsule的输出的向量不仅能表示鸟嘴是否存在,而且还能

2020-09-19 07:00:52

在阿里写了8年代码后,我才明白这些道理

导读:很多工程师在工作一段时间后会遇到迷茫期,虽有技术傍身,也难免会产生焦虑,反复思考怎样才能快速成长。关于如何提高自己的思考力,运用思考的力量推动能力提升,以此实现技术成长,阿里巴巴盒马产品技术部的岩动在阿里工作8年后,总结了一套思考方法,分享给每个正在成长的工程师。(本篇文章较长,阅读时间约30分钟,建议收藏后,找一个合适的时间慢慢品读哦)引言我们来看一下几类在程序员成长、发展的常见问题,如果你或多或少存在一些,那么恭喜你,这篇文章值得你仔细往下看了: 你自认为付出了跟别...

2020-09-18 09:36:03

MATLAB在AI领域的应用,语音信号处理全解析(附代码)

数字信号处理课设,我们使用MATLAB对语音信号进行了一系列处理,并将其所有功能集中于下图界面中:这个界面涉及功能众多,其中包括语音信号的观察分析、音色变换、AM调制解调、减抽样、加噪去噪、相频分析和幅频滤波等,最重要的是对MATLAB中函数的掌握,通过不同函数的组合实现你想要实现的功能。本篇不会给出整个界面的程序,下面会分块给出每个功能的程序,整个界面只需GUI设计界面文件、定义结构体并把对应键程序打进去即可。1、语音信号的采集1.1题目要求使用windows下的录音机录制一段语音

2020-09-18 08:55:23

新技术加速隐私暴露,如何应对?

新技术加速隐私暴露,如何应对?(一)原创数据玩家一个数据玩家的自我修养2019-10-09收录于话题#新技术与隐私保护8个点击上方蓝字关注数据玩家 正文约4000字,读完需11分钟序最近的大数据行业风声鹤唳,多家大数据服务头部企业、贷超、催收公司被查,引发行业地震,未被牵连的企业纷纷自查,其他头部公司黑稿和纠纷频出。从业者如惊弓之鸟,人人自危;普通用户纷纷叫好,同时引发对隐私保护的担忧和强监管诉求。此刻我又想...

2020-09-17 10:52:10

tableau必知必会之快速制作嵌套条形图

嵌套条形图一般应用在资源覆盖情况和指标进度完成对比等场景里,可以使相关的数据看起来更具对比性。资源覆盖:比如资源总量和分摊到每个区的量,用来查看各个区在资源分布上的优略势;指标完成进度:比如每个月每个人的计划工作量和实际完成工作量,用来对比查看进度。那么,如何在Tableau里制作嵌套条形图呢?这里,我们使用全球订单的数据源,通过制作套嵌条形图来实现两个年度的对比。其它应用场景可参考此步骤制作。具体步骤如下:一、创建两个计算字段2010年销量:IF YEAR([订单日期])=20

2020-09-17 09:13:07

谈谈Tensorflow工业级别的API——Estimator

正如Tensorflow的官网所示:TensorFlow 提供一个包含多个 API 层的编程堆栈其架构图如下。用户可以任意选择不同级别的API进行自己模型的构建。而本篇文章就最高级别的API——Estimator进行一个简短的介绍。tensorflow API层的编程堆栈使用Estimator的流程大致如下:构建输入数据流 定义特征列 创建Estimator实例 训练模型,进行预测创建输入数据流tf.data API 构建输入数据流的流程如下图所示。构建输入..

2020-09-17 09:12:30

知识图谱关系抽取之PCNN——tensorflow实现

知识图谱( Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。上述一大段是我从2018知识图谱发展报告中copy下来的一段话,用普通人能听懂的人话来描述:知识图谱就是把去发现世间万物的之间的联系。 在技术上就是将数据以一个一个的<subject,relation,object>的三元组形式存储起来。不知道大家有没有这样一种感受,如果你在某一领域的学习了解到很多的知

2020-09-16 09:03:32

Tableau必知必会之妙用Last函数查看消费数据

假如你是客户经理,想了解最近几年,每一个客户的消费情况。但是,这些客户分散在不同的地区,不同的地区数据更新时间不同,甚至有些数据已经结束了更新。从每个客户的最末次消费时间点开始,以月为消费单位(每个月的N笔消费只算一次),往前倒推。看看他们最后的六笔消费分别在什么时间?这确实无法通过简单的筛选实现。这里,你可以尝试按照以下步骤操作,用Last函数帮你得到想要的结果。一、创建计算字段计算字段里,last()代表最近的数据,6代表最近数据的数量。计算字段里面的意思是,如果是最近6次的数据

2020-09-16 09:01:15

Tableau必知必会之如何学做漂亮的桑基图Sankeydiagram

桑基图(Sankeydiagram),即桑基能量分流图,也叫桑基能量平衡图。它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融、零售等数据的可视化分析。每次为用户演示桑基图时,都会有人问:用Tableau做桑基图会不会很难?我想说:相对基础的图表而言,桑基图的制作本身是有一定难度。但是,我相信智慧的数据粉们肯定都能学会。我们将如下图,得出各产品类型向各区域的销售额流向。需要说明的是:桑基图是由3个工作簿组成的,2个堆叠条以及1个S型连线图.

2020-09-15 08:49:31

Keras蚂蚁金服大赛实战——自然语言处理技术

之前在自然语言处理技术系列的第一篇NER实战的结语中介绍过:序列标注(分词,NER),文本分类(情感分析),句子关系判断(语意相似判断),句子生成(机器翻译)是NLP领域的四大任务,之后我又陆续简单介绍了情感分析实战,和Seq2Seq生成对联。今天我们来到这个系列的终章篇——语义相似判断。语义相似判断就是判断两个句子是否具有相同的语义,其应用场景多用于问答系统:判断两个问句是否具有相同的语义。 判断问题和检索出的答案是否匹配。当然也可以用于其他场景比如判断两幅图片是否是一样——人脸识别,所以从广义上

2020-09-15 08:47:50

Tableau必知必会之如何设置邮件预警

通过邮件预警功能就可以轻松实现Tableau的自动提醒。只是,在工作簿里要做些小小的修改。在学习设置步骤之前,我先说一下邮件预警的基本原理。邮件预警包含两个含义:达到预警的目的——即当设置的值达到一定数值后,对用户进行提醒提醒指的是邮件提醒,会涉及到tableau server里面的邮件订阅功能再来看看邮件订阅的功能,登陆Tableau Server,点击进去其中一个视图,点击订阅。然后,可以看到一个选项,“视图为空的情况下不发送”。那就是说,如果我把这个选项勾上,当这个视图中没有任何显

2020-09-14 09:16:56

Keras情感分析(Sentiment Analysis)实战---自然语言处理技术

情感分析(Sentiment Analysis)是自然语言处理里面比较高阶的任务之一。仔细思考一下,这个任务的究极目标其实是想让计算机理解人类的情感世界。我们自己都不一定能完全控制和了解自己的情感,更别说机器了。不过在人工智能的认知智能阶段(人工智能三阶段——计算智能,感知智能,认知智能),商家还是可以用它来做一些商品或服务的评论分析,继而有效地去优化商品或服务,为消费者们提供更好用户体验。情感分析任务简介情感分析任务其实是个分类任务,给模型输入一句话,让它判断这句话的情感是积极的,消极的,还是

2020-09-14 09:11:36

产品运营必须知道的几个概念,如何进行网页分析?

通过上一期内容《产品运营必须知道的几个概念,什么是定向营销?》,我们对自己的目标用户开始了引流行为,但是仅仅有流量是不够的。引流进来的用户着陆页在哪儿,在你网站做了什么,最后又是从哪儿退出的,他们又为什么要走呢,网站性能还可以做的更好吗?回顾一下Google Analystics报表逻辑我们就可以知道,行为内主要是告诉我们用户在网站什么页面产生了交互的模块。行为这一模块同其他模块相似,包含了很多子模块,如概览、行为流、网站内容、网站速度等,下面我们一一来讨论。概览这里不仅限于网页浏览

2020-09-13 07:55:31

Java 动态调试技术原理及实践

调试是发现和减少计算机程序或电子仪器设备中程序错误的一个过程。最常用的断点调试技术会在断点位置停顿,导致应用停止响应。本文将介绍一种Java动态调试技术,希望能对大家有帮助。同时也欢迎读者朋友们一起交流,继续探索动态化调试技术。1. 动态调试要解决的问题断点调试是我们最常使用的调试手段,它可以获取到方法执行过程中的变量信息,并可以观察到方法的执行路径。但断点调试会在断点位置停顿,使得整个应用停止响应。在线上停顿应用是致命的,动态调试技术给了我们创造新的调试模式的想象空间。本文将研究Java语言.

2020-09-13 07:54:46

大厂面试爱问的「调度算法」,20 张图一举拿下

前言最近,我偷偷潜伏在各大技术群,因为秋招在即,看到不少小伙伴分享的大厂面经。然后发现,操作系统的知识点考察还是比较多的,大厂就是大厂就爱问基础知识。其中,关于操作系统的「调度算法」考察也算比较频繁。所以,我这边总结了操作系统的三大调度机制,分别是「进程调度/页面置换/磁盘调度算法」,供大家复习,希望大家在秋招能斩获自己心意的 offer。正文进程调度算法进程调度算法也称 CPU 调度算法,毕竟进程是由 CPU 调度的。当 CPU 空闲时,操作系统就选择内存中的某个「就绪.

2020-09-12 07:35:40

扩张的矩阵三要素——时间、空间和事件

时间,空间和实物(事件)三个要素构成一个场景。改变其中任何一个要素都会进入到一个新的场景,同时另外两个要素也会随之发生改变。从产品的角度来看,三个要素的改变都可以让一个产品从一个现有的场景进入到另一个场景,完善产品的场景矩阵。甚至是通过三个要素的组合和不同颗粒度的划分,创造出全新的使用场景,使产品进入空白的市场实现新的扩张和增长。时间本篇我们从场景的第一个要素时间来看。时间相对于另外两个要素空间和实物更加的线性和均匀,并且有统一的标准度量单位,分钟,小时,天等。每一个不同的时间单位都对应一.

2020-09-12 07:35:06

Tableau必知必会之实用漏斗图的三种制作方法

漏斗图适用于业务流程比较规范、周期长、环节多的流程分析,通过漏斗各环节业务数据的比较,能够直观地发现和说明问题所在。零售电商行业的用户提出分析需求:访客数量→阅览数量→下单数量→付款数量→完成数量,实际就是看看有多少访问过我们店铺的客户最后实际完成购买的转化过程。类似这种层层过滤的数据用怎样的图形去表达比较合适呢?我推荐漏斗图。这里,我分享三种用Tableau制作漏斗图的方法。方法一这种方法制作比较简单,也能大致展现出我们想要的过滤的效果。具体步骤如下:第一步:按下图将所需字

2020-09-11 08:40:34

Kaggle提升模型性能的超强杀招Stacking——机器学习模型融合

之前的文章中谈到了机器学习项目中,要想使得使得机器学习模型进一步提升,我们必须使用到模型融合的技巧,今天我们就来谈谈模型融合中比较常见的一种方法——stacking。翻译成中文叫做模型堆叠,接下来我们就来了解下,此法到底如何将模型做堆叠从而提升模型效果的。stacking具体流程我们就对着下图(两层的stacking)来详细描述一下如何做模型stacking:首先将数据分为5份, 在stacking的第一层定义5个基模型[model_1 ,model_2,model_3,model_4,mod

2020-09-11 08:39:53

Keras命名体识别(NER)实战---自然语言处理技术

命名体识别(Name Entity Recognition)是自然语言处理(Nature Language Processing)领域中比较重要的一个任务,几乎百分之50的和文本处理有关的项目中都会涉及到命名体识别。笔者认为其中最关键的原因是:从广义的角度来讲,如果把一句话比作一串珍珠的话,命名实体就是这串珍珠项链中的珍珠,句子的其他部分是把珍珠串起来的线。举个例子: "小明在1992年从哈佛大学毕业 "其中小明,1992年,哈佛大学都是命名实体,而这些实体包含了这句话里面的极为重要信息:人物信息,

2020-09-10 06:43:28

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 签到新秀
    签到新秀
    累计签到获取,不积跬步,无以至千里,继续坚持!
  • 新人勋章
    新人勋章
    用户发布第一条blink获赞超过3个即可获得
  • 阅读者勋章Lv1
    阅读者勋章Lv1
    授予在CSDN APP累计阅读博文达到3天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 分享达人
    分享达人
    成功上传6个资源即可获取