2 阿里云云栖社区

尚未进行身份认证

阿里云官方内容社区!博客、直播、问答、技术团队、资料下载等。如需转载或内容类合作,邮件 yqeditor@list.alibaba-inc.com 秒级回复!

等级
TA的排名 636

KDD 2019论文解读:异构信息网络上的对抗生成学习

前言网络表示学习是一种在低维空间中表示网络数据的方法,在异构信息网络分析中得到了广泛的应用。现有的异构信息网络表示学习方法虽然在一定程度上实现了性能的提高,但仍然存在一些主要的不足。最重要的是,它们通常采用负抽样的方法从网络中随机选择节点,而不学习底层的分布以获得更鲁棒的表示。受生成式对抗网络(GAN)的启发,我们开发了一个用于异构信息网络表示学习的新框架HeGAN,它在一种极小极大的博...

2019-08-19 13:30:22

OceanBase高可用实践

背景高可用是构建分布式系统的基石。一方面,出于成本考虑,分布式系统往往采取比较廉价的硬件,其可靠性相对于小型机、专有硬件有很大的不足,而分布式系统的规模一般比较大,假如硬件的可靠性只有三个9(99.9%),一个1000台机器规模的集群每天将面临1台机器宕机的风险,在如此大规模的情况下,存储介质,比如硬盘可能会随时都有损坏,结点之间的网络可能随时都会有抖动,机房可能局部或整体断电,地区或数...

2019-08-19 12:39:42

Knative Serving 之路由管理和 Ingress

Knative默认会为每一个Service生成一个域名,并且IstioGateway要根据域名判断当前的请求应该转发给哪个KnativeService。Knative默认使用的主域名是example.com,这个域名是不能作为线上服务的。本文我首先介绍一下如何修改默认主域名,然后再深入一层介绍如何添加自定义域名以及如何根据path关联到不同的KnativeServic...

2019-08-19 12:05:22

阿里云与A站在一起后,悄悄干了件大事

八月盛夏,“AcFun弹幕视频网站”(简称“A站”)的视频服务器全面迁移上阿里云(此处应有掌声)!A站去年与阿里云达成此项合作。在迁移过程中,阿里云提供专业技术解决方案团队,为A站建立就近迁移方案,定制专门的迁移工具,同时加以自动和人工双重校验环节,在确保数据安全的情况下完成高效迁移。整个迁移上云的工作历时半年多,完整迁移了A站建成十多年以来,累计数百万份的视频稿件。去年6月快手正式收...

2019-08-19 11:36:18

揭秘!机器人和你对话时在想什么?

阿里妹导读:为什么聊天机器人越来越普及?聊天机器人不仅可以节省时间,提升效率,还能一天24小时提供服务,更是可以减少误差。聊天机器人背后的问题原理是什么?效率如何提升?就是今天我们要了解的内容。本篇内容已被收录于ACL2019,希望对你有所帮助。1.背景在Chatbot整体解决方案中,既有面向任务型的taskbot(诸如订机票、查天气等),也有更偏向知识问答的qabot,而在客服场...

2019-08-19 10:55:53

企业级数据库新型研发模式——数据管理DMS实践

2019阿里云峰会·上海开发者大会于7月24日盛大开幕,本次峰会与未来世界的开发者们分享开源大数据、IT基础设施云化、数据库、云原生、物联网等领域的技术干货,共同探讨前沿科技趋势。本文整理自数据库专场中阿里云智能技术专家王天振(为知)的精彩演讲,传统数据库研发模式不仅困难重重,并且效率低下,而基于DMS的企业级数据库新型研发模式却能够做到研发高效,变更稳定和数据安全,本文就为大家介绍阿里巴巴根据...

2019-08-16 14:03:23

AnalyticDB for MySQL:PB级云数仓核心技术和场景解析

2019阿里云峰会·上海开发者大会于7月24日盛大开幕,本次峰会与未来世界的开发者们分享开源大数据、IT基础设施云化、数据库、云原生、物联网等领域的技术干货,共同探讨前沿科技趋势。本文整理自数据库专场中阿里云智能高级技术专家南仙的精彩演讲,本文为分享了阿里云PB级云数据仓库AnalyticDBforMySQL的核心技术以及其应用场景。数据库专场PPT下载本文内容整理自演讲视频以及PPT...

2019-08-16 13:14:22

通过SQL即可让监控分析更简单更高效

1.前言阿里时序时空数据库TSDB最新推出TSQL,支持标准SQL的语法和函数。用户使用熟悉的SQL,不仅仅查询更简单易用,用户还可以利用SQL强大的功能,实现更加复杂的计算分析。2.为什么需要用SQL做时序查询?2.1SQL拥有广泛用户基础SQL作为一个诞生于上世纪70年代的编程语言已经存在几十年了。这是一个相对而言较“古老”的编程语言,但又是一个有着广泛用户基础的语言。在...

2019-08-16 12:30:54

系统性能提升利刃 | 缓存技术使用的实践与思考

导读按照现在流行的互联网分层架构模型,最简单的架构当属Web响应层+DB存储层的架构。从最开始的单机混合部署Web和DB,到后来将二者拆分到不同物理机以避免共享机器硬件带来的性能瓶颈,再随着流量的增长,Web应用变为集群部署模式,而DB则衍生出主从机来保证高可用,同时便于实现读写分离。这一连串系统架构的升级,本质上是为了追求更高的性能,达到更低的延时。高德作为一款国民级别的导航软件,导航路...

2019-08-16 12:05:43

编码方法论,赋能你我他

导读DonRoberts提出的一条重构准则:第一次做某件事时只管去做;第二次做类似的事时会产生反感,但无论如何还是可以去做;第三次再做类似的事时,你就应该重构。编码也是如此,当多次编写类似的代码时,我们需要考虑是否有一种方法能够提高编码速度。作者多年来致力于敏捷开发,总结了一套编码的方法论,有助于程序员"快速、优质、高效"地进行编码。方法1:手工编写代码大多数刚学习Jav...

2019-08-16 11:00:05

为什么选择Cassandra

cassandra概况为什么选择Cassandra?cassandra到底有那些令人印象深刻的特点呢?不防我们先来看下cassandra目前的大体概况。理论扎实,师出名门cassandra不仅吸收了dynamo论文中的如何做分布式,如何做副本复制,故障容错等方面成功的经验,又吸取了googlebigtable中的LSM单机引擎层面精华。理论扎实,工程实现靠谱,所以面世以来,不断受到...

2019-08-15 13:55:55

无标注数据是鸡肋还是宝藏?阿里工程师这样用它

阿里妹导读:针对业务场景中标注数据不足、大量的无标注数据又难以有效利用的问题,我们提出了一种面向行为序列数据的深度学习风控算法AutoRisk,提出通过代理任务从无标注数据中学习通用的特征表示。这种思想与目前NLP领域前沿的Bert等预训练模型不谋而合,但是由于行为序列数据和业务的特点显著区别于NLP,模型的设计和实现又有很大区别。最终,模型在真实场景中落地并取得了显著的增益;...

2019-08-15 13:32:25

Tablestore + Blink实战:交易数据的实时统计

背景交易数据的实时统计是电商网站一个核心功能,可以帮助用户实时统计网站的整体销售情况,快速验证“新销售策略”的效果。我们今天介绍一个基于表格存储(Tablestore)实现交易数据的实时计算,给大家提供一个新使用方式。Tablestore作为在线的结构化数据库,提供了毫秒级的访问延时和丰富的查询方式,能高效的支撑交易数据的存储和查询,同时Tablestore已经原生支持阿里云的流计算框架F...

2019-08-15 13:04:00

应用实时监控 ARMS 上线用户行为回溯功能

随着前端技术日新月异迅猛发展,为了实现更好的前端性能,最大程度提高用户体验,支持单页应用的框架逐渐占领市场,如众所周知的React,Vue等等。但是在单页应用的趋势下,快速定位并解决JS错误却成为一大难题。在当下的互联网行业,对前端性能要求越来越高,前端性能监控的产品层出不穷,javascript错误诊断更是其中举足轻重的一个环节。帮助开发者排查线上bug,实现快速定位问题,高效解决问题,是我们努...

2019-08-15 11:33:03

Schedulerx2.0工作流支持数据传输

1.前言Schedulerx2.0是阿里中间件自研的基于akka架构的新一代分布式任务调度平台,提供定时、任务编排、分布式跑批等功能,具有高可靠、海量任务、秒级调度等能力。Schedulerx2.0提供可视化的工作流进行任务编排,该文章将详细介绍如何使用schedulerx2.0的工作流进行上下游任务的数据传输。2.接口介绍2.1支持的执行方式和任务类型当前只有java任...

2019-08-15 10:36:13

阿里高级技术专家方法论:如何写复杂业务代码?

阿里妹导读:张建飞是阿里巴巴高级技术专家,一直在致力于应用架构和代码复杂度的治理。最近,他在看零售通商品域的代码。面对零售通如此复杂的业务场景,如何在架构和代码层面进行应对,是一个新课题。结合实际的业务场景,Frank沉淀了一套“如何写复杂业务代码”的方法论,在此分享给大家,相信同样的方法论可以复制到大部分复杂业务场景。一个复杂业务的处理过程业务背景简单的介绍下业务背景...

2019-08-14 14:08:57

记一次Cassandra Java堆外内存排查经历

背景最近准备上线cassandra这个产品,同事在做一些小规格ECS(8G)的压测。压测时候比较容易触发OOMKiller,把cassandra进程干掉。问题是8G这个规格我配置的heap(Xmx)并不高(约6.5g)已经留出了足够的空间给系统。只有可能是Java堆外内存使用超出预期,导致RES增加,才可能触发OOM。调查过程0.初步怀疑是哪里有DirectBuffer泄漏,或者JN...

2019-08-14 13:22:35

阿里毕玄:推荐给Java程序员的7本好书

我主要还是个Java程序员,所以进阶类型的书就推荐Java相关的。《Java并发编程实战》 并发是高级语言里都需要掌握的稍微高级一些的技巧,这本书尽管是2012年的书了,但我觉得仍然是无比经典,绝对是必读书。 《Netty实战》 Netty是Java中通信框架实现的典范,非常值得通过这个来学习好语言中IO相关的知识,以及优秀的通信框架的写法。 《深入理解Java虚拟机(第2版)》 这...

2019-08-14 12:02:36

MySQL8.0.17 - 初探 Clone Plugin

MySQL8.0.17推出了一个重量级的功能:cloneplugin。允许用户可以将当前实例进行本地或者远程的clone。这在某些场景尤其想快速搭建复制备份或者在groupreplication里加入新成员时非常有用。本文主要试玩下该功能,并试图阐述下其实现的机制是什么。我们以本地clone为例,因为去除网络部分,理解起来会相对简单点。也不会过度接触代码部分,仅仅做简单的原理性阐述示...

2019-08-14 11:31:47

闲鱼亿级商品结构化背后的思考和演进

1.缘起闲鱼是一个典型的C2C场景的闲置交易平台。每个在闲鱼的用户都能享受到自由交易的乐趣。在这里,可能你只要简单的输入商品名,商品价格,库存等信息就能完成一个商品的发布。即便是发布以后,你也可以随时修改价格,内容等信息。充分的自由是闲鱼活力的来源,但是这对于一个电商品台来说却有着难言的痛苦。本文要说的商品结构化就是痛点之一。商品结构化为什么重要?结构化信息是平台认识商品的一个基础。只有...

2019-08-14 10:47:22

查看更多

勋章 我的勋章
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 1024勋章
    1024勋章
    #1024程序员节#活动勋章,当日发布原创博客即可获得
  • 勤写标兵Lv4
    勤写标兵Lv4
    授予每个自然周发布9篇以上(包括9篇)原创IT博文的用户。本勋章将于次周上午根据用户上周周三的博文发布情况由系统自动颁发。