17 白乔

尚未进行身份认证

中国科学院博士,爱写码,更爱大数据。著有图书《标准C++开发入门与编程实践》、《把脉VC++》,以及“白乔原创”系列技术文章多篇。 开源贡献,欢迎star: https://github.com/bluejoe2008 邮箱:bluejoe2008@gmail.com QQ:5854165

等级
TA的排名 1k+

乐观锁与悲观锁

转载自https://blog.csdn.net/qq_34337272/article/details/81072874何谓悲观锁与乐观锁乐观锁对应于生活中乐观的人总是想着事情往好的方向发展,悲观锁对应于生活中悲观的人总是想着事情往坏的方向发展。这两种人各有优缺点,不能不以场景而定说一种人好于另外一种人。悲观锁总是假设最坏的情况,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的...

2019-03-02 22:23:34

转载:用户画像建设过程简析

https://mp.weixin.qq.com/s?__biz=MzI0NzAwMzcyNQ==&mid=2247483655&idx=1&sn=11b9bf9c862e88ae6b744c1374e3335f&chksm=e9b7ee25dec06733a6cedf8dda35bbc841518cbd6a6d648cef1481e97b8cbfbee662416...

2018-11-28 17:50:40

转载:用户画像系统原型

https://mp.weixin.qq.com/s/kEstjsrMhk7lfEk67r7Vnw用户画像的概念在前面写的一系列文章有过详细介绍,感兴趣的可以翻阅。这篇梳理下一个完整的用户画像产品有哪些功能,给出一个比较粗略的产品原型。 用户画像建设过程简析|连载一建立用户画像的标签体系|连载二时尚全媒体用户画像建模|连载三构建新零售业态中的用户画像标签体系(附带整...

2018-11-28 17:32:33

Lambda架构已死,去ETL化的IOTA才是未来

http://www.sohu.com/a/228020781_115326经过这么多年的发展,已经从大数据1.0的BI/Datawarehouse时代,经过大数据2.0的Web/APP过渡,进入到了IOT的大数据3.0时代,而随之而来的是数据架构的变化。▌Lambda架构在过去Lambda数据架构成为每一个公司大数据平台必备的架构,它解决了一个公司大数据批量离线处理和实时数据处理的需...

2018-11-28 17:30:01

分布式系统唯一ID生成方案汇总

https://www.cnblogs.com/haoxinyue/p/5208136.html系统唯一ID是我们在设计一个系统的时候常常会遇见的问题,也常常为这个问题而纠结。生成ID的方法有很多,适应不同的场景、需求以及性能要求。所以有些比较复杂的系统会有多个ID生成的策略。下面就介绍一些常见的ID生成策略。1.数据库自增长序列或字段最常见的方式。利用数据库,全数据库唯一。优点...

2018-10-28 11:02:13

HBase的rowkey的设计原则

https://www.cnblogs.com/yuguoshuo/p/6265649.htmlHBase是三维有序存储的,通过rowkey(行键),columnkey(columnfamily和qualifier)和TimeStamp(时间戳)这个三个维度可以对HBase中的数据进行快速定位。HBase中rowkey可以唯一标识一行记录,在HBase查询的时候,有两种方式:1、通...

2018-10-28 10:27:11

ceph存储分布式系统设计系列 -- 基本原理及高可用策略

https://blog.csdn.net/skdkjzz/article/details/50737241?utm_source=blogxgwz1“分布式系统设计”系列第一篇文章,这篇文章主要介绍一些入门的概念和原理,后面带来一些高可用、数据分布的实践方法!! ==>分布式系统中的概念==>分布式系统与单节点的不同==>分布式系统特性==>分布...

2018-10-27 20:20:48

分布式小文件系统fastdfs与weedfs的对比

https://www.tuicool.com/articles/uaiimu最近拿一台双核1G的kvmvps搭建了一个图片的服务器,前面用百度云加速扛着,有了个专业图片存储及CDN的样子。每天还是有50W左右的PV,流量在30G左右。总结一下最近接触过的两个分布式小文件系统weedfs和fastdfs。fastdfs的详细介绍看这里=》 传送门weedfs官方地址= >传送门...

2018-10-27 19:39:17

浅谈数据仓库和大数据

转载自https://blog.csdn.net/Gospelanswer/article/details/78208761?utm_source=blogxgwz1前言数据仓库是今年来适应利用数据支持决策分析的强烈需求而发展起来的数据库应用技术,诚然,数据仓库以数据库为基础,但是他在需求、客户、体系结构与运行机制等方面与数据库存在重大的不同,Kimball说:"我们花了二十年的时间往数据库...

2018-10-21 11:25:20

深度|从数据仓库到数据湖——浅谈数据架构演进

转载自https://mp.weixin.qq.com/s/321mkZsuxqXOme5hw_83mQ网管产品需要从数据仓库的角度来看,才能获得完整的视图。数据集成真正从大数据的角度来看,才能明白其中的挑战。一个运行了20多年的数据架构,必然有其合理性。也正是因为年代久远,存量过多,才导致举步维艰。在Cloud和5G时代,超密度网络集成和大数据洞察需求给电信供应商带来新的挑战,从数据仓库到数...

2018-10-20 19:45:31

白乔原创:solr cloud的sql查询引擎solr-sql

SolrCloud介绍 在我们应用还很渺小的时候,一台Solr服务器能完全胜任这份工作,随着我们应用慢慢长大,访问也越来越多,一台Solr服务器的弊病也逐渐显现如查询变慢了,机器宕机就无法继续提供服务,于是乎我们引入了Solr集群,通过前端负载均衡和索引Replication来分担一台机器的压力,这样既能提高查询速度,也能避免单机故障问题而且是可伸缩的解决方案,一切看起来很OK,问题也...

2018-10-20 19:28:58

白乔原创:图数据在线交互框架InteractiveGraph

InteractiveGraph 详细介绍    InteractiveGraph是一个使用JavaScript开发的开源项目,为大规模图数据提供了一个基于Web的交互操作框架,其数据可以来自于本地的GSON文件。    InteractiveGraph提供了3个基本应用,分别是图导航器(GraphNavigator),图浏览器(GraphExplorer)以及关系查找器(RelFind...

2018-10-20 19:24:29

白乔原创:图数据在线交互服务器 InteractiveGraph-neo4j

InteractiveGraph-neo4j日前发布v0.0.1版本。InteractiveGraph-neo4j基于Neo4j数据库为InteractiveGraph提供服务器后端。InteractiveGraph为大型图数据提供了一个基于web的交互操作框架,其数据可以来自于GSON文件,或者在线Neo4j图数据库。InteractiveGraph同时也提供了三个基于本框架的应用:G...

2018-10-20 19:13:07

AI框架大比拼,你喜欢哪一个?

转载自https://baijiahao.baidu.com/s?id=1589649119274801302&wfr=spider&for=pc人工智能(AI)已经存在很长时间了。然而,由于这一领域的巨大进步,近年来它已成为一个流行语。人工智能曾经被称为一个完整的书呆子和天才的领域,但由于各种开发库和框架的发展,它已经成为一个友好的IT领域,并有很多人正走进它。在这篇文章...

2018-10-20 18:47:07

virtualbox 安装增强功能时报缺少kernel的头文件的解决办法

```uname-aLinuxvm13.10.0-693.el7.x86_64#1SMPTueAug2221:09:27UTC2017x86_64x86_64x86_64GNU/Linux```网上查了那么多的解决办法都没用,直接的办法是升级kernel版本:```yuminstallkernel-3.10.0-862.2.3.el7.x8...

2018-09-19 18:32:10

Scrapy简单入门及实例讲解

https://www.cnblogs.com/kongzhagen/p/6549053.htmlScrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。其可以应用在数据挖掘,信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取(更确切来说,网络抓取)所设计的,也可以应用在获取API所返回的数据(例如AmazonAssociatesWebServices...

2018-09-02 18:14:45

ceph+s3安装手记

参考资料:https://www.cnblogs.com/ytc6/p/7388654.htmlhttp://docs.ceph.com/docs/kraken/start/https://blog.csdn.net/changtao381/article/details/48015623https://blog.csdn.net/litianze99/article/detail...

2018-07-09 09:39:44

不看后悔 | 分分钟教你做知识图谱大数据专家

http://chuansong.me/n/1840839551422知识图谱示例假设你想搜与“联想”有关的信息,下图是谷歌搜索结果。请观察左侧和右侧红框的搜索结果有什么不同呢?左侧是传统谷歌搜索返回的一列依相关度排列的网站链接,你要自己打开一个个网页去阅读抽取与“联想”有关的知识。右侧则将一条条与“联想”有关的知识作为结果直接呈现给你,例如联想的简介、股价、CEO、创立信息等等(省去了自己一个个...

2018-06-23 20:03:30

干货 | 知识图谱的技术与应用

https://mp.weixin.qq.com/s/j94s-jQjJ11zXSDD_uEcAA作者|李文哲,人工智能、知识图谱领域专家导读:从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤...

2018-06-16 15:11:33

展示联结数据的内在之美:全新的Neo4j Bloom可视化工具

转载自https://blog.csdn.net/graphway/article/details/80211546四天前,5月2日,在旧金山的Neo4jGraphTour,Neo4j公司的首席执行官EmilEifrem宣布Neo4j图数据库平台新增一款全新产品:Neo4jBloom。Neo4jBloom是一款突破性的图数据可视化产品,它允许图数据库新手和专家能够与同行、管理人员和其他业务...

2018-05-30 10:06:17

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!