自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

墨染百城

士别三日,当刮目相看

  • 博客(188)
  • 资源 (12)
  • 收藏
  • 关注

原创 【LeetCode】LeetCode中那些应该背下来的经典代码

收集在刷LeetCode过程中遇到的经典代码,持续更新。136. Single Number中使用异或求解问题描述问题链接:https://leetcode.com/problems/single-number/#/descriptionGiven an array of integers, every element appears twice except for one. Find that

2017-03-17 10:52:10 2316 1

原创 看到一个好句子,记下来

人一能之,己百之;人十能之,己千之。果能此道矣,虽愚,必明;虽柔,必强。–《礼记》

2017-07-05 15:26:29 755

原创 OKR学习笔记

1. 什么是OKROKR的全称是“Objectives and Key Results”,翻译过来就是“目标和关键成果”。它是一种目标管理方法,是一种能够让企业更好的聚焦战略目标,更好的集中配置资源,更好的使团队上下同欲的管理方法。2. OKR是怎么来的2.1 起源1954年,德鲁克在《管理的实践》一书中明确的提出了目标管理法(MBO),这应该是最早的源头了。德鲁克认为:所有企业的使命和任务,必须转

2017-06-22 18:45:11 1741

原创 【算法】算法的时间复杂度计算

计量单位为了便于比较同一个问题的不同算法,通常的做法是,从算法中选取一种对于所研究的问题(或算法类型)来说是基本操作的原操作,以该基本操作的重复执行的次数作为算法的时间量度。时间频度一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为T(n)。时间复杂度在刚才提到的时间频度中,n称为问题的规模,当n不断变化时

2017-06-14 17:28:05 2096

原创 用Python一键搭建Http服务器

用Python一键搭建Http服务器今天好友问我怎么从阿里云服务器上把文件下载下来。我一听之下觉得办法很多啊,随意搭个服务器,然后把文件一丢就可以下载了;弄个FTP也行;直接用远程桌面往下拖也可以。考虑到便捷性,觉得上面的办法都比较麻烦,最好能有个直接解决问题的办法。然后就找到了Python里面。Python3请看python -m http.server 8000Python2请看python

2017-05-22 21:15:22 8645

原创 职场初体验

今天是一辈子第一次上跟专业相关的班。有点小忐忑。本来以为要见识早高峰了,但是实际上并没多少人,居然还有点小不甘心。。。不过想想以后早上不用早高峰,实际上放松了好多。出了地铁站就遇到了小黄车,哈哈,运气超好。所以提前到了一会儿。在周围熟悉一下环境。然后就被HR姐姐接到楼上了。先是填了一些表,然后熟悉了一下工作环境,装了一下办公要用的软件。基本弄完以后还不到吃中饭的时间,所以就先继续看《Scala编程思

2017-04-06 22:29:59 1196

原创 【书山有路】SQL必知必会 第22课

第15课到21课也看过了,感觉没有什么记笔记的需要。本课很重要,一定要记一下。本课的主题是“高级SQL特性”,介绍约束、索引和触发器。概念约束:管理如何插入或处理数据库数据的规则。约束引用完整性利用键来建立一个从一个表到另一个表的引用,保证只在表中插入合法(存在于引用列)的数据。主键保证一列中的值是唯一的,且永不改动。外键有助于防止意外删除。唯一约束保证一列中的数据是唯一的。检查约束用户自定义约

2017-04-05 09:59:23 722

原创 【书山有路】SQL必知必会 第14课

本课的主题是“组合查询”,讲述如何利用UNION操作符将多条SELECT语句组合成一个结果集。组合查询主要有两种情况使用组合查询:在一个查询中从不同的表返回结构数据对一个表执行多个查询,按一个查询返回数据UNION规则UNION必须由两条或两条以上的SELECT语句组成。UNION中的每个查询必须包含相同的列、表达式或聚集函数列数据类型必须兼容:类型不必完全相同,但必须是DBMS可以隐式

2017-04-04 23:48:53 657

原创 【书山有路】SQL必知必会 第13课

本章的主题是“创建高级联结”,主要介绍如何使用表别名,如何对被联结的表使用聚集函数。提示表的别名只在查询执行中使用,不返回到客户端。使用表别名SQL允许给表名起别名,有两个主要理由:缩短SQL语句允许在一条SELECT语句中多次使用相同的表自连接自连接通常作为外部语句,用来替代从相同表中检索数据的使用子查询语句。许多DBMS处理联结远比处理子查询快得多。自然联结无论何时对表进行连接,应该至

2017-04-04 23:37:07 631

原创 【书山有路】SQL必知必会 第12课

本章的主题是“联结表”,主要介绍什么是联结,为什么使用联结,如何编写使用联结的SELECT语句。概念由没有联结条件的表关系返回的结果为笛卡尔积。检索出的行的数目将是第一个表中的行数乘以第二个表中的行数。笛卡尔积又称为Cross Join警告要保证所有的联结都有WHERE子句,否则DBMS将返回比想要的数据多得多的数据。DBMS在运行时关联指定的每个表,以处理联结。这种处理可能非常耗费资源,因

2017-04-04 23:14:32 705

原创 【SQL练习】经典SQL练习题

准备数据建表语句CREATE TABLE students(sno VARCHAR(3) NOT NULL, sname VARCHAR(4) NOT NULL,ssex VARCHAR(2) NOT NULL, sbirthday DATETIME,class VARCHAR(5))CREATE TABLE courses(cno VARCHAR(5) NOT NULL, cname

2017-04-03 18:12:08 145604 127

原创 【书山有路】SQL必知必会 第11课

本章的主题是“使用子查询”,介绍什么是子查询,以及如何使用它们。提示在WHERE子句中使用子查询能够编写出功能很强且很灵活的SQL语句。对于能嵌套的子查询的书目没有限制,不过在实际使用时由于性能的限制不能嵌套太多的子查询。也可以在计算字段中使用子查询。警告使用子查询并不总是执行这类数据检索的最有效方法。子查询SQL允许创建子查询,即嵌套在其他查询中的查询。可以把一条SELECT语句返回的结

2017-04-03 15:45:20 835

原创 Flume安装及使用示例

Flume概述Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。Flume可以采集文件,socket数据包等各种形式源数据,又可以将采集到的数据输出到HDFS、hbase、hive、kafka等众多外部存储系统中一般的采集需求,通过对flume的简单配置即可实现Flume针对特殊场景也具备良好的自定义扩展能力,因此,flume可以适用于大部分的日常数据采集场景运行机制

2017-04-03 15:33:31 488

原创 【LeetCode】258. Add Digits

问题描述问题链接:https://leetcode.com/problems/add-digits/#/descriptionGiven a non-negative integer num, repeatedly add all its digits until the result has only one digit.For example:Given num = 38, the proces

2017-04-03 12:54:48 568

原创 一道Hive面试题:累积报表

我们有如下的用户访问数据: userId visitDate visitCount u01 2017-01-21 5 u02 2017-01-23 6 u03 2017-01-22 8 u04 2017-01-20 3 u01 2017-01-23 6 u01 2017-02-21 8 u02 2017-01-

2017-04-02 20:29:44 2867 1

原创 【书山有路】SQL必知必会 第10课

本章的主题是“分组数据”,介绍如何分组数据,以便汇总表内容的子集。涉及到GROUP BY和HAVING子句。提示使用分组可以将数据分为多个逻辑组,对每个组进行聚集计算。HIVING支持所有WHERE操作符。WHERE在数据分组前进行过滤,HAVING在数据分组后进行过滤。创建分组分组是使用SELECT语句和GROUP BY子句建立的。来看下面的SQL命令:SELECT vend_id, CO

2017-04-02 19:21:44 529

原创 【书山有路】SQL必知必会 第9课

本章的主题是“汇总数据”,介绍什么是SQL聚集函数,以及如何利用它们汇总表的数据。警告AVG只能用来确定特定数值列的平均值,列名必须作为参数给出。为了获得多个列的平均值,必须使用多个AVG函数。AVG函数忽略列值为NULL的行。MAX函数忽略列值为NULL的行。MIN函数忽略列值为NULL的行。SUM函数忽略列值为NULL的行。DISTINCT只能用于COUNT(column),不能用于

2017-04-02 00:08:13 456

原创 【书山有路】SQL必知必会 第8课

本章的主题是“使用数据处理函数”,介绍什么是函数,如何使用这些函数;还将讲解为什么SQL函数的使用可能会带来问题。概念可移植:所编写的代码可以在多个系统上运行。提示为了代码的可移植性,许多SQL程序员不赞成使用特定于实现的功能。虽然这样做很有好处,但有的时候并不利于应用程序的性能。如果不使用这些函数,编写某些应用程序代码会很艰难。必须利用其他方法来实现DBMS可以非常有效完成的工作。使用或不

2017-04-01 15:33:32 457

原创 Hive TransForm案例

Hive的 TRANSFORM 关键字提供了在SQL中调用自写脚本的功能,适合实现Hive中没有的功能又不想写UDF的情况。步骤1、先加载rating.json文件到hive的一个原始表 rat_jsoncreate table rat_json(line string) row format delimited;load data local inpath '/home/hadoop/ratin

2017-04-01 13:36:51 2817

原创 Hive中的UDF及自定义函数示例

Hive官方的UDF手册地址是:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF测试内置函数的快捷方法创建一个表dualload数据到dual表尝试内置函数自定义函数例子有时候Hive提供的内置函数不能满足我们的要求,此时就需要自定义函数。下面我们做一个自定义函数实现ToLowerCase的功能。新建Java工程需

2017-04-01 13:25:06 1332

原创 广告精准推送项目介绍

广告中介商:每个用户的目标客户不同,找的广告位也就不一样。广告提供商(网站、APP):想拉业务,也去找中介。将广告栏位提供给中介商。广告用户(各行业厂商):想去打广告,需要去找一些广告提供商。但是很难找到靠谱的,所以需要去找中介商。如果是一个综合网站,同一个广告栏位需要根据不同的浏览者展示不同的广告。广告商应该提供一个界面,供用户选择投放对象的性别、年龄等。然后网站去判断浏览者的这些属性,如果匹配,

2017-04-01 12:16:40 3888

原创 Hive中的Join操作

Hive中有许多的Join操作,如果LEFT,RIGHT和FULL OUTER JOIN,INNER JOIN,LEFT SEMI JOIN等。那么它们都各自有什么特点呢?感觉很难说明这些区别,还是通过例子来看。准备数据如果我们有一个表,数据如下:a.txt1,a2,b3,c4,d7,y8,u另一个表中的数据如下:b.txt2,bb3,cc7,yy9,pp在Hive中建表:cre

2017-04-01 11:27:12 1330

原创 【书山有路】SQL必知必会 第7课

本章的主题是“创建计算字段”,介绍什么是计算字段,如何创建计算字段,以及如何从应用程序中使用别名引用它们。概念字段:基本上与列的意思相同,经常互换使用,不过数据库列一般称为列,而术语字段通常与计算字段一起使用。拼接:将值联结到一起(将一个值附加到另一个值)构成单个值。提示只有数据库知道SELECT语句中哪些列是实际的列表,哪些列是计算字段。从客户端来看,计算字段的数据与其他列的数据的返回方式

2017-04-01 10:31:56 526

原创 【书山有路】SQL必知必会 第6课

本章的主题是“用通配符进行过滤”,主要介绍什么是通配符,如何使用通配符以及怎样使用LIKE操作进行通配搜索。概念通配符:用来匹配值的一部分的特殊字符。搜索模式:由字面值、通配符或者两者构成的搜索条件。谓词:取值为TRUE、FALSE或UNKNOWN的表达式。提示当操作符是谓词时,它不是操作符。通配符搜索只能用于文本字段(串),非文本数据类型字段不能使用通配符搜索。通配符可在搜索模式中的

2017-04-01 09:59:23 618

原创 【书山有路】SQL必知必会 第5课

这一课讲授的主题是“高级数据过滤”,组合WHERE子句建立功能更强的搜索条件。还将学习NOT和IN操作符。提示WHERE子句中的AND操作符优先级高于OR操作符。所以应该使用圆括号正确的分组。IN操作符IN操作符用于范围匹配,范围中的每个条件都可以进行匹配。使用下面的代码:SELECT prod_name,prod_priceFROM ProductsWHERE vend_id IN ('D

2017-03-31 13:24:48 686

原创 【书山有路】SQL必知必会 第4课

这一章的主题是“过滤数据”,讲授如何使用SELECT的WHERE子句指定搜索条件。提示数据也可以在应用层过滤,SQL检索出超出实际所需的数据,然后客户端代码提取出需要的行。通常这种做法及其不妥,让客户端应用处理数据库的工作会极大地影响应用的性能,并且使创建的应用不具备可伸缩性。还将导致网络带宽的浪费。使用IS NULL来过滤NULL值。概念可伸缩性,是一种对软件系统计算处理能力的设计指标,高

2017-03-31 13:13:05 585

原创 【书山有路】SQL必知必会 第3课

这一课的主题是“排序检索数据”,主要讲授如何使用ORDER BY子句。概念子句:SQL语句由子句构成,有些字句是必须的,有些则是可选的。一个子句通常由一个关键字加上所提供的数据组成。提示在指定一条ORDER BY子句时,应该保证它是SELECT语句中最后一条子句。如果它不是最后的子句,将会出现错误。ORDER BY可以使用非选择的列进行排序。默认是升序排序。警告在多个列上进行降序排序,必

2017-03-31 12:59:24 522

原创 【书山有路】SQL必知必会 第2课

这一课的主题是“检索数据”,介绍如何使用SELECT语句从表中检索一个或多个数据列。提示SQL语句后要加分号对SQL关键字使用大写,对列名和表命使用小写。这样做使代码更易于调试和阅读。多数SQL开发人员认为,将SQL语句分成多行更容易阅读和调试。SQL语句一般返回原始的、无格式的数据。数据的格式化是表示问题,而不是检索问题。警告一般而言,除非你确实需要表中的每一列,否则最好别使用*通配符

2017-03-31 12:47:48 740

原创 【书山有路】SQL必知必会 第1课

这一课介绍SQL究竟是什么,它能做什么事情。概念模式:表具有一些特性,这些特性定义了数据在表中如何存储,包含存储什么样的数据,数据如何分解,各部分信息如何命名等信息。描述表的这组信息就是所谓的模式(schema)。模式可以用来描述数据库中特定的表,也可以用来描述整个数据库(和其中表的关系)。数据类型兼容:数据类型及其名称是SQL不兼容的一个主要原因。要在创建表结构时记住这些差异。标准SQL:A

2017-03-31 11:44:20 651

原创 Hive分桶的作用

分区的主要作用是可用允许我们只统计一部分内容,加快统计的速度。什么是分桶假如我们有个表t_buck。create table t_buck(id string,name string)clustered by (id) sort by(id) into 4 buckets;指定了根据id分成4个桶。只是说明了表会分桶,具体的分区需要在导入数据时产生。最好的导入数据方式是insert into t

2017-03-30 17:01:40 9179

原创 Hive HQL练习

测试数据course.txt1,数据库2,数学3,信息系统4,操作系统5,数据结构6,数据处理sc.txt95001,1,8195001,2,8595001,3,8895001,4,7095002,2,9095002,3,8095002,4,7195002,5,6095003,1,8295003,3,9095003,5,10095004,1,8095004,2,9

2017-03-30 15:15:46 7653 1

原创 Hive建表语句和分区表概念及示范

Hive的建表语句CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_commen

2017-03-30 12:12:24 5189

原创 纪念博客排名进入前20000

从2017年1月20多号开始写博客,到现在差不多正好两个月吧。体验到了许许多多的新技术,解决了许许多多的新问题,也读过许许多多前辈的好文,甚至还鼓舞了几个小伙伴也开始写博客了。这个博客的陪伴真的带给我很多的快乐。在这个过程中有收获,但更多的是意识到了自己的不足。这里说得重一点,就是学习的时候不求甚解,太随性。当然在目前技术爆炸的背景下不可能样样精通,但是我期望自己至少能在自己感兴趣的一个技术领域深耕

2017-03-30 10:30:43 415 3

原创 【SQL练习】175. Combine Two Tables

问题连接:https://leetcode.com/problems/combine-two-tables/#/description问题描述Table: Person+-------------+---------+| Column Name | Type |+-------------+---------+| PersonId | int || FirstName

2017-03-30 10:17:22 642

原创 【LeetCode】226. Invert Binary Tree

问题描述问题链接:https://leetcode.com/problems/invert-binary-tree/#/descriptionInvert a binary tree. 4 / \ 2 7 / \ / \1 3 6 9to 4 / \ 7 2 / \ / \9 6 3 1Trivia:

2017-03-28 21:22:22 305

原创 【LeetCode】371. Sum of Two Integers

问题描述问题链接:https://leetcode.com/problems/sum-of-two-integers/#/descriptionCalculate the sum of two integers a and b, but you are not allowed to use the operator + and -。Example:Given a = 1 and b = 2, ret

2017-03-28 20:55:46 396

原创 【书山有路】大型网站技术架构 第1章

今天去逛书店,本来只想买本SQL的书,拿起来看了看,觉得是本科普的好书,介绍很多我不懂的东西。遂买下,准备好好读读。说实话已经有很久没有读完过一本书了,甚至都怀疑自己还能不能从头到尾读完一本书。觉得这本书很有趣,适合拿来建立自信。所以要把它读完。本章的标题是“大型网站架构演化”。金句希望软件工程师们在解决问题之前,能够认真思考自己面对的真正问题究竟是什么,有哪些技术方案可以选择,其基本原理是什么。

2017-03-28 18:57:30 441

原创 【LeetCode】53. Maximum Subarray

问题描述问题链接:https://leetcode.com/problems/maximum-subarray/#/descriptionFind the contiguous subarray within an array (containing at least one number) which has the largest sum.For example, given the array

2017-03-27 11:25:34 574

原创 【书山有路】立Flag,我要精通Java

计划和总结2017.03.27这几天面试、笔试的过程中不断的被问到Java底层相关的知识,而我从来没有认真的学习过Java,都是需要了就百度,典型的面向搜索引擎编程,所以场面就尴尬了。。。今天早上有幸拜读了左潇龙大大的博文:万能的林萧说:一篇文章教会你,如何做到招聘要求中的“要有扎实的Java基础”。,又为我的学习进一步指明了方向。最近要学习的东西实在是不少,不过我还是决定挤出时间来把Java好好攻

2017-03-27 10:50:47 841

原创 【书山有路】快学Scala 第1章

由于课程的需要,要开始学习Scala了。感觉最近的线程开得有点多啊,争取能做到平衡发展吧。本章的主题是“基础”,主要介绍一系列重要的Scala概念和惯用法。同时还会学到如何浏览Scaladoc文档。要点包括:使用Scala解释器用var和val定义变量数字类型使用操作符和函数浏览Scaladoc配置Scala环境我选用了Intellij IDEA作为IDE。下载链接:https://do

2017-03-26 22:25:38 369

IKAnalyzer2012_FF 区分大小写版本

IKAnalyzer2012_FF默认分词是不区分大小写的,对源码进行了修改,这个版本的jar包会区分大小写。http://blog.csdn.net/koproblem/article/details/70046368

2017-06-20

Ubuntu下后台持续运行Python程序

是我的博客 在Ubuntu下后台持续运行Python程序 的配套代码,包含了启动和停止脚本

2017-03-21

笑话爬虫 将笑话存储到文件和MySQL

我的博客 使用Scrapy爬取笑话并存储到文件和MySQL 的配套源码

2017-02-27

Hadoop自己的Rpc框架使用Demo

Hadoop自己的Rpc框架使用Demo。可以在自己的项目中用Hadoop的Rpc框架了。

2017-02-22

hadoop2.7.3 for win10 64位 bin目录

在Windows下面使用Hadoop Java API进行开发的时候需要编译Windows版本的Hadoop,然后把下载的Hadoop/bin目录替换掉。这个资源是Windows10 64位系统下编译的hadoop 2.7.3的bin目录。下载后即可替换使用。

2017-02-19

Mrpc源码及Sample

我的自定义Rpc框架Mrpc的源代码和Sample

2017-02-14

TDD-learn-demo2

我的博客 学习TDD(4)--实例2:基于ZooKeeper的服务器注册和探测类[实战ServerRegister]及 学习TDD(5)--实例2:基于ZooKeeper的服务器注册和探测类[实战ServerDetector] 的配套代码

2017-02-12

TDD-learn-demo1

我的博客 学习TDD(2)--实例:ProtoStuffUtil类的测试 的配套代码

2017-02-07

Mrpc Demo4

我的Mrpc框架功能实现demo4的代码

2017-02-06

Mrpc Demo3

我的Mrpc框架功能实现demo3的代码

2017-02-06

Mrpc Demo2

我的Mrpc框架功能实现demo2的代码

2017-02-05

Mrpc Demo1

我的Mrpc框架功能实现demo1的代码

2017-02-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除