墨染百城-CSDN博客

原创【LeetCode】LeetCode中那些应该背下来的经典代码

收集在刷LeetCode过程中遇到的经典代码，持续更新。136. Single Number中使用异或求解问题描述问题链接：https://leetcode.com/problems/single-number/#/descriptionGiven an array of integers, every element appears twice except for one. Find that

2017-03-17 10:52:10 2317 1

原创看到一个好句子，记下来

人一能之,己百之;人十能之,己千之。果能此道矣,虽愚,必明;虽柔,必强。–《礼记》

2017-07-05 15:26:29 756

原创 OKR学习笔记

1. 什么是OKROKR的全称是“Objectives and Key Results”，翻译过来就是“目标和关键成果”。它是一种目标管理方法，是一种能够让企业更好的聚焦战略目标，更好的集中配置资源，更好的使团队上下同欲的管理方法。2. OKR是怎么来的2.1 起源1954年，德鲁克在《管理的实践》一书中明确的提出了目标管理法（MBO），这应该是最早的源头了。德鲁克认为：所有企业的使命和任务，必须转

2017-06-22 18:45:11 1743

原创【算法】算法的时间复杂度计算

计量单位为了便于比较同一个问题的不同算法，通常的做法是，从算法中选取一种对于所研究的问题（或算法类型）来说是基本操作的原操作，以该基本操作的重复执行的次数作为算法的时间量度。时间频度一个算法花费的时间与算法中语句的执行次数成正比例，哪个算法中语句执行次数多，它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为T(n)。时间复杂度在刚才提到的时间频度中，n称为问题的规模，当n不断变化时

2017-06-14 17:28:05 2099

原创用Python一键搭建Http服务器

用Python一键搭建Http服务器今天好友问我怎么从阿里云服务器上把文件下载下来。我一听之下觉得办法很多啊，随意搭个服务器，然后把文件一丢就可以下载了；弄个FTP也行；直接用远程桌面往下拖也可以。考虑到便捷性，觉得上面的办法都比较麻烦，最好能有个直接解决问题的办法。然后就找到了Python里面。Python3请看python -m http.server 8000Python2请看python

2017-05-22 21:15:22 8646

原创职场初体验

今天是一辈子第一次上跟专业相关的班。有点小忐忑。本来以为要见识早高峰了，但是实际上并没多少人，居然还有点小不甘心。。。不过想想以后早上不用早高峰，实际上放松了好多。出了地铁站就遇到了小黄车，哈哈，运气超好。所以提前到了一会儿。在周围熟悉一下环境。然后就被HR姐姐接到楼上了。先是填了一些表，然后熟悉了一下工作环境，装了一下办公要用的软件。基本弄完以后还不到吃中饭的时间，所以就先继续看《Scala编程思

2017-04-06 22:29:59 1196

原创【书山有路】SQL必知必会第22课

第15课到21课也看过了，感觉没有什么记笔记的需要。本课很重要，一定要记一下。本课的主题是“高级SQL特性”，介绍约束、索引和触发器。概念约束：管理如何插入或处理数据库数据的规则。约束引用完整性利用键来建立一个从一个表到另一个表的引用，保证只在表中插入合法（存在于引用列）的数据。主键保证一列中的值是唯一的，且永不改动。外键有助于防止意外删除。唯一约束保证一列中的数据是唯一的。检查约束用户自定义约

2017-04-05 09:59:23 722

原创【书山有路】SQL必知必会第14课

本课的主题是“组合查询”，讲述如何利用UNION操作符将多条SELECT语句组合成一个结果集。组合查询主要有两种情况使用组合查询：在一个查询中从不同的表返回结构数据对一个表执行多个查询，按一个查询返回数据UNION规则UNION必须由两条或两条以上的SELECT语句组成。UNION中的每个查询必须包含相同的列、表达式或聚集函数列数据类型必须兼容：类型不必完全相同，但必须是DBMS可以隐式

2017-04-04 23:48:53 657

原创【书山有路】SQL必知必会第13课

本章的主题是“创建高级联结”，主要介绍如何使用表别名，如何对被联结的表使用聚集函数。提示表的别名只在查询执行中使用，不返回到客户端。使用表别名SQL允许给表名起别名，有两个主要理由：缩短SQL语句允许在一条SELECT语句中多次使用相同的表自连接自连接通常作为外部语句，用来替代从相同表中检索数据的使用子查询语句。许多DBMS处理联结远比处理子查询快得多。自然联结无论何时对表进行连接，应该至

2017-04-04 23:37:07 631

原创【书山有路】SQL必知必会第12课

本章的主题是“联结表”，主要介绍什么是联结，为什么使用联结，如何编写使用联结的SELECT语句。概念由没有联结条件的表关系返回的结果为笛卡尔积。检索出的行的数目将是第一个表中的行数乘以第二个表中的行数。笛卡尔积又称为Cross Join警告要保证所有的联结都有WHERE子句，否则DBMS将返回比想要的数据多得多的数据。DBMS在运行时关联指定的每个表，以处理联结。这种处理可能非常耗费资源，因

2017-04-04 23:14:32 706

原创【SQL练习】经典SQL练习题

准备数据建表语句CREATE TABLE students(sno VARCHAR(3) NOT NULL, sname VARCHAR(4) NOT NULL,ssex VARCHAR(2) NOT NULL, sbirthday DATETIME,class VARCHAR(5))CREATE TABLE courses(cno VARCHAR(5) NOT NULL, cname

2017-04-03 18:12:08 145667 127

原创【书山有路】SQL必知必会第11课

本章的主题是“使用子查询”，介绍什么是子查询，以及如何使用它们。提示在WHERE子句中使用子查询能够编写出功能很强且很灵活的SQL语句。对于能嵌套的子查询的书目没有限制，不过在实际使用时由于性能的限制不能嵌套太多的子查询。也可以在计算字段中使用子查询。警告使用子查询并不总是执行这类数据检索的最有效方法。子查询SQL允许创建子查询，即嵌套在其他查询中的查询。可以把一条SELECT语句返回的结

2017-04-03 15:45:20 835

原创 Flume安装及使用示例

Flume概述Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。Flume可以采集文件，socket数据包等各种形式源数据，又可以将采集到的数据输出到HDFS、hbase、hive、kafka等众多外部存储系统中一般的采集需求，通过对flume的简单配置即可实现Flume针对特殊场景也具备良好的自定义扩展能力，因此，flume可以适用于大部分的日常数据采集场景运行机制

2017-04-03 15:33:31 488

原创【LeetCode】258. Add Digits

问题描述问题链接：https://leetcode.com/problems/add-digits/#/descriptionGiven a non-negative integer num, repeatedly add all its digits until the result has only one digit.For example:Given num = 38, the proces

2017-04-03 12:54:48 568

原创一道Hive面试题：累积报表

我们有如下的用户访问数据： userId visitDate visitCount u01 2017-01-21 5 u02 2017-01-23 6 u03 2017-01-22 8 u04 2017-01-20 3 u01 2017-01-23 6 u01 2017-02-21 8 u02 2017-01-

2017-04-02 20:29:44 2868 1

原创【书山有路】SQL必知必会第10课

本章的主题是“分组数据”，介绍如何分组数据，以便汇总表内容的子集。涉及到GROUP BY和HAVING子句。提示使用分组可以将数据分为多个逻辑组，对每个组进行聚集计算。HIVING支持所有WHERE操作符。WHERE在数据分组前进行过滤，HAVING在数据分组后进行过滤。创建分组分组是使用SELECT语句和GROUP BY子句建立的。来看下面的SQL命令：SELECT vend_id, CO

2017-04-02 19:21:44 529

原创【书山有路】SQL必知必会第9课

本章的主题是“汇总数据”，介绍什么是SQL聚集函数，以及如何利用它们汇总表的数据。警告AVG只能用来确定特定数值列的平均值，列名必须作为参数给出。为了获得多个列的平均值，必须使用多个AVG函数。AVG函数忽略列值为NULL的行。MAX函数忽略列值为NULL的行。MIN函数忽略列值为NULL的行。SUM函数忽略列值为NULL的行。DISTINCT只能用于COUNT(column)，不能用于

2017-04-02 00:08:13 456

原创【书山有路】SQL必知必会第8课

本章的主题是“使用数据处理函数”，介绍什么是函数，如何使用这些函数；还将讲解为什么SQL函数的使用可能会带来问题。概念可移植：所编写的代码可以在多个系统上运行。提示为了代码的可移植性，许多SQL程序员不赞成使用特定于实现的功能。虽然这样做很有好处，但有的时候并不利于应用程序的性能。如果不使用这些函数，编写某些应用程序代码会很艰难。必须利用其他方法来实现DBMS可以非常有效完成的工作。使用或不

2017-04-01 15:33:32 457

原创 Hive TransForm案例

Hive的 TRANSFORM 关键字提供了在SQL中调用自写脚本的功能，适合实现Hive中没有的功能又不想写UDF的情况。步骤1、先加载rating.json文件到hive的一个原始表 rat_jsoncreate table rat_json(line string) row format delimited;load data local inpath '/home/hadoop/ratin

2017-04-01 13:36:51 2819

原创 Hive中的UDF及自定义函数示例

Hive官方的UDF手册地址是：https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF测试内置函数的快捷方法创建一个表dualload数据到dual表尝试内置函数自定义函数例子有时候Hive提供的内置函数不能满足我们的要求，此时就需要自定义函数。下面我们做一个自定义函数实现ToLowerCase的功能。新建Java工程需

2017-04-01 13:25:06 1332

原创广告精准推送项目介绍

广告中介商：每个用户的目标客户不同，找的广告位也就不一样。广告提供商（网站、APP）：想拉业务，也去找中介。将广告栏位提供给中介商。广告用户（各行业厂商）：想去打广告，需要去找一些广告提供商。但是很难找到靠谱的，所以需要去找中介商。如果是一个综合网站，同一个广告栏位需要根据不同的浏览者展示不同的广告。广告商应该提供一个界面，供用户选择投放对象的性别、年龄等。然后网站去判断浏览者的这些属性，如果匹配，

2017-04-01 12:16:40 3890

原创 Hive中的Join操作

Hive中有许多的Join操作，如果LEFT，RIGHT和FULL OUTER JOIN，INNER JOIN，LEFT SEMI JOIN等。那么它们都各自有什么特点呢？感觉很难说明这些区别，还是通过例子来看。准备数据如果我们有一个表，数据如下：a.txt1,a2,b3,c4,d7,y8,u另一个表中的数据如下：b.txt2,bb3,cc7,yy9,pp在Hive中建表:cre

2017-04-01 11:27:12 1331

原创【书山有路】SQL必知必会第7课

本章的主题是“创建计算字段”，介绍什么是计算字段，如何创建计算字段，以及如何从应用程序中使用别名引用它们。概念字段：基本上与列的意思相同，经常互换使用，不过数据库列一般称为列，而术语字段通常与计算字段一起使用。拼接：将值联结到一起（将一个值附加到另一个值）构成单个值。提示只有数据库知道SELECT语句中哪些列是实际的列表，哪些列是计算字段。从客户端来看，计算字段的数据与其他列的数据的返回方式

2017-04-01 10:31:56 526

原创【书山有路】SQL必知必会第6课

本章的主题是“用通配符进行过滤”，主要介绍什么是通配符，如何使用通配符以及怎样使用LIKE操作进行通配搜索。概念通配符：用来匹配值的一部分的特殊字符。搜索模式：由字面值、通配符或者两者构成的搜索条件。谓词：取值为TRUE、FALSE或UNKNOWN的表达式。提示当操作符是谓词时，它不是操作符。通配符搜索只能用于文本字段（串），非文本数据类型字段不能使用通配符搜索。通配符可在搜索模式中的

2017-04-01 09:59:23 618

原创【书山有路】SQL必知必会第5课

这一课讲授的主题是“高级数据过滤”，组合WHERE子句建立功能更强的搜索条件。还将学习NOT和IN操作符。提示WHERE子句中的AND操作符优先级高于OR操作符。所以应该使用圆括号正确的分组。IN操作符IN操作符用于范围匹配，范围中的每个条件都可以进行匹配。使用下面的代码：SELECT prod_name,prod_priceFROM ProductsWHERE vend_id IN ('D

2017-03-31 13:24:48 686

原创【书山有路】SQL必知必会第4课

这一章的主题是“过滤数据”，讲授如何使用SELECT的WHERE子句指定搜索条件。提示数据也可以在应用层过滤，SQL检索出超出实际所需的数据，然后客户端代码提取出需要的行。通常这种做法及其不妥，让客户端应用处理数据库的工作会极大地影响应用的性能，并且使创建的应用不具备可伸缩性。还将导致网络带宽的浪费。使用IS NULL来过滤NULL值。概念可伸缩性，是一种对软件系统计算处理能力的设计指标，高

2017-03-31 13:13:05 585

原创【书山有路】SQL必知必会第3课

这一课的主题是“排序检索数据”，主要讲授如何使用ORDER BY子句。概念子句：SQL语句由子句构成，有些字句是必须的，有些则是可选的。一个子句通常由一个关键字加上所提供的数据组成。提示在指定一条ORDER BY子句时，应该保证它是SELECT语句中最后一条子句。如果它不是最后的子句，将会出现错误。ORDER BY可以使用非选择的列进行排序。默认是升序排序。警告在多个列上进行降序排序，必

2017-03-31 12:59:24 522

原创【书山有路】SQL必知必会第2课

这一课的主题是“检索数据”，介绍如何使用SELECT语句从表中检索一个或多个数据列。提示SQL语句后要加分号对SQL关键字使用大写，对列名和表命使用小写。这样做使代码更易于调试和阅读。多数SQL开发人员认为，将SQL语句分成多行更容易阅读和调试。SQL语句一般返回原始的、无格式的数据。数据的格式化是表示问题，而不是检索问题。警告一般而言，除非你确实需要表中的每一列，否则最好别使用*通配符

2017-03-31 12:47:48 740

原创【书山有路】SQL必知必会第1课

这一课介绍SQL究竟是什么，它能做什么事情。概念模式：表具有一些特性，这些特性定义了数据在表中如何存储，包含存储什么样的数据，数据如何分解，各部分信息如何命名等信息。描述表的这组信息就是所谓的模式(schema)。模式可以用来描述数据库中特定的表，也可以用来描述整个数据库（和其中表的关系）。数据类型兼容：数据类型及其名称是SQL不兼容的一个主要原因。要在创建表结构时记住这些差异。标准SQL：A

2017-03-31 11:44:20 652

原创 Hive分桶的作用

分区的主要作用是可用允许我们只统计一部分内容，加快统计的速度。什么是分桶假如我们有个表t_buck。create table t_buck(id string,name string)clustered by (id) sort by(id) into 4 buckets;指定了根据id分成4个桶。只是说明了表会分桶，具体的分区需要在导入数据时产生。最好的导入数据方式是insert into t

2017-03-30 17:01:40 9180

原创 Hive HQL练习

测试数据course.txt1,数据库2,数学3,信息系统4,操作系统5,数据结构6,数据处理sc.txt95001,1,8195001,2,8595001,3,8895001,4,7095002,2,9095002,3,8095002,4,7195002,5,6095003,1,8295003,3,9095003,5,10095004,1,8095004,2,9

2017-03-30 15:15:46 7656 1

原创 Hive建表语句和分区表概念及示范

Hive的建表语句CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_commen

2017-03-30 12:12:24 5190

原创纪念博客排名进入前20000

从2017年1月20多号开始写博客，到现在差不多正好两个月吧。体验到了许许多多的新技术，解决了许许多多的新问题，也读过许许多多前辈的好文，甚至还鼓舞了几个小伙伴也开始写博客了。这个博客的陪伴真的带给我很多的快乐。在这个过程中有收获，但更多的是意识到了自己的不足。这里说得重一点，就是学习的时候不求甚解，太随性。当然在目前技术爆炸的背景下不可能样样精通，但是我期望自己至少能在自己感兴趣的一个技术领域深耕

2017-03-30 10:30:43 415 3

原创【SQL练习】175. Combine Two Tables

问题连接：https://leetcode.com/problems/combine-two-tables/#/description问题描述Table: Person+-------------+---------+| Column Name | Type |+-------------+---------+| PersonId | int || FirstName

2017-03-30 10:17:22 643

原创【LeetCode】226. Invert Binary Tree

问题描述问题链接：https://leetcode.com/problems/invert-binary-tree/#/descriptionInvert a binary tree. 4 / \ 2 7 / \ / \1 3 6 9to 4 / \ 7 2 / \ / \9 6 3 1Trivia:

2017-03-28 21:22:22 305

原创【LeetCode】371. Sum of Two Integers

问题描述问题链接：https://leetcode.com/problems/sum-of-two-integers/#/descriptionCalculate the sum of two integers a and b, but you are not allowed to use the operator + and -。Example:Given a = 1 and b = 2, ret

2017-03-28 20:55:46 396

原创【书山有路】大型网站技术架构第1章

今天去逛书店，本来只想买本SQL的书，拿起来看了看，觉得是本科普的好书，介绍很多我不懂的东西。遂买下，准备好好读读。说实话已经有很久没有读完过一本书了，甚至都怀疑自己还能不能从头到尾读完一本书。觉得这本书很有趣，适合拿来建立自信。所以要把它读完。本章的标题是“大型网站架构演化”。金句希望软件工程师们在解决问题之前，能够认真思考自己面对的真正问题究竟是什么，有哪些技术方案可以选择，其基本原理是什么。

2017-03-28 18:57:30 441

原创【LeetCode】53. Maximum Subarray

问题描述问题链接：https://leetcode.com/problems/maximum-subarray/#/descriptionFind the contiguous subarray within an array (containing at least one number) which has the largest sum.For example, given the array

2017-03-27 11:25:34 574

原创【书山有路】立Flag，我要精通Java

计划和总结2017.03.27这几天面试、笔试的过程中不断的被问到Java底层相关的知识，而我从来没有认真的学习过Java，都是需要了就百度，典型的面向搜索引擎编程，所以场面就尴尬了。。。今天早上有幸拜读了左潇龙大大的博文：万能的林萧说：一篇文章教会你，如何做到招聘要求中的“要有扎实的Java基础”。，又为我的学习进一步指明了方向。最近要学习的东西实在是不少，不过我还是决定挤出时间来把Java好好攻

2017-03-27 10:50:47 841

原创【书山有路】快学Scala 第1章

由于课程的需要，要开始学习Scala了。感觉最近的线程开得有点多啊，争取能做到平衡发展吧。本章的主题是“基础”，主要介绍一系列重要的Scala概念和惯用法。同时还会学到如何浏览Scaladoc文档。要点包括：使用Scala解释器用var和val定义变量数字类型使用操作符和函数浏览Scaladoc配置Scala环境我选用了Intellij IDEA作为IDE。下载链接：https://do

2017-03-26 22:25:38 369