11 genguyige

尚未进行身份认证

我要认证

暂无相关简介

等级
TA的排名 21w+

hive调优 ------- 竖表变横表

好久没有更新博客了 来公司三个多月,别的没学到,天天写sql hive,本来很反感这样的重复性劳动,不过呢!既来之则安之  工作中遇到这样一个需求有这这样一张表t_buy_buyer_time_hongbao_asc  用户id  次序        购买时间25560   1       1325345254     25560   2       1...

2012-10-11 17:10:27

在tomcat中运行得nutch加入中文分词后的检索

nutch-0.9加入中文分词之后的索引有很多博客已经讲到过我没有使用Cygwin模拟linux环境,而是在Tomcat中运行的nutch。这个项目工程文件是在我们的项目中的一个war包,而这个war包却是最开始的版本,因此我们要在特定的时候修改掉里面的一些文件。 但遇到一个问题是,加入分词之后放到tomcat里面发现搜索不好使了,用Luke打开索引文件可以看到中文分词的效果明显可...

2012-05-05 20:01:19

大学最后半年

     大学就剩下半年时间,转瞬就要完结。     六月份去公司报道,很期待,也很纠结...     不断的有人问我现在在哪里,现在在干嘛,我确实不知道该怎么说,我没有去公司实习,没有做毕业设计,也没有兼职,我只是在宿舍里做着一些想做的事...      以前觉得没去公司实习是件很没面子,新年就碰到公司分拆无线部门成立新公司,很纠结,觉得前途很渺茫,现在想想,其实,我比别人多了半...

2012-03-01 16:53:28

是你的跑不掉 不是你的求不来

创新工场2012年校招,最开始的是九月份的创新工场,第一场笔试没过,很郁闷。跑到华科参加第二场笔试,又没过,于是更郁闷了,第二天跑去霸面,见过了蔡学镛,过了一面,然后我相信了有些机会是要自己去争取的。淘宝那段时间又来了淘宝,我一直想去的一个公司,笔试题挺难,但我蒙对了很多,然后进了面试,一面,二面,HR面在四个小时内搞定了,一路顺风顺水,我强烈的感觉到我要进淘宝了,然后...

2011-10-19 07:39:50

树的相关操作

最近很多大公司的笔试题都考到了树这个数据结构 淘宝武汉地区的笔试题倒数第二题是关于树中两个节点找父节点的 搜狗昨天又考到了,是找树中两个距离最远节点的题。 所以树被考到的概率很高啊,今天又java把树的基本操作都写了一遍,需要的童鞋果断分享吧package com.gengu.树;import java.util.Queue;import java.util...

2011-09-26 21:14:10

几种常见排序算法的实现[内部排序]

马上要找开始找工作了 抽点空对各种排序算法进行一下总结,随手从维基百科上搜索了一下。 排序算法大概分这么多种稳定的 冒泡排序(bubble sort) — O(n2) 鸡尾酒排序 (Cocktail sort, 双向的冒泡排序) — O(n2) 插入排序 (insertion sort)— O(n2) 桶排序 (bucket sort...

2011-09-06 18:54:28

CPU,主存,外设I/O读写速度不匹配的解决

CPU与主存 我们都知道计算机的存储器分为:寄存器,主存,辅存,更加具体的分类如下CPU寄存器寄存器主存高速缓存主存磁盘缓存辅存磁盘可移动存储介质        在计算机存储层次中,寄存器和主存储器都是可执行存储器,存储于其中的信息与存放在辅存中的信息相比较而言,计算机所采取的访问机制是不一样的,所需耗费的时间...

2011-09-03 20:49:15

java NIO学习笔记 非阻塞IO编程

        我们都知道TCP是面向连接的传输层协议,一个socket必定会有绑定一个连接,在普通的BIO(阻塞式IO)中,需要有三次握手,然后一般的socket编程就是这样的形式。Socket服务器端流程如下:加载套接字->创建监听的套接字->绑定套接字->监听套接字->处理客户端相关请求。Socket客户端同样需要先加载套接字,然后创建套接字,不过之后不用...

2011-09-01 21:20:59

java IO学习笔记[2]

 我昨天在写java网络编程的时候想到这样几个问题,现在总结一下。 一:TCP编程是面向字节流的      我用socket编程,是基于TCP/IP的,而TCP协议是传输层的协议,它是面向连接的,与UDP很大的不同在于前者是面向字节流的协议,而后者是用户数据报协议(User Datagram Protocol),面向字节流有一个很大的好处,那就是可以进行拥塞控制,进行流...

2011-08-30 12:44:27

java IO学习笔记[1]

每次看javaIO的时候就很烦躁,一是因为太繁琐了,看到这么多类,又是字节流又是字符流的,二是我做javaEE开发的时候用的实在不多,过两天就忘了。 流又分为输入流和输出流:这个是以内存为参照的,如果是向内存存入的就是输入流,从内存流出就是输出流。 java的IO分为字符流和字节流,字节输入流每次都是从文件或者内存中的读取都是以字节为单位的,在abstract类InputStrea...

2011-08-29 16:12:31

再次理解下OOP(读书笔记)

     目前的主流开发领域有两种开发方法,即结构化开发方法和面向对象开发方法,早期的语言C,Basic等都是结构化编程语言。     结构化程序设计      结构化程序设计方法主张按照功能来分析系统需求,其主要原则可概括为自顶向下,逐步求精,模板化等,结构化程序设计首先采用结构化分析方法对系统进行需求分析,然后采用结构化设计方法对系统...

2011-08-19 12:34:48

mysql存储引擎MyISAM的并发插入

都知道MySQL数据库是一个具有多种存储引擎的数据库,最常用的有MyISAM和InnoDB,两种存储引擎。 InnoDB支持外键,支持事务安全,数据多版本读取,锁定机制的改进等诸多优点,这里就不多说了。 那么MyISAM,是一个sun公司自己开发的存储引擎,只支持表级锁定。 我做了这样一个测试,使用root登录然后创建一个数据库test1mysql> create...

2011-08-15 20:37:50

java的异常处理机制

       异常机制已经成为很多语言的一种判断其成熟度的标准,除了C之外,其他的主流编程语言比如java,C#,Ruby等都提供了成熟的异常处理机制,异常机制可以使得程序中异常处理代码和正常业务代码的分离,保证程序代码更加优雅,并可以提高程序的健壮性。 网上关于java异常处理机制的文章有很多,我只写一下我觉得可能需要注意的地方。 1:在java中处理异常主要有五个关键字:try...

2011-08-12 11:08:55

观察者模式

恩,今天看了一道面试题说到了观察者模式,还不是很懂,看了看书,将代码实现了一遍。有个大致的了解了。 观察者模式的定义:定义对象间一种一对多的依赖关系,使得每当一个对象改变状态,则所有依赖于它的对象都会得到通知并自动更新。 在《设计模式之禅》一书中,做着打了一个韩非子的比方,说的是这样一件事:韩非子是一个很有名的人,很多人在他身边安排了细作,监视他的一言一行,比如他吃饭了,那就通...

2011-07-25 17:08:46

访问者模式

今天在使用dom4j进行xml解析的时候使用到了访问者模式。它的使用是这样的,由于dom4j的Node接口中定义了一个accept(Visitor visitor)方法,而Node虚类是dom4j中所有的节点的父类,就相当于Object类一样,但是我们对于xml中的节点的访问应该是不一样的,对于属性,我们应当访问属性名和属性值,对于元素我们应当访问元素值和元素名,对于处理指令我们又要使用不一样...

2011-07-23 16:59:32

Dom4j解析和创建XML文档

dom4j是一套开源的XML解析工具,完全支持DOM,SAX和JAXP机制,与传统的Xerces-J相比,dom4j更为简单易用,因此实际项目中往往采用它作为xml解析器。 dom4j只提供了java版本的,往往有很多的开源项目都使用它作为解析器比如hibernate框架。 dom4j支持多种解析机制: DOMReader :它负责根据W3C的DOM树创建dom4j树。...

2011-07-23 11:23:45

备忘录模式

我更喜欢把它叫做备份模式 考虑这样一种场景:在我们做实验的时候,我们必须保证一步一步的做,并且在实验当前必须保证我前面的步骤都是正确的?不然如果出了问题,你都不知道是哪一步出的问题,好吧,如果你能保证前面的都正确,那么你在做下一步的时候,就要考虑我是不是能把情况恢复到这里,因为你下一步可能出错,所以你要有恢复的能力啊!这样你就得懂得备份,如果程序在下一步出现问题,你就用备份恢复一下。 ...

2011-07-22 15:49:12

门面模式

我们先来讨论一个很常见的问题。餐馆吃饭的问题。在有些餐馆,客人进去吃饭是需要自己找座位,自己倒茶,自己写菜单,然后将菜单交给服务员,由服务员去完成剩下的工作。但是也有很多那种高级的餐厅,或者服务很周到的餐厅是这样做的,你一进门,就会有服务员领着你到给你安排座位(我们现在假设安排座位是专门一个部门来完成的,只是这个服务员直接问了座位部那些座位是空的,然后领着去对应的地方就可以了)。然后你...

2011-07-22 12:02:59

ThreadLocal类的理解与使用

在java线程中有一个很有作用的类ThreadLocal 在网上关于ThreadLocal的理解也相当的多,文章也很多,但是很多看了都让人一头雾水,有的就讲原理,有的就说概念,而且大量的转载,却很少有实例这块的。 JDK1.5之后,java引入了泛型的概念,也为ThreadLocal引入了泛型,通过泛型可以简化多线程编程时的并发访问,使用这个工具类可以很简洁的编写出有没的多线程程序...

2011-07-19 17:58:00

状态模式

现在有一个这样的场景。 对于TCP的连接,大家都知道,TCP是面向连接的一种通信方式,那么他有三种基本的状态1:等待连接  2:连接   3:断开 那么每一个TCP都有这样三种操作,但是等等...如果一个TCP已经在连接状态了,那么它还能连接??显然不能,每一个TCP通信在一种状态下面只能有一种连接方式。 它的关系应当是这样的:在等待状态下只能进行连接,连接完后把状态改成连...

2011-07-18 21:42:19
勋章 我的勋章
    暂无奖章