自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

转载 海量数据处理面试题

第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法, 比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大 的几

2014-05-25 15:09:07 275

转载 数据库中索引的作用

为什么要创建索引呢?这是因为,创建索引可以大大提高系统的性能。 第一,通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。 第二,可以大大加快 数据的检索速度,这也是创建索引的最主要的原因。 第三,可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。 第四,在使用分组和排序 子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。 第五,通过使用索引

2014-05-25 15:07:06 1294

转载 平衡二叉树的好处

二叉排序树是一种比较有用的折衷方案。    数组的搜索比较方便,可以直接用下标,但删除或者插入某些元素就比较麻烦。    链表与之相反,删除和插入元素很快,但查找很慢。    二叉排序树就既有链表的好处,也有数组的好处。    在处理大批量的动态的数据是比较有用。 文件系统和数据库系统一般都采用树(特别是B树)的数据结构数据,主要为排序和检索的效率。二叉树是一种最基本最

2014-05-25 15:04:52 5825 1

转载 内存对齐的规则以及作用

2 //程序1 3 #include iostream> 4  5 using namespace std; 6  7 struct st1  8 { 9     char a ;10     int  b ;11     short c ;12 };13 14 struct st215 {16     short c ;17     c

2014-05-25 15:00:03 348

原创 String reorder

Time Limit: 10000msCase Time Limit: 1000msMemory Limit: 256MBDescriptionFor this question, your program is required to process an input string containing only ASCII characters

2014-04-15 18:37:11 317

原创 dictionary order

Time Limit: 10000msCase Time Limit: 1000msMemory Limit: 256MBDescriptionConsider a string set that each of them consists of {0, 1} only. All strings in the set have the same nu

2014-04-15 18:33:52 384

原创 decreases inversion count

#include #include using namespace std;void swap(int &a,int &b){int temp = a;a = b;b = temp;}//计算反演对的个数int InversionCount(int* arr,int** inversion,const int n){assert(!(arr=

2014-04-15 18:30:35 333

提示
确定要删除当前文章?
取消 删除