8 果冻虾仁

百度 - 研发工程师

我要认证

衣沾不足惜,但使愿无违

等级
TA的排名 5k+

欢迎大家关注我的公众号《编程往事》

专注互联网技术分享、行业观察以及个人成长!汇集我在各个平台上的文章与问答内容。另外涉及一些个人笔记性质的文章自己网络成长学习就业的咨询答疑。

2020-07-12 18:32:35

我在鹅厂卖公仔!

看到这个题目,你一定会以为这是比喻的说法,用腾讯卖公仔指代是我在腾讯工作写代码的经历。其实不是,这不是比喻,我是真的卖过公仔!!!缘起:刀马旦!2016年末,鹅厂年会蜂拥而至,之所以说蜂拥。是因为鹅厂年会真的不只一个。除了公司级别的年会和圣诞晚会(现改名新年晚会)外。BG、部门、中心不同层级的行政单位也可能会举办大大小小的年会。那一年我们中心的年会设置了礼物交换的环节。每个人要事先准备一份...

2020-03-23 00:55:40

感谢关注,请大家移步新公众号

由于这个公众号不能发留言,缺乏互动。希望大家关注新的公众号。有留言功能。关于私信请教学习和职业规划的网友,抱歉没有及时回复你们,因为超过48小时,就不能再回复私信。我近...

2019-11-01 13:41:57

面经笔经:编程判断栈增长方向

面试官:某非X86的机器,栈增长方向未知,编程实现判断其栈增长方向。补充:连续定义两个变量,可能被编译器优化,重新调整代码对应指令的顺序。我们都知道x86体系结构,栈的增长方式是从高到低的。但这不意味着所有机器都是如此,这就是这道题目能站稳脚跟的基础。另外就是根据补充条件,我们不能通过先后定义两个变量,然后再输出它们的地址来判断。一种正确的解...

2019-08-24 23:50:41

Faiss: 入门导读

引言Faiss是Facebook于2017年开源的一个相似度检索工具。相似度检索是啥?搜索、广告、推荐都需要用到相似度的检索。因为无论是网页、广告抑或推荐博文一定要符合你...

2019-08-17 14:51:18

前卡与落地页

搜索引擎、广告系统以及其他推荐与内容产品中其实都有前卡和落地页的概念。前卡比如在谷歌中搜索『北美旅游』,搜索结果的每条记录展示出来的区域就称作『前卡』。当然前卡是多内的叫...

2019-08-11 15:00:53

《推荐系统实践》笔记:用户行为数据与日志

推荐系统大多基于用户行为数据分析的,而记录用户行为数据最简单的形式就是日志。其实不止是推荐系统,搜索引擎和广告系统都有类似的概念。日志有如下几种:原始日志用户在一个网站上的各种行为会产生各种原始日志(raw log)。展示日志搜索引擎和搜索广告系统一次检索(一次PV)都会记录一个展示日志(impression log)。记录了查询和返回结果。点击日志...

2019-08-10 13:22:33

【答网友问】实习经历

Q:你好 看了你的一些回答和博客,感觉大神很厉害,后台开发方面了解也很多。我是校招拿到的鹅厂offer,实习生的时候也去了但是没过。我是像有个问题里面试官说的那种对c++...

2019-08-06 01:01:25

你只看到头条高调做搜索,没看到微信搜索框也一直在悄悄进化

声明:本文仅代表个人观点!7月31日,今日头条的一篇文章引爆网络,高调宣布布局全网搜索,一时间媒体都纷纷将此视作头条吹响了进攻百度战略腹地的号角。在众说纷纭头条能否战胜百...

2019-08-04 23:26:12

C/C++输出空字符串,UB UB UB UB UB UB…

看网上很多讲一些C/C++的问题回答或者文章,经常会遇到UB、UB、UB、UB……UB就是undefined behavior。也就是语言的官方标准未定义的地方,在不同系统,编译器上行为可能不一致。没错,我们当然不能把UB的效果,当成语言标准。但我们也不能因为某些语法是UB就拒绝学习和探究,毕竟我们学习编程语言都不是抱着《XX语言官方标准》的手册来学的。另外呢,我们工作之中通常也是在特定的系统...

2019-08-03 18:21:26

《这就是搜索引擎》笔记:检索质量评价标准

召回率和准确率召回率(recall) 和 准确率(Precision)是最常见的搜索引擎质量的评价标准,在推荐系统中也有这两个评估指标。召回率(recall)准确率(Precision)P@10指标评估在搜索结果中排名最靠前的头10个文档中有多大比例是相关的。MAP指标MAP(Mean Average Precisi...

2019-08-03 15:23:52

awk一行码:筛选某列指定值的数据

awk其实不只是一个工具、一个命令,它其实也是一种『编程语言』。场景1:一个TAB分割的数据文件,假设名为data.txt,第二列为用户id。从中筛选用户id为123的所...

2019-08-02 00:33:47

Trick C++: 宏函数与模板类

这是一个小trick。虽然不难理解,但是经常会忘记,导致代码返工。看这个代码:#include <iostream> #include &a...

2019-07-22 06:00:00

How To Be Pythonic:一行for

1行代码提取dict中的key和value,组成list:conf_dict={'host':'127.0.0.1','port':3600,'user':'root','pswd':123456} key_list=[keyforkeyinconf_dict] value_list=[conf_dict[key]forkeyincon...

2019-07-20 22:55:18

《这就是搜索引擎》一元编码勘误,兼谈Elias Gamma系列算法

《这就是搜索引擎》整体来看还是适合作为搜索引擎知识的入门书的。但是有些章节的描述错误,实在有伤大雅!书籍信息:《这就是搜索引擎》作者:张俊林 2012年1月第1版一元编码第4章『索引压缩』的4.2节提到了一元编码(unary code)和二进制编码(binary code)。首先关于一元编码的这个插图便是错的。其实一元编码,看英文就知道,unary code可以理解为『一进制编...

2019-04-22 00:13:12

高山仰之可极,谈半同步/半异步网络并发模型

0. 仰之弥高2015年,在腾讯暑期实习期间,leader给我布置的一个任务是整理分析网络模型。虽然也有正常工作要做,但这个任务贯穿了整个实习期。后来实习结束的总结PPT上,这部分内容占到了一半篇幅,我从C10K问题引入,讲了很多:从fork-exec的多进程到进程池;从多线程再到IO多路复用;从accept的惊群到pthread_cond_wait的惊群。现在回想,这些总结还是偏初级,后...

2019-04-17 21:59:00

《这就是搜索引擎》笔记:网页作弊

3月10日:金庸诞辰要首先牢牢记住:作弊的目的是出于商业利益驱使!主要作弊类型1. 内容作弊 增加目标作弊词的词频 增加主题无关的热门query词引流 关键位置插入作弊词<b> <h> <strong>等也是搜索引擎重要的排序依据 2. 链接作弊 链接农场(Link Farm):构建大量相互链接的...

2019-04-01 00:00:00

为什么我说C/C++程序员都要阅读Redis源码之:通过Redis学习事件驱动设计

0. 为什么我说C/C++程序员都要阅读Redis源码主要原因就是『简洁』。如果你用源码编译过Redis,你会发现十分轻快,一步到位。其他语言的开发者可能不会了解这种痛,作为C/C++程序员,如果你源码编译安装过Nginx/Grpc/Thrift/Boost等开源产品,你会发现有很多依赖,而依赖本身又有依赖,十分痛苦。通常半天一天就耗进去了。由衷地羡慕 npm/maven/pip/compos...

2019-03-30 22:36:25

《这就是搜索引擎》笔记:PageRank

搜索引擎在对结果进行排序的时候主要参考两点: 网页内容与query的相关性 网页的重要性 而计算网页的重要性主要就是通过『链接分析』方法。最著名的两个链接分析方法是:PageRank 和 HITS。Web图:把网页视作节点,如果网页包含另一个网页的link,则视作到另一个节点存在连接。那么网页之间就可以抽象为一个 有向图!称之为Web 图。 ...

2019-03-24 22:53:41

《这就是搜索引擎》笔记:索引更新

索引的建立索引建立完不是一成不变的,因为文档会新增,也会删除。所以要建立动态索引。原先内存中有词表,磁盘有对应倒排列表。再从内存中加两个词表,一个表示新增,一个表示删除。query的时候,就 合并原有词表个表示新增的词表,再过滤掉删除词表。如果一个文档被修改,也先记录一个原文档删除,再插入一个记录到新增词表。索引的更新常用索引更新策略有4种: 完全...

2019-03-17 06:00:00

查看更多

勋章 我的勋章
  • 领英
    领英
    绑定领英第三方账户获取
  • GitHub
    GitHub
    绑定GitHub第三方账户获取
  • 脉脉勋章
    脉脉勋章
    绑定脉脉第三方账户获得
  • 阅读者勋章Lv1
    阅读者勋章Lv1
    授予在CSDN APP累计阅读博文达到3天的你,是你的坚持与努力,使你超越了昨天的自己。
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。