6 梁尔舒

美团 - 搜索推荐工程师

一个坚持把架构做到极致的技术人,热衷于互联网技术。混迹互联网十几年,热衷于高性能、高并发、分布式技术领域的研究。

添加认证
等级
TA的排名 2k+

Elasticsearch 电商营销活动索引Mapping参考

原文:https://truemped.github.io/posts/search/campaigns-in-elasticsearch/Mapping定义:{ "mappings": { "properties": { "prices": { "type": "nested", "properties": { "p...

2020-04-20 15:03:24

Word delimiter graph token filter(word_delimiter_graph 词元过滤器)

本文禁止转载。原文地址word_delimiter_graph 使用非字母字符切分 tokens,并可以根据规则执行一些可选的 token 正则化。默认情况下,word_delimiter_graph 会使用以下规则:使用非字母字符作为切分点。 比如 Super-Duper → Super, Duper移除每个 token 前置和后置分隔符。比如 XL---42+'Autocoder'...

2020-04-01 11:41:05

搜索、推荐、广告系统等人工智能优质技术资源最全整理

前沿文章目录前沿开源地址[算法学习资料: AI_Tutorial](https://github.com/cbamls/AI_Tutorial)开源相关LuceneSolrElasticLucidWorks中文分词大公司阿里百度京东美团点评携程去哪儿搜狗一号店待分类开发应用理论基础源码解读常见问题其他人工智能领域文集算法学习资料: AI_Tutorial人工智能、AI架构、搜索系统、推荐系统...

2020-03-13 18:16:10

水墨-在线 Markdown 编辑器

墨刀-在线 Markdown 编辑器基于 Spring-boot、FreeMarker、layui、Vditor 构建的一款在线 所见即所得的 Markdown 编辑器。墨刀-在线 Markdown 编辑器。本人使用 Vditor 编辑器时日已久,眼看着其功能日益强大,特此基于 Vditor 构建一款 Web 编辑器,愿为天下文人墨客贡献微不足道的力量。此项目正在陆续开源,疫情期间代码仓促,...

2020-03-01 23:24:32

NLP中文分词知识梳理

中文分词开源工具ik,jieba优缺点优点:使用开源通用语料,综合全面,但缺乏专业词汇缺点:词汇时效方面,新词不及时识别行业结论实践证明,基于统计学习的分词工具要优于基于人工规则的分词工具评测结果表明,未登录词所造成的分词精度下降至少比分词歧义大5倍以上实验结果证明,字标注统计学习方法能够大幅提高未登录词的识别率难点1清晰地界定中文词汇: 如“科教兴国”切词成【科教兴国】和【科教】,【兴国】都符合...

2020-02-06 16:33:18

“肺炎疫情”安置在家的“碎碎念”

“武汉肺炎”疫情期间,除特殊必须行业外,很多上班的,务工的都闷在家里。人一闲下来就胡思乱想。我爸非常固执,没啥文化,根本不懂逻辑,抽象,整天强迫症似的瞎唠叨,家里人干任何事,他都得插手,说三道四,总觉得我们干不好。然后矛盾就来了,他认为是为我们简直操碎了心,而我们而嫌各种被管制,闹挺的要命,天天一些琐碎的细节说个不停。然后我就总是针对性的要想改造他,对他讲一通大道理,但是这么年下来,屁用没有,...

2020-02-01 00:04:46

搜索,推荐,广告系统架构及算法技术资料大合集吐血整理——2020年终分享

算法学习资料: AI_Tutorial各大厂架构开发学习资源;精华机器学习,NLP,图像识别等人工智能领域学习资料,搜索,推荐,广告系统架构及算法技术资料吐血整理你还在为学习算法摸不着头脑么?你还在为技术调研各种Google么?AI的牛b吹不上去?盯紧了,这里就是你的2020女朋友~。本项目会持续关注AI落地的一些优质技术资料。大家也可以去网站投稿。算法学习资料: AI_Tutorial...

2020-01-03 16:42:18

我的2020年度总结 “既往不恋,纵情向前”

写在前面复盘总结能力是一项个人重要的基本功,通过对过往的拆解与反思,沉淀出经验规律,更精准的“以终为始”做好未来的事情。本文以心路历程为主线:阐述述从大学以来成长经历,分享心得重点回顾2019做的好和有待改进的地方2020的规划成长经历我是2018年普通本科毕业,毕业后就一直在北京某互联网工作。初来乍到的碰撞我记得刚上大一的时候,是我大学思念认知冲击最痛的一年,当时核心暴露了...

2020-01-03 02:23:46

程序员必知必会的零拷贝技术

写在前面本篇文章我们学习Linux IO中的零拷贝技术,最后的参考链接中介绍的非常好,大家都可以看一下传统IO过程考虑这样一个过程:我们从磁盘中读取一个文件数据,然后将数据通过网络传输到另一个机器。对用户来说可能就是简单的理解为两步操作。File.read(fileDesc, buf, len);Socket.send(socket, buf, len);但是,如果我们看传输中涉及的...

2019-12-31 17:20:34

沟通的重要工具——乔哈里视窗

写在前面今年最大的成长之一就是对沟通的理解和认知,包括沟通的意义,如何更好的去沟通,毕竟因为沟通踩了不少坑。但就在最近从樊登的一个演讲中,听到了“沟通视窗”的模型,感觉特别惊艳,它将沟通这个抽象高维的事情映射到更多人可以理解的二维上去讨论,不同场景不同个体的沟通都可以套用的框架。为我们如何做好沟通,成就个人和组织价值,提供了指导思想。我便找了更多的资料来了解并分享它,“沟通”是一项基本功,希望我...

2019-12-29 19:57:25

Tensorflow SavedModel 模型的保存和加载

from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tffrom tensorflow.saved_model.signature_def_utils import predict_signature_deffrom tensorflow.saved_model import tag_c...

2019-12-25 18:35:44

读《影响力》这本书

作者: [美] 罗伯特·西奥迪尼写了为什么有些人极具说服力,而我们总是容易上当受骗。隐藏在冲动地顺从他人行为背后的心理秘笈,正是这一切的根源。前言凡选择必有歧视。凡竞争必有成本。凡政策必遭遇对策。凡争夺必有妥协。…嗯~,凡不看此文,必成为不了小坏蛋。咔哒,毕在说动物体内会有很多固定的行为模式,组成这个模式的所有行为,每一次都以同样的方式,按照同样的次序出现,就好像已经...

2019-12-24 20:43:54

NIO中的Channel和Buffer

前言打算输出一系列Netty源码分析与实践的文章,也作为后端开发学习过程中的沉淀。写作风格会遵循目标导向,关注核心,抽离出知识的Pattern,无价值细节决不花时间。此文章为第三篇,和大家一块了解下NIO中的核心组件Channel和Buffer。Channel BufferBuffer顾名思义,本质上就是一个内存缓冲区,作为存储数据的一块内存而已。对于每个非布尔原始数据类型都有一个缓冲...

2019-12-22 19:51:02

深入理解 AQS 之 Condition 源码

前言很久之前分享过ReetrantLock的实现深入剖析ReentrantLock公平锁与非公平锁源码实现,而今再回头去看,对AQS也有了更深刻准确的理解,随即更新了下之前的文章。今天分享利用AQS实现的另一个重要的JUC工具类Condition。如果上篇理解到位,这个Condition的学习就没啥难度的~我们应该都了解过Object的一些监视器方法:wait(), notify(), not...

2019-12-15 19:44:34

搜索推荐系统中用户意图识别——查询理解知识体系

最近调研了下查询理解的相关知识体系分享个前段时间阿里对外分享的一个电商查询理解的PPT:【搜索推荐直播系列第三场】开放搜索行业智能搜索技术介绍-电商查询理解-20191105...

2019-11-26 16:18:41

微服务高可用利器——Hystrix熔断降级原理&实践总结

前言最近在工作中参与组内服务稳定性建设,梳理我们目前服务现状并接入公司自研稳定性保障平台。对公司内自研组件以及业界流行的Hystrix做了学习,Netflix Hystrix 里面大量RxJava响应式实现,实在看着有点绕。所以在这里梳理一些实践以及Hystrix知识点。为什么要做这个事情服务的稳定是公司可持续发展的重要基石,随着业务量的快速发展,一些平时正常运行的服务,会出现各种突发状况...

2019-11-25 14:53:51

开通了程序员技术公众号~!持续分享,欢迎互粉!

本人从小就有特别多的想法,对很多事务都喜欢有自己的思考,热爱学习。大学中有一年多疯狂刷ACM,一年多疯狂学Java后端工程性技术,其它时间就浪费掉了,,。开通csdn也好多年了,自从大三拿到一些大厂Offer后就没咋更新过了,不过最近及以后,要督促自己有更强的自驱力,技术及软实力更上一层楼!希望各位有想法的你们关注下~,也可以加我好友,线下面基,聊技术聊人生!...

2019-11-14 17:14:58

杭电 HDU ACM 2191 悼念512汶川大地震遇难同胞——珍惜现在,感恩生活(多重背包)

悼念512汶川大地震遇难同胞——珍惜现在,感恩生活Time Limit: 1000/1000 MS (Java/Others)Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 19574Accepted Submission(s): 8285Problem Descripti...

2015-08-29 10:42:29

一行代码引发的集群服务宕掉的血案分析

本文禁止转载!紧急处理过程11.05号晚上接近20点,有同事反应其它服务调用XXX服务出现少量超时,看了下Cat监控,发现些许机器当时处于fullgc,因为我们的XXX服务本身在高峰期就有较为频繁的fullgc,并且当天我还灰度了一台调过JVM参的XXX机器(本意是解决之前fullgc问题)。 所以当时误以为是像往常一样的fullgc引发的上游超时,同时从Cat gc指标来看,我灰度的一台...

2019-11-07 12:35:16

由Finalizer和SocksSocketImpl引起的Fullgc问题盘点

本文作者禁止转载问题描述问题1: 我们的网关服务在发布刚启动的时候,总是会报几次fullgc,并且会引起少量请求超时。问题2.:同时服务在某些时间点会报出较多的超时异常,在cat监控上观察到超时异常和fullgc时间点吻合,fullgc耗时在600ms左右,那么至少fullgc停顿时间是造成短时间内大量超时的因素。并且观察到old区内存非常缓慢的线性增长,在达到old区内存92...

2019-10-18 21:06:42

查看更多

CSDN身份
  • 博客专家
勋章 我的勋章
  • 脉脉勋章
    脉脉勋章
    绑定脉脉第三方账户获得
  • 专栏达人
    专栏达人
    授予成功创建个人博客专栏的用户。专栏中添加五篇以上博文即可点亮!撰写博客专栏浓缩技术精华,专栏达人就是你!
  • 持之以恒
    持之以恒
    授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!
  • 勤写标兵Lv1
    勤写标兵Lv1
    授予每个自然周发布1篇到3篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发。
  • 学习力
    学习力
    《原力计划【第二季】》第一期主题勋章 ,第一期活动已经结束啦,小伙伴们可以去参加第二期打卡挑战活动获取更多勋章哦。