- 博客(683)
- 资源 (19)
- 问答 (2)
- 收藏
- 关注
原创 7 年+积累、 Elastic 创始人Shay Banon 等 15 位专家推荐的 Elasticsearch 8.X新书已上线...
今天,非常高兴地跟大家宣布,经过 7 年多的努力和精心准备,我们的新书《一本书讲透 Elasticsearch》已正式出版上线!我从 2016 年接触 Elasticsearch 1.X、2.X 的版本,到现在已经接近 8 年+的时间。在这期间,我常常被问到:如何系统性地学习 Elasticsearch ?如何将现有的关系型数据库迁移到 ES ?如何选择合适的版本?如何规划和监控集群?如何进行数据...
2024-01-15 07:30:59 1138
原创 重磅 | 死磕 Elasticsearch 8.X 方法论认知清单(2022年国庆更新版)
每个人都会犯错,别再让相同的错误一再发生,别再让我们为那些错误付出沉痛的代价。清单不是写在纸上的,而是印在心上的。我们别无选择,清单,正在一步步变革我们的生活,变革这个复杂的世界......——[美] 阿图-葛尔德《清单革命》01Elasticsearch 学习方法论如何系统的学习 Elasticsearch ?视频 | 零基础如何学习 Elasticsearch?刻意练习 Elastics...
2022-09-28 07:16:17 2309
原创 干货 | Elasticsearch 8.X 实战视频合集(80 小时+)
1、Elasticsearch 进阶实战 10 讲(10小时+)1.1 进阶实战 10 讲视频地址https://t.zsxq.com/BAU33J61.2 进阶实战 10 讲包含内容Elasticsearch 全貌认知索引创建和搜索原理集群规划及节点角色规划最佳实践集群性能调优及原理数据建模最佳实践冷热集群架构实战索引生命周期管理ILM实战跨集群检索实战分片分配策略实战集群安全实战2、Elast...
2022-09-28 07:16:17 2204 1
原创 Elasticsearch 7.X 进阶实战视频课上线
1、Elasticsearch 7.X 进阶实战大纲课程地址:Elasticsearch 7.X 进阶实战视频课10个大选题来源于实战业务场景的提炼、总结。 Elasticsearch 全貌认知 Elasticsearch 索引创建和搜索原理 Elasticsearch 集群规划及节点角色规划最佳实践 Elasticsearch 集群性能调优及原理 Elasticsearch 数据建模实例讲解与实战技巧 Elasticsearch 冷温热架
2021-08-17 10:58:53 3609
原创 如何系统的学习 Elasticsearch ?
这是上一次技术直播里六个子主题中的最后一个主题的扩展版本。近期又有读者问到类似问题,我认为非常有必要花长时间梳理后跟大家分享一下。1、基础篇:零基础如何学 Elasticsearch ?常...
2021-03-11 21:46:54 10247 4
原创 潜心一技、做到极致!——Elastic认证工程师之路
20年2月3日我参加Elastic认证工程师考试,2020年2月5日中午得到认证结果:通过考试。趁热打铁,将Elastic认证工程师考试相关内容、经验教训等和盘而出,希望对后续参加考试的同学有所帮助。1、Elastic工程师有什么用?An Elastic Certified Engineer possesses the skills and is able to pe...
2020-02-07 13:36:36 13079 21
原创 重磅 | Elasticsearch7.X学习路线图
1、为什么要梳理学习路线图?在关注Elastic 中文社区、QQ群、星球群的过程中,多多少少都会有一些基础问题冒出。而这些问题不复杂,多半都在官方文档中都有提及,稍稍复杂的在官方英文社区、中文社区都有过类似问题的讨论。基本上通过Google、bing都能直接或间接搜索到答案。那么问题是:为什么好多初学的朋友,找不到答案呢。观察和思考了很久。我认为最主要的问题在于,没有建立基础知识全貌的认知...
2019-04-30 23:34:20 17949 17
原创 Elasticsearch学习,请先看这一篇!
题记:Elasticsearch研究有一段时间了,现特将Elasticsearch相关核心知识、原理从初学者认知、学习的角度,从以下9个方面进行详细梳理。欢迎讨论……0. 带着问题上路——ES是如何产生的?(1)思考:大规模数据如何检索?如:当系统数据量上了10亿、100亿条的时候,我们在做系统架构的时候通常会从以下角度去考虑问题: 1)用什么数据库好?(mysql、sybase、oracle、达
2016-08-18 21:08:36 229883 66
原创 Elasticsearch的使用场景深入详解
了解了ES的使用场景,ES的研究、使用、推广才更有价值和意义。1、场景—:使用Elasticsearch作为主要的后端传统项目中,搜索引擎是部署在成熟的数据存储的顶部,以提供快速且相关的搜索能力。这是因为早期的搜索引擎不能提供耐用的存储或其他经常需要的功能,如统计。 Elasticsearch是提供持久存储、统计等多项功能的现代搜索引擎。 如果你开始一个新项目,我们建议您考虑使用Elas
2016-08-17 08:40:56 118048 21
原创 干货 | 2024 年 Elasticsearch 常见面试题集锦
当涉及到 Elasticsearch 开发者的面试时,问题通常会更专注于软件开发生命周期内与 Elasticsearch 集成的具体技术细节和实际应用场景。以下是一些Elasticsearch开发相关的面试题目,题目来自死磕 Elasticsearch 知识星球。1、Elasticsearch数据建模相关问题问题描述:Q1:描述如何设计 Elasticsearch 索引以支持高效的全文搜索和聚合操...
2024-03-23 23:14:02 818
原创 Elasticsearch 悬挂索引解析与管理指南
在 Elasticsearch 的实战中,悬挂索引是一个既常见又容易引起困扰的概念。今天,我将分享一次处理集群状态为RED,原因为DANGLING_INDEX_IMPORTED 的实战经验,深入探讨悬挂索引的定义、产生原因、管理方法,以及如何有效处理它们,确保读者能够明白并解决自己面临的问题。值得一提的是,类似问题恰巧是某企业的面试题。1、悬挂索引的定义当 Elasticsearch 集群的某个节...
2024-03-18 07:30:46 856
原创 用 Python 优雅地玩转 Elasticsearch:实用技巧与最佳实践
Elasticsearch,这个开源的分布式搜索与数据分析引擎,因其强大的全文搜索功能而广受欢迎。尽管Elasticsearch的核心是用Java编写的,它提供了REST API,让各种编程语言的开发者都能轻松与之交互,Python当然也不例外。今天,我们将深入探讨如何将 Elasticsearch 与 Python 结合使用,提升我们的项目到新的高度。1、入门准备首先,确保我们有一个运行中的 E...
2024-03-14 09:05:33 859
原创 吴恩达 x Open AI ChatGPT ——如何写出好的提示词视频核心笔记
核心知识点脑图如下:1、第一讲:课程介绍要点1:上图展示了两种大型语言模型(LLMs)的对比:基础语言模型(Base LLM)和指令调整语言模型(Instruction Tuned LLM)。基础语言模型(Base LLM)功能:基础语言模型能够预测下一个单词,这种预测是基于文本训练数据。例子:图中提供了一个故事的开头:“Once upon a time, there was a unicorn ...
2024-03-11 07:31:26 649
原创 Elasticsearch 通过索引阻塞实现数据保护深入解析
Elasticsearch是一种强大的搜索和分析引擎,被广泛用于各种应用中,以其强大的全文搜索能力而著称。不过,在日常管理 Elasticsearch 时,我们经常需要对索引进行保护,以防止数据被意外修改或删除,特别是在进行系统维护或者需要优化资源使用时。Elasticsearch提供了一种名为“索引阻塞(Index blocks)”的功能,让我们能够限制对某个索引的操作类型。Elasticse...
2024-03-07 20:42:55 970
转载 如何防止 Elasticsearch 服务 OOM ?极限网关来为你的 ES 服务保驾护航!
嘿,小伙伴们!今天我要和大家聊一个热门话题!Elasticsearch(ES)和传统关系型数据库到底有什么不同。你知道吗?在传统数据库中,我们经常会碰到一个叫做"最大连接数"的限制。这个设置的目的是为了让数据库在可控的负载范围内运行,避免出现负载过高、资源耗尽的尴尬场景,导致谁都无法登录的窘境。但是,ES在这方面可不一样哦!它没有类似的参数设定,这也是为什么ES经常被激增的流量打得七零八落的原因之...
2024-02-28 20:48:04 43
原创 死磕Elasticsearch:携手六年,感谢有你!
6 年前,一个偶然机会了解到知识星球。彼时的我已开始写 Elasticsearch 博客 近 4 年,自己组建了 2000 人+规模的 QQ 群。当时能看得出 ES 国内技术交流需求旺盛,但不论博客、QQ 群、微信群都做不到让技术快速的沉淀。很多的问题,隔个几天、一两周、一个月左右都会被反复的问到。2018年的一篇 gitchat 技术付费文章的试水,更让我看到大家对系统化、通俗梳理知识的迫切需求...
2024-02-28 20:48:04 868
原创 重磅 | Elasticsearch 智能知识问答上线了
开放搜索智能问答实验室——Elasticsearch 知识问答上线了,诚邀您免费体验Elasticsearch学习应用过程中的对话式答疑。OpenSearch LLM 智能问答版是阿里云推出的一站式RAG解决方案,内置大语言模型,可基于业务数据搭建企业专属模型,支持丰富数据格式的快速导入,构建包括对话、链接、图片在内的多模态搜索服务,帮助开发者一站式快速搭建RAG系统。本问答知识库来自千万级博客阅...
2024-02-23 08:03:59 1303
原创 Elasticsearch 8.X 集群 SSL 证书到期了,怎么更换?
1、SSL 证书过期问题如上两个问题是近期社群讨论比较多的问题,涉及8.X、7.X等版本。在 Elasticsearch 集群中,使用SSL证书对数据传输进行加密是一种常见的安全措施。正如《一本书讲透 Elasticsearch》所讲的一样,Elasticsearch 8.0 之后,安全设置已经成为默认配置,除非手动禁用。。但,随着时间的推移,这些SSL证书会到期,需要进行更换以保持集群的安全性。...
2024-02-22 11:39:13 1019
原创 《一本书讲透 Elasticsearch》荣登当当人工智能新书榜
年前,《一本书讲透Elasticsearch》荣登京东编程语言与程序设计榜前5名,今天又上榜当当人工智能新书榜第7名。先看评价,看看大家阅后反馈来自百度公司员工评价来自Elastic原厂资深架构师评价来自IBM资深架构师周钰老师的评价来自2位阿里巴巴资深大佬评价来自产业技术研究院的评价京东评价截图淘宝评价截图再看视频,全面了解书中8.X版本内容强烈建议看完再做决定长期积累,偶然得之——...
2024-02-20 07:06:39 546
原创 Elasticsearch 与 OpenSearch:开源搜索技术的演进与选择
在2010年以Apache 2.0开源协议发布后,Elasticsearch迅速成为全球最受欢迎的企业搜索引擎。Elasticsearch常与Logstash和Kibana一起部署,这一组合被称为 Elasitc Stack,用于启用日志分析用例,包括应用可观察性、安全日志分析和理解用户行为。2015年,亚马逊利用这一开源协议推出了Amazon Elasticsearch Service(Amaz...
2024-02-15 18:53:50 1328 2
原创 来自钉钉群的问题——Elasticsearch 如何实现文件名自定义排序?
1、背景在数字时代,图像数据的管理已成为数据架构的一部分。然而,随之而来的挑战是如何有效地索引和检索这些图像文件。这不仅涉及存储,更重要的是如何根据特定的属性(如文件名中的数字)进行排序,以便用户可以按照预期的顺序查看图像。如下问题来自Elastic 钉钉技术交流群:2、解决方案探讨在Elasticsearch中,我们经常面对需要对数据进行排序的需求。单就排序,咱们之前有过几篇文章分析不同业务场景...
2024-02-02 07:30:36 984
原创 近期,几个典型 Elasticsearch 8.X 问题及方案探讨
问题1:max_expansions 设置大了会报错,什么原因?大佬们问个问题,我在使用match_phrase_prefix时候,设置了一个比较大的max_expansions,比如10000。这个时候会报错:too_many_clauses: maxClauseCount is set to 1024。我搜了下 maxClauseCount 这是控制搜索条件数量的,但我这只是改了个 max_e...
2024-01-29 17:30:15 1066
原创 长期积累,偶然得之——普通素人 Nobody 从 0 到 1 写书指南
社群小伙伴问道:“自己也想写一本技术书,铭毅老师能不能分享一下自己的成书全过程经历?怎么才能少走弯路,甚至弯道超车?”安排!近期在和孩子读《姜子牙》绘本,发现里面的子标题长度都一样,长度都是7个字符,咱们也凑个相同长度的子标题。大纲如下:1.同一领域要深耕2.出版社会找上门3.要过心里这道坎4.先签合同后写书5.目录咱们自己定6.定期交付是关键7.没有时间怎么办8.三审三校流程长9.大佬推荐很重要...
2024-01-29 17:30:15 940
原创 每一个突破下限的 DSL 背后都隐藏着一个“傻X”的客户需求
1、事出有因偶然间在朋友圈看到球友的一次分享,很好奇什么原因导致发了这么大的火!我们放大看一下,是类似如下的 DSL。POST my_index_001/_search{ "query": { "script": { "script": { "source": """ def strArrray=doc['name'].value; ...
2024-01-26 15:17:20 769
转载 《一本书讲透 Elasticsearch》荣登京东编程语言与程序设计榜前5名
看视频,了解书中内容>>京东、当当、天猫、淘宝、拼多多均有售……
2024-01-24 21:28:21 152
原创 日志解析神器——Logstash中的Grok过滤器使用详解
0、引言在处理日志数据时,我们经常面临将非结构化文本转换为结构化数据的挑战。Logstash 作为一个强大的日志管理工具,提供了一个名为 Grok 的过滤器插件,专门用于解析复杂的文本数据。后文会解读,功能远不止于此......关于 Grok 过滤器插件,咱们之前有过两篇文章讲解:1、干货 | Logstash自定义正则表达式ETL实战2、干货 | Logstash Grok数据结构化ETL实战G...
2024-01-23 07:30:57 728
原创 大白话讲清楚:什么是 Langchain 及其核心概念
在AI和机器学习领域,每天都有新技术和框架涌现。今天,我们来聊聊最近引起广泛关注的一个框架 —— Langchain。https://python.langchain.com/docs/get_started/introduction那么,Langchain到底是什么,它为什么这么受欢迎,以及它是如何工作的呢?别担心,我会用大白话帮你一步步弄明白!1、Langchain 简介想象一下,如果你能让聊...
2024-01-13 17:48:34 960
原创 Openai Python 代码调用 Demo 级实现全步骤
1、 申请 API前置条件1:jie 码平台https://sms-activate.org/cn见上面的截图。截止:2024-01-09 chatgpt 注册只需要 google 账号就可以,不再需要接码。但是,API 申请必须需要接码平台。chatgpt API 平台地址:https://platform.openai.com/docs/overview申请 API 地址:https://pl...
2024-01-13 17:48:34 1000
原创 Langchain 与 Elasticsearch:创新数据检索的融合实战
1、简介在信息爆炸的时代,有效地检索和处理数据变得至关重要。Langchain 和 Elasticsearch 的结合,为我们提供了一个强大的工具,以更智能的方式进行数据检索和分析。作为一名拥有多年 Elasticsearch 实战经验的技术博主,我将在本文中详细介绍这两种技术的整合应用。2、LangChain 简介Langchain是一个旨在简化自然语言处理任务的库。它允许开发者轻松地集成和使用...
2024-01-13 17:48:34 1473
原创 Elasticsearch 8.X 如何依据 Nested 嵌套类型的某个字段进行排序?
1、问题来源这是来自社区的一个真实企业场景问题。https://elasticsearch.cn/question/13135如下所示, 希望在查出的结果后, 对结果进行后处理,对tags列表,根据depth进行排序。{"keyProperty":"22","name":"测试内容","_class":"com.xxxxxxxx.ElasticSearchContent","content...
2024-01-11 07:30:50 1251
原创 Elasticsearch 8.X 小技巧:使用存储脚本优化数据索引与转换过程
1、引言在 Elasticsearch 中,可以使用 Painless 脚本来实现一些非标准的处理结果。这些脚本可以直接嵌入到数据处理管道中,但为了使脚本与管道相互独立,还可以将脚本单独存储在 Elasticsearch 中,并在数据摄取管道(Ingest pipeline)中按需调用它们。这种存储脚本的方式,咱们之前也有过介绍,Elasticsearch 中有个专有术语名词与之对应,叫:stor...
2024-01-04 07:31:04 1157
原创 路在脚下——我的 2023 年终总结
写下这个题目的时候,我刚从外面跑步(有积雪,边走边跑)近 8 公里回来。一是寻找一下灵感,二是“排解”一下负能量。今年这个形势,实话说大家都挺不容易的。但是,正如本山大叔所说,“我们不是破坏大环境的人”,那只能自我想办法解决。于是乎,最早想的“都不容易”偏迷茫、负能量的题目,待我跑步回来也改成了“路在脚下”。今年一年唯一的感触就是快!回首一年时光,我想起了读到的汪国真的诗歌“过去”——“过去是什么...
2023-12-30 07:27:16 970
原创 Elasticsearch “指纹”去重机制,你实践中用到了吗?
0、实战问题老师有个问题想请教一下,我们项目中有个需求是查询出数据集根据某个字段去重后的全部结果,用 collapse 发现很多数据都没查询到,后面发现是去重的这个字段的值太长了,ignore _above默认的是256,而这个字段的值有的有十几万甚至几十万个字符,像这种情况,还有什么比较好的查询去重方法吗?——来自:死磕Elasticsearch知识星球https://t.zsxq.com/1...
2023-12-27 11:20:15 998
原创 Elasticsearch 写入优化探索:是什么影响了refresh 耗时?
1、问题背景:数据写入后,refresh耗时过长,能达到1s-5s。想通过测试,探索确认影响refresh的因素,比如:写入操作是新增还是更新,deleted文档占比是否有影响,是否有其他索引配置,等等。2、测试过程全记录旧索引:24主分片,1副本,经过长期forcemerge,最大segmeng 33gb,镜像后deleted占比 8%左右。noforcemerge 索引:24主分片,1副本,r...
2023-12-22 11:25:39 1073
转载 各位,请入局AI大模型,现在!立刻!马上!!
随着ChatGPT大热“AI大模型”无疑是最火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,甚至还有60k*16的高薪,挖掘AI大模型人才!作为普通程序员,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑程序员核心竞争力(不限年龄!不限...
2023-12-21 07:30:18 69
原创 最近几个典型 Elasticsearch 线上易出错难排查问题汇集,咱们得避免!
1、主节点设置1个,但是宕机了,集群咋办?有人试过唯一的 master 所在的主机恢复不了了,可以配置其他数据节点作为 master 恢复集群吗?1.1 问题描述多节点集群,但只设置一个候选主节点,但这个主节点所在的物理机出故障了,怎么办?1.2 问题拆解分析第一直觉——这里的关键在于:咱们得有多个候选主节点。如果没有,这个没法再次选主。在 Elasticsearch 中,集群的稳健性和高可用性是...
2023-12-19 07:31:02 1003
原创 Elasticsearch 查询革新:探索 Wildcard 类型的高效模糊匹配策略
1、背景在生产使用中,Elasticsearch 除了精确匹配的要求,也会有模糊查询的场景。2、解决方案探讨面对这种问题 ,传统的解决方案有两种:2.1 方案一:ngram 分词器使用 ngram 分词器对存入的数据进行精细化的拆分,利用细颗粒度的 token 进行快速的召回。这是一个利用空间换时间的方案,细化查询所需的词根内容,利用精确匹配结果大范围的命中来达到模糊效果。PUTtest-005...
2023-12-12 07:30:30 1483
原创 ElasticON AI 2023大会回顾:深入探索 Elasticsearch 与人工智能的融合之路
简介在2023年的 ElasticON AI大会上,我们见证了Elasticsearch如何通过融合人工智能技术来推动搜索引擎的发展。这篇博客旨在为Elastic技术从业者提供一份详实的技术总结,涵盖会议中的主要讨论点,并深入解析这些创新如何影响我们处理数据和信息的方式。一、Elasticsearch 的演变与创新1.Elasticsearch的起源与发展Elastic的创始人兼首席技术官Sh...
2023-12-11 07:15:21 861
原创 Elasticsearch 优化查询中获取字段内容的方式,性能提升5倍!
1、背景集群配置为:8 个 node 节点,16 核 32G,索引 4 分片 1 副本。应用程序的查询逻辑是按经纬度排序后找前 200 条文档。1、应用对查询要求比较高,search 没有慢查询的状态。2、集群压测性能不能上去,cpu 使用未打满,查询的 qps 上不去,且有队列堆积。2、优化方法通过云厂商内核组的同学抓取火焰图发现,主要消耗在 fetch phrase 阶段。ES 默认从_sou...
2023-12-01 21:08:18 1716 4
原创 学习的过程不只是知识查找,社群的价值是陪伴!
——来自Elastic中文社区深圳站主席杨振涛大佬的评价!感触非常深。随着技术的快速发展,我们的获取信息和知识的方式也在日新月异地变化。人工智能和深度学习技术如 OpenAI 的 ChatGPT ,已经成为许多人获取知识的首选方式,而这无疑对我们传统的社群学习和搜索引擎带来了巨大的冲击。然而,我们不能忘记一件事:学习的过程不仅仅是寻找和获取知识,更重要的是我们与他人的交互和共享。这就是为什么我坚信...
2023-11-27 07:35:39 921
Windows下libevent C++封装类实现
2016-12-11
C++内部培训讲义
2016-08-07
libcurl.lib下载(32bit和64bit)
2015-09-17
MFC动态划线实现源码
2013-03-30
(可视化文件消息一体化收发Socket实现V0.1说明文档
2013-03-17
可视化文件消息一体化收发Socket实现V0.1
2013-03-17
Windows Sockets 规范及应用
2010-12-20
路由器交换机配置命令详解.doc
2010-04-18
C++ 笔试面试宝典2009版.doc
2010-04-18
? Kerberos认证相关问题思路请教:
2013-11-03
求samba下的rpcclient工具使用方法?
2013-09-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人