- 博客(688)
- 资源 (19)
- 问答 (2)
- 收藏
- 关注
原创 7 年+积累、 Elastic 创始人Shay Banon 等 15 位专家推荐的 Elasticsearch 8.X新书已上线...
今天,非常高兴地跟大家宣布,经过 7 年多的努力和精心准备,我们的新书《一本书讲透 Elasticsearch》已正式出版上线!我从 2016 年接触 Elasticsearch 1.X、2.X 的版本,到现在已经接近 8 年+的时间。在这期间,我常常被问到:如何系统性地学习 Elasticsearch ?如何将现有的关系型数据库迁移到 ES ?如何选择合适的版本?如何规划和监控集群?如何进行数据...
2024-01-15 07:30:59 1317 2
原创 重磅 | 死磕 Elasticsearch 8.X 方法论认知清单(2022年国庆更新版)
每个人都会犯错,别再让相同的错误一再发生,别再让我们为那些错误付出沉痛的代价。清单不是写在纸上的,而是印在心上的。我们别无选择,清单,正在一步步变革我们的生活,变革这个复杂的世界......——[美] 阿图-葛尔德《清单革命》01Elasticsearch 学习方法论如何系统的学习 Elasticsearch ?视频 | 零基础如何学习 Elasticsearch?刻意练习 Elastics...
2022-09-28 07:16:17 2333
原创 干货 | Elasticsearch 8.X 实战视频合集(80 小时+)
1、Elasticsearch 进阶实战 10 讲(10小时+)1.1 进阶实战 10 讲视频地址https://t.zsxq.com/BAU33J61.2 进阶实战 10 讲包含内容Elasticsearch 全貌认知索引创建和搜索原理集群规划及节点角色规划最佳实践集群性能调优及原理数据建模最佳实践冷热集群架构实战索引生命周期管理ILM实战跨集群检索实战分片分配策略实战集群安全实战2、Elast...
2022-09-28 07:16:17 2239 1
原创 Elasticsearch 7.X 进阶实战视频课上线
1、Elasticsearch 7.X 进阶实战大纲课程地址:Elasticsearch 7.X 进阶实战视频课10个大选题来源于实战业务场景的提炼、总结。 Elasticsearch 全貌认知 Elasticsearch 索引创建和搜索原理 Elasticsearch 集群规划及节点角色规划最佳实践 Elasticsearch 集群性能调优及原理 Elasticsearch 数据建模实例讲解与实战技巧 Elasticsearch 冷温热架
2021-08-17 10:58:53 3634
原创 如何系统的学习 Elasticsearch ?
这是上一次技术直播里六个子主题中的最后一个主题的扩展版本。近期又有读者问到类似问题,我认为非常有必要花长时间梳理后跟大家分享一下。1、基础篇:零基础如何学 Elasticsearch ?常...
2021-03-11 21:46:54 10276 4
原创 潜心一技、做到极致!——Elastic认证工程师之路
20年2月3日我参加Elastic认证工程师考试,2020年2月5日中午得到认证结果:通过考试。趁热打铁,将Elastic认证工程师考试相关内容、经验教训等和盘而出,希望对后续参加考试的同学有所帮助。1、Elastic工程师有什么用?An Elastic Certified Engineer possesses the skills and is able to pe...
2020-02-07 13:36:36 13119 21
原创 重磅 | Elasticsearch7.X学习路线图
1、为什么要梳理学习路线图?在关注Elastic 中文社区、QQ群、星球群的过程中,多多少少都会有一些基础问题冒出。而这些问题不复杂,多半都在官方文档中都有提及,稍稍复杂的在官方英文社区、中文社区都有过类似问题的讨论。基本上通过Google、bing都能直接或间接搜索到答案。那么问题是:为什么好多初学的朋友,找不到答案呢。观察和思考了很久。我认为最主要的问题在于,没有建立基础知识全貌的认知...
2019-04-30 23:34:20 17985 17
原创 Elasticsearch学习,请先看这一篇!
题记:Elasticsearch研究有一段时间了,现特将Elasticsearch相关核心知识、原理从初学者认知、学习的角度,从以下9个方面进行详细梳理。欢迎讨论……0. 带着问题上路——ES是如何产生的?(1)思考:大规模数据如何检索?如:当系统数据量上了10亿、100亿条的时候,我们在做系统架构的时候通常会从以下角度去考虑问题: 1)用什么数据库好?(mysql、sybase、oracle、达
2016-08-18 21:08:36 230123 66
原创 Elasticsearch的使用场景深入详解
了解了ES的使用场景,ES的研究、使用、推广才更有价值和意义。1、场景—:使用Elasticsearch作为主要的后端传统项目中,搜索引擎是部署在成熟的数据存储的顶部,以提供快速且相关的搜索能力。这是因为早期的搜索引擎不能提供耐用的存储或其他经常需要的功能,如统计。 Elasticsearch是提供持久存储、统计等多项功能的现代搜索引擎。 如果你开始一个新项目,我们建议您考虑使用Elas
2016-08-17 08:40:56 118200 21
原创 Elasticsearch FSCrawler 文档爬虫学习,请先看这一篇!
FSCrawler 是一个开源项目,可以帮助我们快速简便地将文件(如 PDFs、Office 文档等)索引到 Elasticsearch 中。其作者 David Pilato,有20年+工作经验。自 2013 年至今,一直在 Elastic公司工作,可以算作 Elastic 元老级员工。博客地址:https://david.pilato.fr/Github:https://github.com/d...
2024-04-23 17:30:52 442
原创 30 天加购飙升 5 倍!《一本书讲透 Elasticsearch》荣登京东编程设计图书折扣榜第 1 名...
在《一本书讲透Elasticsearch》荣登京东编程语言与程序设计榜前5名、当当人工智能新书榜第7名后,近期又上榜京东编程设计图书榜折扣榜第1名(见下图)。先看评价,看看大家阅后反馈来自百度公司员工评价来自Elastic原厂资深架构师评价来自IBM资深架构师周钰老师的评价来自2位阿里巴巴资深大佬评价来自产业技术研究院的评价微信读书电子书部分评价截图京东评价截图加微信读者反馈截图淘宝评价截图再看...
2024-04-22 06:30:07 143
原创 Elasticsearch 配置文件 path.data 中可以配置多个数据目录的路径吗?
1、企业级实战问题Elasticsearch 配置文件里面的 path.data: 可以配置多个数据目录的路径的吗?——来自死磕Elasticsearch知识星球微信群2、7.13.0 之前版本可以配置多路径多数据路径的支持在7.13.0 + 版本中已被弃用。https://www.elastic.co/guide/en/elasticsearch/reference/current/import...
2024-04-21 09:14:51 720
原创 探索MATLAB在计算机视觉与深度学习领域的实战应用
随着人工智能技术的快速发展,计算机视觉与深度学习已成为科技领域中最热门、最具挑战性的研究方向之一。它们的应用范围从简单的图像处理扩展到了自动驾驶、医疗影像分析、智能监控行业等多个领域。在这样的背景下,《》一书应运而生,为广大从业人员和学者提供了一个全面、深入的学习和实践平台。
2024-04-19 10:26:15 517 1
原创 大模型时代:一群人的狂欢,一个人的孤单!
近期作息不大规律,昨夜,凌晨一点多突然醒来。思前想后,突然脑中出现一个瞬时想法,并第一时间在没开灯的情况下摸黑顺手写在旁边笔记本上。在大模型时代的潮流之下,我们每个人都似乎被赋予了一种全新的力量,这股力量既令人兴奋又引人深思。1、大模型时代,相当于人手一个“金箍棒”在这个时代,每个人都能通过几下点击,利用强大的 AI 技术解决问题,仿佛每人都持有一根能呼风唤雨的“金箍棒”。但拥有这根金箍棒的我们,...
2024-04-11 07:30:35 837
原创 Elasticsearch 8.X 向量检索和普通检索能否实现组合检索?如何实现?
1、企业级实战问题向量组合条件查询,报 [vector] malformed query, expected [END_OBJECT] but found [FIELD_NAME] 错误,向量查询是不支持复合条件查询吗?GET/my_index/_search{"size":2,"_source":true,"query":{"vector":{...
2024-04-09 07:31:05 1112
原创 一张图30个知识点,全方位认知 Elasticsearch 技术发展
上图来自 Elastic 官方两位技术大佬朱杰老师和刘晓国老师的社群微信群中的分享。看到之后,非常有感触,并第一时间转发到技术群中。Elasticsearch 自从推出以来,就不断引领搜索和分析技术的未来。它集成了众多的功能,不仅简化了大数据的处理,还通过不断的创新,提供了全面的解决方案。Elasticsearch 创始人Shay Banon的“We’ve come a long way”——我把...
2024-03-31 07:30:53 696
原创 干货 | 2024 年 Elasticsearch 常见面试题集锦
当涉及到 Elasticsearch 开发者的面试时,问题通常会更专注于软件开发生命周期内与 Elasticsearch 集成的具体技术细节和实际应用场景。以下是一些Elasticsearch开发相关的面试题目,题目来自死磕 Elasticsearch 知识星球。1、Elasticsearch数据建模相关问题问题描述:Q1:描述如何设计 Elasticsearch 索引以支持高效的全文搜索和聚合操...
2024-03-23 23:14:02 992
原创 Elasticsearch 悬挂索引解析与管理指南
在 Elasticsearch 的实战中,悬挂索引是一个既常见又容易引起困扰的概念。今天,我将分享一次处理集群状态为RED,原因为DANGLING_INDEX_IMPORTED 的实战经验,深入探讨悬挂索引的定义、产生原因、管理方法,以及如何有效处理它们,确保读者能够明白并解决自己面临的问题。值得一提的是,类似问题恰巧是某企业的面试题。1、悬挂索引的定义当 Elasticsearch 集群的某个节...
2024-03-18 07:30:46 978
原创 用 Python 优雅地玩转 Elasticsearch:实用技巧与最佳实践
Elasticsearch,这个开源的分布式搜索与数据分析引擎,因其强大的全文搜索功能而广受欢迎。尽管Elasticsearch的核心是用Java编写的,它提供了REST API,让各种编程语言的开发者都能轻松与之交互,Python当然也不例外。今天,我们将深入探讨如何将 Elasticsearch 与 Python 结合使用,提升我们的项目到新的高度。1、入门准备首先,确保我们有一个运行中的 E...
2024-03-14 09:05:33 1063
原创 吴恩达 x Open AI ChatGPT ——如何写出好的提示词视频核心笔记
核心知识点脑图如下:1、第一讲:课程介绍要点1:上图展示了两种大型语言模型(LLMs)的对比:基础语言模型(Base LLM)和指令调整语言模型(Instruction Tuned LLM)。基础语言模型(Base LLM)功能:基础语言模型能够预测下一个单词,这种预测是基于文本训练数据。例子:图中提供了一个故事的开头:“Once upon a time, there was a unicorn ...
2024-03-11 07:31:26 754
原创 Elasticsearch 通过索引阻塞实现数据保护深入解析
Elasticsearch是一种强大的搜索和分析引擎,被广泛用于各种应用中,以其强大的全文搜索能力而著称。不过,在日常管理 Elasticsearch 时,我们经常需要对索引进行保护,以防止数据被意外修改或删除,特别是在进行系统维护或者需要优化资源使用时。Elasticsearch提供了一种名为“索引阻塞(Index blocks)”的功能,让我们能够限制对某个索引的操作类型。Elasticse...
2024-03-07 20:42:55 1070
原创 死磕Elasticsearch:携手六年,感谢有你!
6 年前,一个偶然机会了解到知识星球。彼时的我已开始写 Elasticsearch 博客 近 4 年,自己组建了 2000 人+规模的 QQ 群。当时能看得出 ES 国内技术交流需求旺盛,但不论博客、QQ 群、微信群都做不到让技术快速的沉淀。很多的问题,隔个几天、一两周、一个月左右都会被反复的问到。2018年的一篇 gitchat 技术付费文章的试水,更让我看到大家对系统化、通俗梳理知识的迫切需求...
2024-02-28 20:48:04 974
原创 重磅 | Elasticsearch 智能知识问答上线了
开放搜索智能问答实验室——Elasticsearch 知识问答上线了,诚邀您免费体验Elasticsearch学习应用过程中的对话式答疑。OpenSearch LLM 智能问答版是阿里云推出的一站式RAG解决方案,内置大语言模型,可基于业务数据搭建企业专属模型,支持丰富数据格式的快速导入,构建包括对话、链接、图片在内的多模态搜索服务,帮助开发者一站式快速搭建RAG系统。本问答知识库来自千万级博客阅...
2024-02-23 08:03:59 1418
原创 Elasticsearch 8.X 集群 SSL 证书到期了,怎么更换?
1、SSL 证书过期问题如上两个问题是近期社群讨论比较多的问题,涉及8.X、7.X等版本。在 Elasticsearch 集群中,使用SSL证书对数据传输进行加密是一种常见的安全措施。正如《一本书讲透 Elasticsearch》所讲的一样,Elasticsearch 8.0 之后,安全设置已经成为默认配置,除非手动禁用。。但,随着时间的推移,这些SSL证书会到期,需要进行更换以保持集群的安全性。...
2024-02-22 11:39:13 1250
原创 《一本书讲透 Elasticsearch》荣登当当人工智能新书榜
年前,《一本书讲透Elasticsearch》荣登京东编程语言与程序设计榜前5名,今天又上榜当当人工智能新书榜第7名。先看评价,看看大家阅后反馈来自百度公司员工评价来自Elastic原厂资深架构师评价来自IBM资深架构师周钰老师的评价来自2位阿里巴巴资深大佬评价来自产业技术研究院的评价京东评价截图淘宝评价截图再看视频,全面了解书中8.X版本内容强烈建议看完再做决定长期积累,偶然得之——...
2024-02-20 07:06:39 682
原创 Elasticsearch 与 OpenSearch:开源搜索技术的演进与选择
在2010年以Apache 2.0开源协议发布后,Elasticsearch迅速成为全球最受欢迎的企业搜索引擎。Elasticsearch常与Logstash和Kibana一起部署,这一组合被称为 Elasitc Stack,用于启用日志分析用例,包括应用可观察性、安全日志分析和理解用户行为。2015年,亚马逊利用这一开源协议推出了Amazon Elasticsearch Service(Amaz...
2024-02-15 18:53:50 1550 2
原创 来自钉钉群的问题——Elasticsearch 如何实现文件名自定义排序?
1、背景在数字时代,图像数据的管理已成为数据架构的一部分。然而,随之而来的挑战是如何有效地索引和检索这些图像文件。这不仅涉及存储,更重要的是如何根据特定的属性(如文件名中的数字)进行排序,以便用户可以按照预期的顺序查看图像。如下问题来自Elastic 钉钉技术交流群:2、解决方案探讨在Elasticsearch中,我们经常面对需要对数据进行排序的需求。单就排序,咱们之前有过几篇文章分析不同业务场景...
2024-02-02 07:30:36 1090
原创 近期,几个典型 Elasticsearch 8.X 问题及方案探讨
问题1:max_expansions 设置大了会报错,什么原因?大佬们问个问题,我在使用match_phrase_prefix时候,设置了一个比较大的max_expansions,比如10000。这个时候会报错:too_many_clauses: maxClauseCount is set to 1024。我搜了下 maxClauseCount 这是控制搜索条件数量的,但我这只是改了个 max_e...
2024-01-29 17:30:15 1166
原创 长期积累,偶然得之——普通素人 Nobody 从 0 到 1 写书指南
社群小伙伴问道:“自己也想写一本技术书,铭毅老师能不能分享一下自己的成书全过程经历?怎么才能少走弯路,甚至弯道超车?”安排!近期在和孩子读《姜子牙》绘本,发现里面的子标题长度都一样,长度都是7个字符,咱们也凑个相同长度的子标题。大纲如下:1.同一领域要深耕2.出版社会找上门3.要过心里这道坎4.先签合同后写书5.目录咱们自己定6.定期交付是关键7.没有时间怎么办8.三审三校流程长9.大佬推荐很重要...
2024-01-29 17:30:15 1030
原创 每一个突破下限的 DSL 背后都隐藏着一个“傻X”的客户需求
1、事出有因偶然间在朋友圈看到球友的一次分享,很好奇什么原因导致发了这么大的火!我们放大看一下,是类似如下的 DSL。POST my_index_001/_search{ "query": { "script": { "script": { "source": """ def strArrray=doc['name'].value; ...
2024-01-26 15:17:20 862
转载 《一本书讲透 Elasticsearch》荣登京东编程语言与程序设计榜前5名
看视频,了解书中内容>>京东、当当、天猫、淘宝、拼多多均有售……
2024-01-24 21:28:21 277
原创 日志解析神器——Logstash中的Grok过滤器使用详解
0、引言在处理日志数据时,我们经常面临将非结构化文本转换为结构化数据的挑战。Logstash 作为一个强大的日志管理工具,提供了一个名为 Grok 的过滤器插件,专门用于解析复杂的文本数据。后文会解读,功能远不止于此......关于 Grok 过滤器插件,咱们之前有过两篇文章讲解:1、干货 | Logstash自定义正则表达式ETL实战2、干货 | Logstash Grok数据结构化ETL实战G...
2024-01-23 07:30:57 1102
原创 大白话讲清楚:什么是 Langchain 及其核心概念
在AI和机器学习领域,每天都有新技术和框架涌现。今天,我们来聊聊最近引起广泛关注的一个框架 —— Langchain。https://python.langchain.com/docs/get_started/introduction那么,Langchain到底是什么,它为什么这么受欢迎,以及它是如何工作的呢?别担心,我会用大白话帮你一步步弄明白!1、Langchain 简介想象一下,如果你能让聊...
2024-01-13 17:48:34 1063
原创 Openai Python 代码调用 Demo 级实现全步骤
1、 申请 API前置条件1:jie 码平台https://sms-activate.org/cn见上面的截图。截止:2024-01-09 chatgpt 注册只需要 google 账号就可以,不再需要接码。但是,API 申请必须需要接码平台。chatgpt API 平台地址:https://platform.openai.com/docs/overview申请 API 地址:https://pl...
2024-01-13 17:48:34 1101
原创 Langchain 与 Elasticsearch:创新数据检索的融合实战
1、简介在信息爆炸的时代,有效地检索和处理数据变得至关重要。Langchain 和 Elasticsearch 的结合,为我们提供了一个强大的工具,以更智能的方式进行数据检索和分析。作为一名拥有多年 Elasticsearch 实战经验的技术博主,我将在本文中详细介绍这两种技术的整合应用。2、LangChain 简介Langchain是一个旨在简化自然语言处理任务的库。它允许开发者轻松地集成和使用...
2024-01-13 17:48:34 1693
原创 Elasticsearch 8.X 如何依据 Nested 嵌套类型的某个字段进行排序?
1、问题来源这是来自社区的一个真实企业场景问题。https://elasticsearch.cn/question/13135如下所示, 希望在查出的结果后, 对结果进行后处理,对tags列表,根据depth进行排序。{"keyProperty":"22","name":"测试内容","_class":"com.xxxxxxxx.ElasticSearchContent","content...
2024-01-11 07:30:50 1316
原创 Elasticsearch 8.X 小技巧:使用存储脚本优化数据索引与转换过程
1、引言在 Elasticsearch 中,可以使用 Painless 脚本来实现一些非标准的处理结果。这些脚本可以直接嵌入到数据处理管道中,但为了使脚本与管道相互独立,还可以将脚本单独存储在 Elasticsearch 中,并在数据摄取管道(Ingest pipeline)中按需调用它们。这种存储脚本的方式,咱们之前也有过介绍,Elasticsearch 中有个专有术语名词与之对应,叫:stor...
2024-01-04 07:31:04 1179
原创 路在脚下——我的 2023 年终总结
写下这个题目的时候,我刚从外面跑步(有积雪,边走边跑)近 8 公里回来。一是寻找一下灵感,二是“排解”一下负能量。今年这个形势,实话说大家都挺不容易的。但是,正如本山大叔所说,“我们不是破坏大环境的人”,那只能自我想办法解决。于是乎,最早想的“都不容易”偏迷茫、负能量的题目,待我跑步回来也改成了“路在脚下”。今年一年唯一的感触就是快!回首一年时光,我想起了读到的汪国真的诗歌“过去”——“过去是什么...
2023-12-30 07:27:16 982
原创 Elasticsearch “指纹”去重机制,你实践中用到了吗?
0、实战问题老师有个问题想请教一下,我们项目中有个需求是查询出数据集根据某个字段去重后的全部结果,用 collapse 发现很多数据都没查询到,后面发现是去重的这个字段的值太长了,ignore _above默认的是256,而这个字段的值有的有十几万甚至几十万个字符,像这种情况,还有什么比较好的查询去重方法吗?——来自:死磕Elasticsearch知识星球https://t.zsxq.com/1...
2023-12-27 11:20:15 1029
原创 Elasticsearch 写入优化探索:是什么影响了refresh 耗时?
1、问题背景:数据写入后,refresh耗时过长,能达到1s-5s。想通过测试,探索确认影响refresh的因素,比如:写入操作是新增还是更新,deleted文档占比是否有影响,是否有其他索引配置,等等。2、测试过程全记录旧索引:24主分片,1副本,经过长期forcemerge,最大segmeng 33gb,镜像后deleted占比 8%左右。noforcemerge 索引:24主分片,1副本,r...
2023-12-22 11:25:39 1107
Windows下libevent C++封装类实现
2016-12-11
C++内部培训讲义
2016-08-07
libcurl.lib下载(32bit和64bit)
2015-09-17
MFC动态划线实现源码
2013-03-30
(可视化文件消息一体化收发Socket实现V0.1说明文档
2013-03-17
可视化文件消息一体化收发Socket实现V0.1
2013-03-17
Windows Sockets 规范及应用
2010-12-20
路由器交换机配置命令详解.doc
2010-04-18
C++ 笔试面试宝典2009版.doc
2010-04-18
? Kerberos认证相关问题思路请教:
2013-11-03
求samba下的rpcclient工具使用方法?
2013-09-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人