自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(115)
  • 收藏
  • 关注

原创 基于Apache SeaTunnel构建CDC数据同步管道

Apache SeaTunnel是一个数据集成开发平台,其发展经历了几个重要阶段:ETL时代(90年代):面向结构化数据库的数据同步,用于构建数据仓库。MPP和分布式技术流行:使用技术如Hive进行数据仓库的构建。此阶段主要使用mapreduce程序进行数据搬运和转换。数据湖技术流行:重视数据集成,强调先同步数据至数据湖仓储,再进行业务面向的转换和设计。CDC,即变更数据捕获,是一种捕获数据库变更事件(如插入、更新、删除)的技术。

2023-12-19 12:08:21 1190

原创 数据同步工具调研选型:SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比

Apache SeaTunnel 是一个非常易用的超高性能分布式数据集成产品,支持海量数据的离线及实时同步。每天可稳定高效同步万亿级数据,已应用于数百家企业生产,也是首个由国人主导贡献到 Apache 基金会的数据集成顶级项目。SeaTunnel 主要解决数据集成领域的常见问题:数据源多样:常用的数据源有数百种,版本不兼容。随着新技术的出现,出现了更多的数据源。用户很难找到能够全面快速支持这些数据源的工具。复杂同步场景。

2023-11-14 10:54:43 3704 6

原创 SeaTunnel毕业!首个国人主导的数据集成项目成为Apache顶级项目

这是首个由国人主导并贡献到 ASF 的大数据集成领域的顶级项目,这一里程碑的达成标志着 SeaTunnel 在开源软件开发领域的突破,并为其在技术、社区合作和开放创新方面的卓越表现获得了广泛认可。

2023-06-01 14:54:13 3996

原创 Apache SeaTunnel 正式发布2.3.5版本,功能增强及多个Bug修复

经过两个月的筹备,我们在2.3.4版本基础上进行了新一轮的迭代,本次更新不仅修复了多个关键问题,还引入了若干重要功能增强和性能优化。

2024-05-07 18:42:20 94

原创 开源之夏 2024 学生报名通道现已正式开启!奖金都是12000元,冲啊!!!

开源之夏(英文简称 OSPP)”是中国科学院软件研究所“开源软件供应链点亮计划”指导下的系列暑期活动,由中国科学院软件研究所和华为技术有限公司共同主办、中科南京软件技术研究院承办,旨在鼓励在校学生积极参与开源软件的开发维护,培养和发掘更多优秀的开发者,促进优秀开源软件社区的蓬勃发展,助力开源软件供应链建设。在这里,不仅可以深度参与到真实项目的开发实践之中,你还可以与资深开发者导师交流互动,积累属于自己的开源人脉,在这里,你将提升技术水平与实践能力,学到课堂上未曾接触过的开源知识与管理协作技能。

2024-05-06 19:03:22 494

原创 Apache SeaTunnel k8s 集群模式 Zeta 引擎部署指南

SeaTunnel提供了一种运行Zeta引擎(cluster-mode)的方法,可以让Kubernetes在本地运行Zeta引擎,实现更高效的应用程序部署和管理。在本文中,我们将探索SeaTunnel k8s运行zeta引擎(cluster-mode模式)的更多信息,了解如何更好地利用Zeta引擎的优势。使用Reloader实现更新configmap后自动重启pod。将镜像load进k8s,这里用的minikube做演示。友情提示:不要用tab,用空格。创建configmap如下。

2024-04-30 11:53:41 1473

原创 【Demo 视频教程】使用SeaTunnel从MySQL同步到Doris

env {source{Jdbc {# 如果您想了解更多关于如何配置seatunnel和查看transform插件完整列表的信息,# 请访问 https://seatunnel.apache.org/docs/transform-v2/sqlsink {Console {}

2024-04-25 13:02:44 1003 2

原创 探索在Apache SeaTunnel上使用Hudi连接器,高效管理大数据的技术

Apache Hudi是一个数据湖处理框架,通过提供简单的方式来进行数据的插入、更新和删除操作,Hudi能够帮助数据工程师和科学家更高效地处理大数据,并支持实时查询。

2024-04-24 17:26:55 945 3

原创 内容搬迁至 SegmentFault #181e27

1。

2024-04-23 18:08:58 119

原创 手把手教你掌握SeaTunnel k8s运行Zeta引擎本地模式的技巧

转载自小虾米0.0导读:随着Kubernetes的普及和发展,越来越多的企业和团队开始使用Kubernetes来管理和部署应用程序。然而,Kubernetes的默认工作方式可能不是最佳的选择,尤其是在需要更高效、更可靠的应用程序部署和管理能力时。因此,SeaTunnel提供了一种运行Zeta引擎(local-mode模式)的方法,可以让Kubernetes在本地运行Zeta引擎,实现更高效的应用程序部署和管理。

2024-04-23 18:03:23 695

原创 【用户投稿】Apache SeaTunnel 2.3.3+Web 1.0.0版本安装部署

在部署 Apache SeaTunnel 时,通常需要先安装并配置好核心引擎,然后根据需要选择是否使用 Web 界面进行管理。对于自动下载下来的jar包,已经全部打包上传到CSDN,大家可以免费下载,直接放到connectors/seatunnel。代表了 Apache SeaTunnel Web 界面的安装包和 Apache SeaTunnel 的核心引擎的安装包。自动安装插件(全量安装,速度比较慢,一直到下班,一个半小时都没结束,第二天早上来显示下载结束)选择的Mysql作为元数据库,对应的驱动包。

2024-04-23 10:19:31 1110

原创 SeaTunnel JDBC DB2 Sink Connector支持的工作原理,快来学习吧!

DB2是IBM的一款关系型数据库管理系统,JDBC DB2 Source Connector是一个用于通过JDBC读取外部数据源数据的连接器。Apache SeaTunnel如何支持JDBC DB2 Sink Connector?请参考本文档。

2024-04-19 16:16:37 345

原创 Apache SeaTunnel社区成功入选开源之夏活动,现开启导师招募!

随着开源文化在全球范围内的蓬勃发展,Apache SeaTunnel社区也在不断探索如何更有效地参与并贡献于这一伟大的事业中。最近我们收到了一个好消息,Apache SeaTunnel社区已成功入选参加由中国科学院软件研究所“开源软件供应链点亮计划”发起的“”活动。这是一个旨在鼓励在校学生积极参与开源软件开发维护,培养和发掘更多优秀开发者的国际性暑期活动。

2024-04-18 10:47:19 633

原创 【第3期】PMC对话标杆用户:兆原数通在SeaTunnel的应用实践

在本次对话中,他将分享他和他的团队如何在兆原数通成功实施SeaTunnel,以及这一过程中遇到的挑战和解决方案。我们希望通过这次活动,您不仅可以解决在使用Apache SeaTunnel中遇到的问题,更可以深入理解开源社区的协作精神,共同推动Apache SeaTunnel的未来发展。让我们一起深度探讨Apache SeaTunnel的应用实践,共同解决问题,共建更强大的开源社区!这个活动旨在建立一个开放的平台,让用户、开发者和PMC成员能够相互交流,分享各自的经验和故事,一起找到更好的解决方案。

2024-04-17 17:57:17 335

原创 【安装部署】Apache SeaTunnel 和 Web快速安装详解

Apache SeaTunnel里面的Connector对应的jar包需要自己下载,在执行自动下载jar包前,进入apache-seatunnel-2.3.3,查看vim bin/install-plugin.sh内容,主要内容就是下载jar包,默认是从mvvm下载,下载速度太慢,我这边安装了maven,并且配置了阿里云仓库,因此可以直接将下图中命令替换,从maven中下载,这个文件夹下,由于我Mysql是使用Docker安装,在宿主机无法执行命令,因此无法直接在服务器端安装,所以我将。

2024-04-16 12:49:54 762

原创 【安装部署】Apache SeaTunnel 和 Web快速安装详解

Apache SeaTunnel里面的Connector对应的jar包需要自己下载,在执行自动下载jar包前,进入apache-seatunnel-2.3.3,查看vim bin/install-plugin.sh内容,主要内容就是下载jar包,默认是从mvvm下载,下载速度太慢,我这边安装了maven,并且配置了阿里云仓库,因此可以直接将下图中命令替换,从maven中下载,这个文件夹下,由于我Mysql是使用Docker安装,在宿主机无法执行命令,因此无法直接在服务器端安装,所以我将。

2024-04-16 12:48:40 824

原创 【安装部署】Apache SeaTunnel 和 Web快速安装详解

Apache SeaTunnel里面的Connector对应的jar包需要自己下载,在执行自动下载jar包前,进入apache-seatunnel-2.3.3,查看vim bin/install-plugin.sh内容,主要内容就是下载jar包,默认是从mvvm下载,下载速度太慢,我这边安装了maven,并且配置了阿里云仓库,因此可以直接将下图中命令替换,从maven中下载,这个文件夹下,由于我Mysql是使用Docker安装,在宿主机无法执行命令,因此无法直接在服务器端安装,所以我将。

2024-04-16 12:46:46 826

原创 【安装部署】Apache SeaTunnel 和 Web快速安装详解

Apache SeaTunnel里面的Connector对应的jar包需要自己下载,在执行自动下载jar包前,进入apache-seatunnel-2.3.3,查看vim bin/install-plugin.sh内容,主要内容就是下载jar包,默认是从mvvm下载,下载速度太慢,我这边安装了maven,并且配置了阿里云仓库,因此可以直接将下图中命令替换,从maven中下载,这个文件夹下,由于我Mysql是使用Docker安装,在宿主机无法执行命令,因此无法直接在服务器端安装,所以我将。

2024-04-16 12:42:59 805

原创 【安装部署】Apache SeaTunnel 和 Web快速安装详解

版本说明由于作者目前接触当前最新版本为2.3.4 但是官方提供的web版本未1.0.0,不兼容2.3.4,因此这里仍然使用2.3.3版本。可以自定义兼容处理,官方提供了文档:https://mp.weixin.qq.com/s/Al1VmBoOKu2P02sBOTB6DQ因为大部分用户使用SeaTunnel Web都是基于SeaTunnel-2.3.3 版本做的适配,而最新发布的SeaTunnel2.3.4部分API发生了改动导致直接升级的过程中会出现API不兼容的问题,所以本篇文章重点来了:我们需要

2024-04-16 12:39:20 828

原创 【安装部署】Apache SeaTunnel 和 Web快速安装详解

Apache SeaTunnel里面的Connector对应的jar包需要自己下载,在执行自动下载jar包前,进入apache-seatunnel-2.3.3,查看vim bin/install-plugin.sh内容,主要内容就是下载jar包,默认是从mvvm下载,下载速度太慢,我这边安装了maven,并且配置了阿里云仓库,因此可以直接将下图中命令替换,从maven中下载,这个文件夹下,由于我Mysql是使用Docker安装,在宿主机无法执行命令,因此无法直接在服务器端安装,所以我将。

2024-04-16 12:38:39 660

原创 Apache SeaTunnel 社区 3 月月报

各位热爱 SeaTunnel 的小伙伴们,SeaTunnel 社区 3 月月报来啦!这里将记录 SeaTunnel 社区每个月的重要更新,并评选出月度之星,欢迎关注。

2024-04-11 17:20:04 527

原创 【科普小文】3分钟搞懂 Apache SeaTunnel CDC 数据同步

CDC(Change Data Capture)是一种用于跟踪数据库库变更事件(插入、更新、删除)中的行级更改,并将事件以发生的顺序通知到其他系统处理。在容灾场景下,CDC主要实现的是主备间的数据同步,即从主数据库到备数据库的数据实时同步。

2024-04-08 17:37:25 1020

原创 从第三方数据集成工具迁移到Apache SeaTunnel的实操经验分享

在数据集成工具迁移到Apache SeaTunnel的过程中,我们注重全面细节对比,如字段类型和特殊字符处理等,实施了严格的灰度发布方案、陪跑方案和主备切换方案,以确保数据的时效性、准确性和业务连续性。总的来看,这次的迁移充分考虑了各种可能的挑战和风险,并且在实施过程中做出了相应的应对措施,体现了数据集成工具迁移的严谨性。本文由白鲸开源科技提供发布支持!

2024-04-02 09:24:27 1411

原创 # Apache SeaTunnel 究竟是什么?

Apache SeaTunnel的项目介绍是“一个高性能的、分布式的、大规模数据集成工具,提供了异构数据集成和数据同步的一体化解决方案。源连接器转换连接器目标连接器许多源连接器(Connector)可供选择;在版本2.3.3中,可用的连接器如链接所示。它支持包括关系型、NoSQL和图形等格式,以及分布式文件系统(如HDFS)和对象存储(如S3)等。如果源和目标之间的格式不同,则转换连接器(Transform Tonnector)会发挥作用,实质上它就是对数据进行映射。

2024-03-29 10:24:52 927

原创 为什么做定制救不了软件 SaaS 公司

作者 | 郭大侠转载自郭大侠说开源去年春节和不少创业的朋友聚会,大家都感觉到去年的冬天有点“冷”,ToB创业的兄弟们,都在为资本寒冬发愁。的确,2020年,2021年大量的资本催生了很多新一代的软件创业公司,我所认识的数据圈有经验、有能力的人几乎都出来创业了,而从2022年资本冷却,到2023年资本寒冬,放眼2024年只会更冷,这些当年“为梦想而窒息”的创业者,第一次经历经济浪潮的洗礼,所有的创业者(包括拿到大融资、小融资的)都在考虑如何保证现金流和Break Even的问题。

2024-03-28 11:16:44 384

原创 【保姆级教程】使用SeaTunnel同步Kafka的数据到ClickHouse

从2.2.0-beta开始,二进制包默认不提供Connectors的依赖,因此在第一次使用它时,需要执行以下命令来安装连接器。附件是Apache SeaTunnel2.3.3版本的完整目录,包含MySQL、clickhouse的连接驱动和配置文件,包括。在数据同步过程中,确保目标表和源表都存在,并且源表内有数据是非常重要的,这样才能够在执行同步命令后在目标表中看到同步效果。的配置、脚本选择(Flink版本不同,启动脚本不同),确保Flink的。文件,是配置Flink或者Spark环境变量的文件需要配置。

2024-03-27 15:37:49 621

原创 5分钟教你使用idea调试SeaTunnel自定义插件

在用Apache SeaTunnel研发组件过程中,发现社区关于本地调试SeaTunnel文章过于简单,很多情况没有说明,于是根据自己遇到问题总结这篇文档。,希望对大家有所帮助!使用的引擎为(不需要下载,SeaTunnel中有加载依赖),输入输出方式为:mysql to mysql。

2024-03-22 10:51:59 808

原创 白鲸开源架构师获邀成为 ASF Member

近日,在 Apache 软件基金会(下称 ASF )举行的一年一度的成员会议上,白鲸开源架构师,Apache SeaTunnel PMC 高俊 获邀成为 ASF Member。自运作以来,在高俊等白鲸开源技术人员与社区运营人员的支持下,Apache SeaTunnel 项目获得了快速发展,于 2023 年毕业成为 Apache 基金会顶级项目,围绕着项目的开源社区也加速成长起来,获得了越来越多用户和开源者的拥护。

2024-03-20 10:45:39 672

原创 Apache SeaTunnel MongoDB CDC 使用指南

随着数据驱动决策的重要性日益凸显,实时数据处理成为企业竞争力的关键。(Change Data Capture) 源连接器的推出,为开发者提供了一个高效、灵活的工具,以实现对 MongoDB 数据库变更的实时捕获和处理。本文将深入探讨该连接器的主要特性、支持的数据源信息、配置选项以及如何创建数据同步作业,助力开发者更好地利用 SeaTunnel 进行数据集成和实时数据分析。这些更新旨在为开发者提供更为丰富的数据处理能力,帮助他们更有效地捕获和处理来自 MongoDB 的变更数据。

2024-03-13 13:07:19 1177

原创 【源码编译】Apache SeaTunnel-Web 适配最新2.3.4版本教程

Apache SeaTunnel新版本已经发布,感兴趣的小伙伴可以看之前版本发布的文章本文主要给大家介绍为使用2.3.4版本的新特性,需要对Apache SeaTunnel-Web依赖的版本进行升级,而SeaTunnel2.3.4版本部分API跟之前,所以需要对 SeaTunnel-Web的适配。

2024-03-12 11:34:13 1428 1

原创 Apache SeaTunnel社区发布最新Roadmap:定义数据集成未来

随着春节假期的结束,我们迎来了充满希望的龙年,开源社区也呈现出一片繁荣的景象。今天,我们激动地宣布Apache SeaTunnel社区最新Roadmap现已公开!在不断追求创新和卓越的道路上,我们致力于将SeaTunnel打造成为数据集成领域的领导者。本次更新的路线图着重于增强Apache SeaTunnel的核心功能、扩展连接器生态系统、优化数据处理能力和提升用户体验。欢迎大家一起来共建!

2024-03-11 16:37:11 343

原创 Apache SeaTunnel 2.3.4 版本发布:功能升级,性能提升

​Apache SeaTunnel团队自豪地宣布2.3.4版本正式发布!本次更新聚焦于增强核心功能,改善用户体验,并进一步优化文档质量。此次版本发布带来了多项重要更新和功能增强,包括核心与API的修复、文档的全面优化、Catalog支持的引入,以及多表同步的实现等,旨在为开发者提供更加强大和便捷的数据处理能力。

2024-03-04 14:18:06 1288

原创 Apache Doris Sink Connector部署指南

在当今数据驱动的时代,如何高效、准确地处理和分析大数据成为了各行各业面临的共同挑战。Apache Doris,作为一个基于 MPP 架构的高性能、实时的分析型数据库,为大规模数据分析提供了强大的支持。在当今数据驱动的时代,如何高效、准确地处理和分析大数据成为了各行各业面临的共同挑战。Apache Doris,作为一个基于 MPP 架构的高性能、实时的分析型数据库,为大规模数据分析提供了强大的支持。

2024-02-29 16:51:41 682

原创 Apache SeaTunnel 及 Web 功能部署指南(小白版)

在大数据处理领域,Apache SeaTunnel 已成为一款备受青睐的开源数据集成平台,它不仅可以基于Apache Spark和Flink,而且还有社区单独开发专属数据集成的Zeta引擎,提供了强大的数据处理能力。随着SeaTunnel Web的推出,用户界面(UI)操作变得更加友好,项目部署和管理更加便捷。本指南旨在提供一个简明扼要的步骤,帮助用户成功部署SeaTunnel及其Web界面。小主已经把可能遇到的坑都填过了,希望大家都能安安稳稳上路,不掉坑,话不多说,走起~

2024-02-28 15:41:00 621

原创 Apache SeaTunnel 及 Web 功能部署指南(小白版)

在大数据处理领域,Apache SeaTunnel 已成为一款备受青睐的开源数据集成平台,它不仅可以基于Apache Spark和Flink,而且还有社区单独开发专属数据集成的Zeta引擎,提供了强大的数据处理能力。随着SeaTunnel Web的推出,用户界面(UI)操作变得更加友好,项目部署和管理更加便捷。本指南旨在提供一个简明扼要的步骤,帮助用户成功部署SeaTunnel及其Web界面。小主已经把可能遇到的坑都填过了,希望大家都能安安稳稳上路,不掉坑,话不多说,走起~

2024-02-28 15:22:07 577

原创 众安保险基于Apache SeaTunnel的生产应用实践

众安保险从2023年4月就开始了数据集成服务的预研工作,意在通过该服务解决当前数据同步场景下的两大痛点,服务化能力薄弱和无分布式同步能力。我们对多种开源数据同步中间件的调研和性能测试,最终选择Apache SeaTunnel 及其新的Zeta引擎,进行服务化包装。2023年10月,我们 基于2.3.3版本,开始进行二次开发。主要是完善服务化接口、适配连接器特性相关工作。

2024-02-22 15:32:12 746

原创 Apache SeaTunnel本地源码构建编译运行调试

这里我们添加的是两个mysql-jdbc的数据源,这里采用任务类型是“数据集成”,mysql的单表同步到mysql的单表将seatunnel库中的表role表同步到seatunnel_copy数据库中的role表中,seatunnel_copy数据库中的role表的结构和seatunnel库中的表role表结构一模一样任务的source和sink的数据源如果不可以选,说明是lib下没有数据源相关的jar,需要放入指定的jar重启项目才可以选数据源source配置如下:第一。

2024-02-20 12:48:45 1656

原创 【干货】解决CentOS 7.x上安装与部署SeaTunnel Web时遇到的问题

本次分享就到此结束了,踩了一些坑,还是请教了官方的大佬才知道的是哪里有问题,希望我的分享对你有所帮助,请一键三连,么么么哒!本文由白鲸开源科技提供发布支持!

2024-01-30 15:38:56 1173 2

原创 Apache SeaTunnel 数据集成插件开发最新经验总结!

在Apache SeaTunnel的最新插件开发中,connector-v2 maxcompute 连接器实现了基于CatalogTable + SaveMode的新版本。本文主要给大家分享了源端的关键改动包括弃用了过时的方法,改为通过CatalogTable实现数据传递。汇端则增加了对multi-table sink和saveMode接口的实现,并需手动管理auto service注解等此外,开发了特定的catalog以处理公共参数和客户端操作。

2024-01-25 10:06:12 1269

原创 Apache SeaTunnel社区荣获“2023快速成长开源项目”奖项

在这个开源理念推动技术创新和全球协同发展的时代,SeaTunnel社区在开放原子开源基金会举办的2023年开源项目评选中脱颖而出,荣获“2023快速成长开源项目”殊荣。这个奖项不仅仅是对Apache SeaTunnel社区过去一年发展速度和质量的认可,更是对社区管理、开源合规管理、社区运营能力的高度评价。我们的社区始终坚持开放、平等、协作、共享的开源精神,正是这四大支柱构建了Apache SeaTunnel社区坚实的基础,并推动我们在技术革新的路上不断前进。

2024-01-24 18:26:21 420

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除