Similar Articles

How to create an SCD2 Table using MERGE INTO with Spark & Iceberg

https://www.startdataengineering.com/post/create-scd2-table-with-merge-into-with-spark-iceberg/

Domain: www.startdataengineering.com Added: 2025-08-13 Status: ✓ Success

www.startdataengineering.com

How to create an SCD2 Table using MERGE INTO with Spark & Iceberg - 1. Introduction - 2. MERGE INTO is used to UPDATE/DELETE/INSERT rows into a target table based on data in the source table - 3. SCD2...

Similar Articles (10 found)

https://www.startdataengineering.com/post/deliver-data-quickly-with-schema-evolution-and-adv-data-types/

www.startdataengineering.com 2025-08-13

www.startdataengineering.com

How to quickly deliver data to business users? #1. Adv Data types & Schema evolution - 1. Introduction - 2. Use Schema evolution & advanced data types...

🔍 View Similar Articles

https://www.startdataengineering.com/post/de_best_practices/

www.startdataengineering.com 2025-08-13

www.startdataengineering.com

Data Engineering Best Practices - #1. Data flow & Code - 1. Introduction - 2. Sample project - 3. Best practices - 3.1. Use standard patterns that pro...

🔍 View Similar Articles

https://www.startdataengineering.com/post/how-to-join-fact-scd2-tables/

www.startdataengineering.com 2025-08-13

www.startdataengineering.com

How to Join a fact and a type 2 dimension (SCD2) table - Introduction - What is an SCD2 table and why use it? - Setup - Joining fact and SCD2 tables -...

🔍 View Similar Articles

https://www.startdataengineering.com/post/how-to-manage-upstream-schema-changes-in-data-driven-fast-moving-company/

www.startdataengineering.com 2025-08-13

www.startdataengineering.com

How to Manage Upstream Schema Changes in Data Driven Fast Moving Company - 1. Introduction - 2.Strategies for data teams to handle changing schemas - ...

🔍 View Similar Articles

https://www.startdataengineering.com/post/data-engineering-project-e2e/

www.startdataengineering.com 2025-08-13

www.startdataengineering.com

End-to-end data engineering project - batch edition - Objective - Setup - Components - Choosing tools & frameworks - Future work & improvements - Conc...

🔍 View Similar Articles

🔍 60.2% similar

Change Data Capture, with Debezium

https://www.startdataengineering.com/post/change-data-capture-using-debezium-kafka-and-pg/

www.startdataengineering.com 2025-08-13

www.startdataengineering.com

Change Data Capture, with Debezium Introduction Change data capture is a pattern where every change to a row in a table is captured and sent to downst...

🔍 View Similar Articles

https://www.startdataengineering.com/post/data-modeling-join-groupby/

www.startdataengineering.com 2025-08-13

www.startdataengineering.com

Using Joins and Group Bys the right way for data warehousing - 1. Introduction - 2. Joins & Group bys are two of the most commonly used operations in ...

🔍 View Similar Articles

https://seattledataguy.substack.com/p/why-your-data-pipeline-probably-isnt

seattledataguy.substack.com 2025-08-13

seattledataguy.substack.com

You’ve done it! You’ve built your first data pipeline. Maybe you’re a junior data engineer. Maybe you’re a data analyst shipping your first pipeline i...

🔍 View Similar Articles

🔍 58.5% similar

Apache Iceberg Isn't Coming To Save You

https://seattledataguy.substack.com/p/apache-iceberg-isnt-coming-to-save

seattledataguy.substack.com 2025-08-13

seattledataguy.substack.com

Hi, fellow future and current Data Leaders; Ben here 👋 Today I wanted to talk about Iceberg. I’ve been seeing a lot about it recently. Everyone wants ...

🔍 View Similar Articles

https://www.startdataengineering.com/post/data-engineering-project-for-beginners-batch-edition/

www.startdataengineering.com 2025-08-13

www.startdataengineering.com

Data Engineering Project for Beginners - Batch edition - 1. Introduction - 2. Objective - 3. Run Data Pipeline - 4. Architecture - 5. Code walkthrough...

🔍 View Similar Articles 🟠 HN