Press "Enter" to skip to content

现代数据仓库

尖端数据平台设计

Photo by Nubelson Fernandes on Unsplash

在这篇文章中,我将尽量解释现代数据仓库解决方案(DWH)与其他数据平台架构类型相比的优势。我敢说,DWH是目前数据工程师中最流行的平台。与其他解决方案相比,它提供无可估量的好处,但也有一些众所周知的限制。想要学习数据工程吗?这篇文章是一个很好的起点,因为它解释了核心的数据工程 – 架构图中心的DWH解决方案。我们将看到数据如何在市场上的不同DWH中被摄取和转换。我也希望与有经验的用户展开讨论。很想听取您的意见,看看您对这个话题有什么看法。

数据仓库的关键特征

我们称之为现代数据仓库(DWH)的是一个无服务器、分布式SQL引擎(BigQuery、Snowflake、Redshift、Microsoft Azure Synapse、Teradata)。这是一个以SQL为首选数据架构[1],其中数据存储在数据仓库中,我们可以利用使用去规范化的星型模式[2]数据集的所有优势,因为大多数现代数据仓库都是分布式和可伸缩的,这意味着无需担心表键和索引。它非常适合对大数据进行特定分析查询。

数据平台架构类型

它对您的业务需求的回答有多好?选择的困境。

towardsdatascience.com

大多数现代数据仓库解决方案可以处理结构化和非结构化数据,并非常适用于具备良好SQL技能的数据分析师。

DWH数据生命周期。作者提供的图片。

现代数据仓库很容易与商业智能解决方案如Looker、Tableau、Sisense和Mode集成,这些解决方案使用ANSI-SQL来处理数据。在下面的图表中,我试图绘制一条常见的数据转换路径以及所使用的工具(当然不是完整列表)。我们可以看到…

Leave a Reply

Your email address will not be published. Required fields are marked *