데이터 레이크를 구축하고 나서 이런 말을 들어본 적 있을 것이다. "S3에 데이터는 쌓이는데, Redshift에 올리기 전까지는 분석을 못 해요." 데이터는 있는데 쓸 수 없는 상황, 혹은 데이터를 복사해야만 질의가 가능한 상황. 이 문제를 해결하기 위해 등장한 구조가 Lakehouse다.요약Lakehouse는 데이터 레이크의 저장 규모와 데이터 웨어하우스의 질의 성능을 하나의 아키텍처에서 구현하는 데이터 플랫폼 패러다임이다. 2021년 Databricks가 이 개념을 체계화한 이후, AWS와 Azure 모두 공식적으로 Lakehouse 아키텍처를 자사 플랫폼의 기반 개념으로 채택했다. 이 글에서는 왜 Lakehouse가 현재 데이터 플랫폼의 기본 구조로 자리잡았는지, 실무 관점에서 어떤 계층으로 구성되..
AI
2026. 6. 19. 15:22
반응형
최근에 올라온 글
- Total
- Today
- Yesterday
