데이터 애널리스트 업무 이해하기

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Virtual Warehouse

도쿄뱅 2024. 10. 14. 08:47
반응형

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Virtual Warehouse


 

 

Snowflake에서 Virtual Warehouse데이터 처리 작업을 수행하는 컴퓨팅 리소스입니다. 이는 Snowflake에서 데이터를 읽고, 쓰고, 처리하는 모든 작업을 실행하는 데 사용되는 컴퓨팅 클러스터라고 할 수 있어요. 이 개념을 이해하기 쉽게 풀어서 설명해 볼게요.

1. Virtual Warehouse란 무엇인가요?

  • Virtual Warehouse는 Snowflake에서 데이터를 처리하고 쿼리를 실행하는 컴퓨팅 엔진이에요.
  • 가상 서버처럼 작동하지만, 실제 하드웨어 서버가 아니라 클라우드 기반의 가상 컴퓨팅 리소스로 구성돼요.
  • 스케일 업/다운자동 시작/중지 기능을 통해, 사용자가 원하는 성능과 비용 효율성을 맞출 수 있어요.

2. Virtual Warehouse의 역할

  • 쿼리 실행: 데이터를 읽고 쓰는 작업이나 복잡한 분석 쿼리를 처리해요.
  • 데이터 로딩: 외부에서 데이터를 로드하거나, Snowflake에서 데이터를 다른 시스템으로 내보낼 때 사용돼요.
  • 데이터 복제 및 백업: 데이터의 복제 작업이나 스냅샷 생성 등의 작업을 수행해요.
  • Snowflake에서는 스토리지(저장공간)와 컴퓨팅 리소스가 분리되어 있어요. 데이터는 항상 저장되어 있지만, 데이터를 처리할 때는 Virtual Warehouse가 필요해요.

3. Virtual Warehouse의 크기 조정

  • Snowflake의 Virtual Warehouse크기를 자유롭게 조정할 수 있어요. 이 크기 조정은 Snowflake에서 제공하는 T-shirt 사이즈 모델을 따라요.
    • 크기 예시: X-Small, Small, Medium, Large, X-Large 등으로 크기를 선택할 수 있어요.
    • 크기가 커질수록 처리 속도는 빨라지지만, 더 많은 컴퓨팅 비용이 발생해요.
    • 크기 조정은 수평적으로 확장(Scale Out)하는 방식으로, 더 큰 크기를 선택하면 병렬로 더 많은 작업을 처리할 수 있어요.
  • 예를 들어, Small 사이즈의 Virtual Warehouse는 X-Small보다 더 많은 컴퓨팅 파워를 제공해 복잡한 쿼리를 더 빨리 처리할 수 있어요.

4. 사용량에 따른 요금 책정

  • Virtual Warehouse는 사용 시간에 따라 요금이 책정돼요. Snowflake에서의 요금은 사용한 만큼만 지불하는 방식이에요.
    • Warehouse가 켜져 있는 시간 동안 크기에 따라 크레딧을 소모해요.
    • 사용이 끝나면 자동으로 Warehouse를 중지하도록 설정할 수 있어, 비용을 절약할 수 있어요.
    • 예를 들어, 10분 동안만 데이터를 처리하고 나머지 시간은 중지 상태라면, 실제 사용한 10분에 대해서만 비용이 청구돼요.

5. 스케일링(Scaling)

  • 자동 스케일링 기능을 통해 Virtual Warehouse의 인스턴스 수를 자동으로 늘리거나 줄일 수 있어요. 이는 다음 두 가지 방식으로 이루어져요:
    • 스케일 아웃(Scale-Out): 한 번에 더 많은 인스턴스를 추가해 병렬 처리를 통해 작업 속도를 높이는 방식이에요.
    • 스케일 업/다운: 필요에 따라 크기를 조정해 더 많은 리소스를 사용하거나 줄이는 방식이에요.
  • 이 기능은 데이터 처리 작업의 부하에 따라 유연하게 대응할 수 있도록 도와줘요. 예를 들어, 작업량이 많은 경우 자동으로 인스턴스를 늘려 처리 속도를 높이고, 작업량이 적어지면 다시 인스턴스를 줄여 비용을 절감할 수 있어요.

6. Virtual Warehouse와 스토리지의 차이점

  • Snowflake는 스토리지(데이터를 저장하는 공간)와 Virtual Warehouse(데이터를 처리하는 공간)를 분리해요.
    • 스토리지는 데이터를 항상 저장하고 있고, 사용자는 여기에 데이터를 저장하거나 관리할 수 있어요.
    • Virtual Warehouse는 데이터베이스 내에서 쿼리를 실행하거나 데이터를 분석할 때만 필요해요.
    • 비유하자면: 스토리지는 책장이 있는 도서관이고, Virtual Warehouse는 도서관에서 책을 찾아주고 읽어주는 사서라고 할 수 있어요. 책장은 항상 그대로 있지만, 사서는 필요할 때만 호출되어 일을 하고, 일이 끝나면 쉬게 할 수 있는 거죠.

7. 정리하자면:

  • Virtual Warehouse는 Snowflake에서 데이터를 처리하고 쿼리하는 역할을 맡은 컴퓨팅 리소스에요.
  • 유연한 크기 조정자동화된 시작/중지 기능을 통해 성능과 비용을 효과적으로 관리할 수 있어요.
  • 사용량 기반 과금 모델을 통해 필요한 만큼만 사용하고 비용을 줄일 수 있는 점이 Snowflake의 강점이에요.
  • 데이터는 항상 저장 공간에 저장되지만, 데이터를 실제로 다루는 역할은 Virtual Warehouse가 수행해요.

이렇게 Virtual Warehouse는 Snowflake에서 데이터를 효율적으로 처리하고 비용을 관리하는 데 핵심적인 역할을 해요. 이를 통해 기업들은 필요한 성능을 확보하면서도, 비용을 효율적으로 제어할 수 있답니다!

 


[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Virtual Warehouse

반응형