반응형

2024/10 42

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Clustering Depth

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Clustering Depth**Snowflake에서 "Clustering Depth"**는 클러스터링된 테이블의 데이터 정렬 상태를 나타내는 지표예요. 데이터가 얼마나 잘 정렬되어 있는지를 파악하는 데 도움이 되며, 클러스터링의 효율성을 평가하는 데 사용됩니다. 쉽게 설명해볼게요!1. Clustering Depth란?Clustering Depth는 테이블의 데이터를 클러스터링 키를 기준으로 정렬된 상태를 나타내는 평균값이에요.이 지표는 특정 클러스터링 키를 기준으로 데이터가 얼마나 고르게 분포되어 있는지를 알려줘요.숫자가 작을수록 데이터가 잘 정렬되어 있고, 숫자가 클수록 데이터가 잘 정렬되지 않았음을 의미해요.2. ..

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Clustering

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Clustering **Snowflake에서 "Clustering"**은 테이블 데이터를 효율적으로 정렬해 쿼리 성능을 향상시키는 방법이에요. 특히, 대규모 테이블에서 특정 열을 기준으로 데이터를 자주 조회하거나 필터링할 때, 클러스터링을 통해 쿼리 성능을 크게 향상시킬 수 있어요. 쉽게 설명해볼게요!1. Clustering이란?Clustering은 테이블 데이터를 특정 기준에 따라 정렬하는 것을 의미해요.Snowflake에서는 **클러스터링 키(Clustering Key)**를 설정해, 데이터가 지정된 열 기준으로 정렬되도록 관리해요.이 정렬된 데이터를 이용하면, 필터링(WHERE 절)이나 범위 기반 검색(BETWEE..

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Materialized Views(물리적 뷰)

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Materialized Views(물리적 뷰)  **Snowflake에서 "Materialized Views(물리적 뷰)"**는 기존 테이블에서 계산된 결과를 미리 저장해 두는 테이블과 유사한 객체예요. 이렇게 저장된 데이터를 이용하면 반복적인 쿼리를 빠르게 처리할 수 있어요. 일반 뷰와 달리, Materialized Views는 쿼리 결과를 실제로 저장해서 성능을 높이는 데 중점을 둡니다. 쉽게 설명해볼게요!1. Materialized Views란?**Materialized Views(물리적 뷰)**는 기존 테이블에서 특정 데이터를 미리 계산하고, 그 결과를 저장해두는 객체예요.일반적으로 뷰는 실시간으로 데이터를 가져..

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Caching

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Caching  **Snowflake에서 "Caching"**은 데이터나 쿼리 결과를 임시로 저장해두고, 같은 요청이 있을 때 빠르게 제공하는 기능이에요. 이를 통해 반복적인 쿼리나 자주 사용하는 데이터에 접근할 때 처리 시간을 줄여 성능을 향상시킬 수 있어요. 쉽게 설명해볼게요!1. Caching이란?**Caching(캐싱)**은 이전에 처리된 데이터나 쿼리 결과를 저장해 두는 것을 의미해요.Snowflake에서는 캐시를 사용해서 같은 데이터를 반복적으로 요청할 때 이미 저장해 둔 데이터를 다시 가져와 빠르게 제공해요.캐시된 데이터를 사용하면 다시 계산하거나 처리할 필요가 없어 시간이 절약되고, 쿼리 처리 속도가 빨라..

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Spilling to Disk

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Spilling to Disk **Snowflake에서 "Spilling to Disk"**는 메모리에서 작업을 수행할 수 없을 때 데이터를 디스크에 임시로 저장하여 처리하는 과정을 말해요. 이는 Snowflake의 Virtual Warehouse가 메모리나 캐시에서 작업을 수행하기엔 데이터가 너무 많거나, 리소스가 부족할 때 발생하는 일이에요. 쉽게 설명해볼게요!1. Spilling to Disk란?Spilling to Disk는 Virtual Warehouse가 메모리에서 처리할 수 없는 데이터 양을 디스크에 임시로 저장해 처리하는 것을 말해요.Snowflake는 기본적으로 메모리 내에서 데이터를 처리하려고 하지만,..

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_스케일링 아웃(Scaling Out)과 스케일링 인(Scaling In)

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_스케일링 아웃(Scaling Out)과 스케일링 인(Scaling In)   **Snowflake에서 스케일링 아웃(Scaling Out)**과 **스케일링 인(Scaling In)**은 컴퓨팅 리소스를 확장하거나 축소하는 방법을 의미해요. Snowflake의 Virtual Warehouse가 데이터를 처리할 때 부하(작업량)에 따라 더 많은 리소스를 추가하거나 줄이는 방식을 가리키죠. 이 두 가지 개념의 차이를 이해하기 쉽게 설명할게요.1. Scaling Out (스케일 아웃)스케일 아웃은 작업을 동시에 처리할 수 있는 인스턴스(노드) 수를 늘리는 것이에요.Snowflake에서는 Virtual Warehouse를 수평..

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Virtual Warehouse

[SNOWFLAKE/스노우플레이크 공부] Pro 자격증 준비에 필요한 토막 지식 정리_Virtual Warehouse  Snowflake에서 Virtual Warehouse는 데이터 처리 작업을 수행하는 컴퓨팅 리소스입니다. 이는 Snowflake에서 데이터를 읽고, 쓰고, 처리하는 모든 작업을 실행하는 데 사용되는 컴퓨팅 클러스터라고 할 수 있어요. 이 개념을 이해하기 쉽게 풀어서 설명해 볼게요.1. Virtual Warehouse란 무엇인가요?Virtual Warehouse는 Snowflake에서 데이터를 처리하고 쿼리를 실행하는 컴퓨팅 엔진이에요.가상 서버처럼 작동하지만, 실제 하드웨어 서버가 아니라 클라우드 기반의 가상 컴퓨팅 리소스로 구성돼요.스케일 업/다운 및 자동 시작/중지 기능을 통해, 사..

반응형