[기술면접] DB | Nested Loop, Sort-Merge, Hash Join

JOIN연산 SQL명령문에 의해 여러 테이블에 저장된 데이터를 한 번에 조회할 수 있게 해주는 DBMS의 기능

Nested-Loop Join

2개 이상의 테이블에서 하나의 집합을 기준으로 다른 row를 조합하는 방식

선행 테이블의 row를 하나씩 액세스하여 연결된 값을 조인한다

⭐️특징 :

📌주의 :

Sort-Merge Join

join의 대상 범위가 넓을 경우에 random access를 줄이기 위한 경우, 연결고리로 사용할 마땅한 index가 없을때 해결하기 위한 방안

양쪽 테이블의 처리 범위를 각각 access, 정렬한 결과를 차례로 scan하여 조건(=연결고리)으로 merge함

⭐️특징 :

📌주의 :

Hash Join

해싱 함수를 활용하여 조인을 수행함. 해싱함수는 연결될 대상을 특정지역(partition)에 모아두는 역할을 수행함

Sort-Merge Join은 sort부하가 많이 발생하는데, 이를 보완하기위해 해시값을 사용하는 것임

⭐️특징 :

대용량 처리의 선결조건인 random access와 sort 부담을 해결하는 대안!
대용량 데이터를 처리하기 위한 최적의 방법임(parallel processing으로 hash join)
2개의 조인 테이블 중 small rowset(더 작은 데이터셋)을 가지고 해시를 위한 영역(Hash-area-Size)에 지정된 매모리 내에서 hash table을 생성함
CPU성능에 의존적임
hash table 생성 후에는 Nested-Loop처럼 순차적인 처리 형태로 수행됨

📌주의 :

참고 :

[기술면접] DB \| 데이터베이스 정규화 (0)	2023.09.10
[기술면접] DB 문답 \| index 상세 (0)	2023.09.05
[기술면접] DB 문답 \| Transaction의 Lock, Index (0)	2023.09.04
[기술면접] DB 문답 \| Transaction + SQL언어 (0)	2023.09.01
[기술면접] DB문답 \| SQL JOIN, RDB vs NoSQL (0)	2023.08.29

개발 도전기