신장 트리
하나의 그래프가 있을 때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프
- 이때 모든 노드가 포함되어 서로 연결되면서 사이클이 존재하지 않는다는 조건은 트리의 성립 조건
크루스칼 알고리즘
- 가장 적은 비용으로 모든 노드 연결
- 그리디 알고리즘
최소 신장 트리 알고리즘 : 신장 트리 중에서 최소 비용으로 만들 수 있는 신장 트리 찾는 알고리즘
- 대표적으로 크루스칼 알고리즘
- ex) N개의 도시에서 전체 도시가 연결될 수 있게 도로 설치하는 경우
알고리즘 동작 원리
- 일종의 트리 자료구조 → 신장 트리에 포함되는 간선의 개수 '노드의 개수 - 1'
- 가장 거리가 짧은 간선부터 차례대로 집합에 추가
- 사이클 발생 간선은 제외하고 연결
→ 항상 최적해 보장
- 간선 데이터를 비용에 따라 오름차순으로 정렬
- 간선을 하나씩 확인하며 현재의 간선이 사이클을 발생시키는지 확인
1) 사이클이 발생하지 않는 경우 최소 신장 트리에 포함
2) 사이클이 발생하는 경우 최소 신장 트리에 포함시키지 않음 - 모든 간선에 대하여 2를 반복
0. 그래프의 간선 정보 정렬
1. 가장 짧은 간선 선택 → (3, 4) 집합에 포함
- 노드 3과 노드 4에 대하여 union 함수 수행, 동일한 집합에 속하도록 만듦
2. 다음 짧은 간선 선택 → (4, 7) 집합에 포함
- 노드 4와 노드 7에 대하여 union 함수 호출
3. 다음 짧은 간선 선택 → (4, 6) 집합에 포함
- 노드 4과 노드 6에 대하여 union 함수 호출
4. 다음 짧은 간선 선택 → (6, 7) 집합에 포함X
- 노드 6과 노드 7의 루트 노드 확인
- 이미 동일한 집합 → 신장 트리에 포함하지 않아야 함. union 함수 호출 x
- 신장 트리에 포함되지 않는 간선은 점섬으로 표시
5. 다음 짧은 간선 선택 → (1, 2) 집합에 포함
- 노드 1과 노드 2에 대하여 union 함수 호출
6. 다음 짧은 간선 선택 → (2, 6) 집합에 포함
- 노드 2과 노드 6에 대하여 union 함수 호출
7. 다음 짧은 간선 선택 → (2, 3) 집합에 포함X
- 노드 2과 노드 3의 루트 노드 확인
- 이미 동일한 집합 → 신장 트리에 포함하지 않아야 함. union 함수 호출 x
- 신장 트리에 포함되지 않는 간선은 점섬으로 표시
8. 다음 짧은 간선 선택 → (5, 6) 집합에 포함
- 노드 5과 노드 6에 대하여 union 함수 호출
9. 다음 짧은 간선 선택 → (1, 5) 집합에 포함X
- 노드 1과 노드 5의 루트 노드 확인
- 이미 동일한 집합 → 신장 트리에 포함하지 않아야 함. union 함수 호출 x
- 신장 트리에 포함되지 않는 간선은 점섬으로 표시
결과
- 최소 신장 트리에 포함되어 있는 간선의 비용 모두 더하면, 그 값이 최종 비용
- 위의 예시에서 총비용은 159
# 크루스칼 알고리즘 소스코드
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
# 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
if parent[x] != x:
parent[x] = find_parent(parent, parent[x])
return parent[x]
# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
a = find_parent(parent, a)
b = find_parent(parent, b)
if a < b:
parent[b] = a
else:
parent[a] = b
# 노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화
# 모든 간선을 담을 리스트와 최종 비용을 담을 변수
edges = []
result = 0
# 부모 테이블 상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
parent[i] = i
# 모든 간선에 대한 정보를 입력받기
for _ in range(e):
a, b, cost = map(int, input().split())
# 비용 순으로 정렬하기 위해서 튜플의 첫 번째 원소를 비용으로 설정
edges.append((cost, a, b))
# 간선을 비용순으로 정렬
edges.sort()
# 간선을 하나씩 확인하며
for edge in edges:
cost, a, b = edge
# 사이클이 발생하지 않는 경우에만 집합에 포함
if find_parent(parent, a) != find_parent(parent, b):
union_parent(parent, a, b)
result += cost
print(result)
해석
변수 : 노드 개수 V, 간선 개수 E, 부모 테이블 parent, 간선 리스트 edges, 최종 비용 result
함수 : 루트 노드 찾는 find_parent, 두 원소가 속한 집합 합치는 union_parent
* find_parent(부모 테이블 parent , 찾을 원소 x) : 최적화 ver, 루트 노드 찾음
ㄴ 루트 노드가 아니면 재귀적 호출 : (부모 노드 == 자기 자신) 이면 루트 노드
ㄴ return 루트 노드
* union_parent(부모 테이블 parent, 원소 a, 원소 b) : 두 원소가 속한 집합 합침
ㄴ a의 루트 노드 찾기 : find_parent
ㄴ b의 루트 노드 찾기 : find_parent
ㄴ 더 큰 루트 노드를 작은 루트 노드로 바꿈
1. 노드 개수 V, 간선 개수 E 입력받기
2. 부모 테이블 parent 초기화 : [0] * (v + 1)
3. 간선 리스트 edges, 최종 비용 result 초기화
4. 부모 테이블 parent 상에서 부모를 자기 자신으로 초기화
5. 간선 정보 입력받기 : edges.append((cost, a, b)) # 비용 순으로 정렬하고자, 첫 원소 비용 cost
6. 간선 edges 비용 순으로 정렬
-----------------------------------간선 개수만큼 반복문-----------------------------------
7. 사이클 판별 : find_parent
ㄴ a, b의 루트 노드가 달라 사이클 발생 X : union_parent & result += cost
--------------------------------------------------------------------------------------------------
크루스칼 알고리즘의 시간 복잡도
시간 복잡도 : O(ElogE) # 간선의 개수 E
알고리즘에서 시간이 가장 오래 걸리는 부분이 간선 정렬 (O(ElogE))
'Programming > 알고리즘 & 코테' 카테고리의 다른 글
[그래프 이론] 팀 결성 (실전문제, 이것이 코딩테스트다 with 파이썬) (1) | 2024.01.11 |
---|---|
[그래프 이론] 알고리즘 개념 : 위상 정렬 (1) | 2024.01.10 |
[그래프 이론] 알고리즘 개념 : 서로소 집합 (1) | 2024.01.10 |
[최단 경로] 전보 (실전문제, 이것이 코딩테스트다 with 파이썬) (1) | 2024.01.09 |
[최단 경로] 미래 도시 (실전문제, 이것이 코딩테스트다 with 파이썬) (1) | 2024.01.09 |