Python x 알고리즘 : 최단경로
2023. 8. 26. 19:52ㆍ[알고리즘]/Algorithm
🍃 최단경로(Shortest Path) 알고리즘
- 최단 경로 알고리즘은 말 그대로 가장 짧은 경로를 찾는 알고리즘이다. 이는 길 찾기 문제라고도 불린다.
- 최단 경로 유형에는 다양한 종류가 있는데, 상황에 맞는 효율적인 알고리즘이 이미 정립되어 있다
- 최단 경로 문제는 보통 그래프를 이용해 표현하는데 각 지점은 그래프에서 "노드"로 표현되고, 지점간 연결된 도로는 그래프에서 "간선"으로 표현된다.
- 실제 코딩 테스트에서는 최단 경로를 모두 출력하는 문제보다는 단순히 최단 거리를 출력하도록 요구하는 문제가 많이 출제된다.
- 다익스트라 최단 경로 알고리즘, 플로이드 워셜, 벨만 포드 알고리즘이 학부 수준의 알고리즘인데 이 세개 중 코딩테스트에서는 다익스트라 최단경로와 플로이드 워셜이 가장 많이 출제된다.
- 그리디 알고리즘과 다이나믹 프로그래밍 알고리즘이 최단 경로 알고리즘에 그대로 적용된다
🍃 다익스트라(Dijkstra) 최단 경로 알고리즘
- 다익스트라 최단 경로 알고리즘은 그래프에서 여러 개의 노드가 있을 때, 특정한 노드에서 출발하여 다른 노드로 가는 각각의 최단 경로를 구해주는 알고리즘이다.
- 다익스트라 알고리즘은 "음의 간선"이 없을 때 정상적으로 동작한다.
- 음의 간선이란 0보다 작은 값을 가지는 간선을 의미하는데, 현실 세계의 길(간선)은 음의 간선으로 표현되지 않으므로 다익스트라 알고리즘은 실제로 GPS 소프트웨어의 기본 알고리즘으로 채택되곤 한다.
- 다익스트라 최단 경로 알고리즘은 기본적으로 그리디 알고리즘으로 분류된다. 매번 "가장 비용이 적은 노드"를 선택해서 임의의 과정을 반복하기 때문이다.
다익스트라 알고리즘의 간단한 원리
- 출발 노드를 설정한다.
- 최단 거리 테이블을 초기화한다.
- 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택한다.
- 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신한다.
- 위 과정에서 3번과 4번을 반복한다.
- 다익스트라 알고리즘은 최단 경로를 구하는 과정에서 "각 노드에 대한 현재까지의 최단 거리" 정보를 항상 1차원 리스트(최단 거리 테이블)에 저장하며 리스트를 계속 갱신한다는 특징이 있다.
- 매번 현재 처리하고 있는 노드를 기준으로 주변 간선을 확인한다. 나중에 현재 처리하고 있는 노드와 인접한 노드로 도달하는 더 짧은 경로를 찾으면 "더 짧은 경로도 있었네? 이제부터는 이 경로가 제일 짧은 경로야" 라고 판단하는 것이다.
- 방문하지 않은 노드 중에서 현재 최단 거리가 가장 짧은 노드를 확인해 그 노드에 대하여 4번 과정을 수행한다는 점에서 그리디 알고리즘으로 볼 수 있다.
- 그렇기 때문에, 사실 마지막 노드에 대해서는 해당 노드를 거쳐 다른 노드로 가는 경우를 확인할 필요가 없다.익스트라 알고리즘이 진행되면서 한 단계당 하나의 노드에 대한 최단 거리를 확실히 찾는 것으로 이해할 수 있다.
🍃 다익스트라 알고리즘의 구현 방법
방법 1. 간단한 다익스트라 알고리즘
- 시간 복잡도 : O(v²) 여기서 v는 노드의 개수.
처음에 각 노드에 대한 최단 거리를 담는 1차원 리스트를 선언한다. 이후에 단계마다 "방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택"하기 위해 매 단계마다 1차원 리스트의 모든 원소를 확인(순차 탐색)한다.
- 다음 소스코드는 입력되는 데이터의 수가 많다는 가정 아래 input()보다 더 빠르게 동작하는 sys.std.realine() 으로 치환하여 사용하는 방법을 사용, 모든 리스트는 (노드의 개수 + 1)의 크기로 할당하여, 노드의 번호를 인덱스로 하여 바로 리스트에 접근할 수 있도록 했다.
import sys
input = sys.stdin.readline
INF = int(1e9) # 무한을 의미하는 값으로 10억을 설정
#노드의 개수, 간선의 개수를 입력받기
n, m = map(int, input().split())
#시작 노드 번호를 입력받기
start = int(input())
#각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for i in range(n + 1)]
#방문한 적이 있는지 체크하는 목적의 리스트 만들기
visted = [False] * (n + 1)
#최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n +1)
#모든 간선 정보를 입력받기
for _ in range(m):
a, b, c = map(int, input().split())
# a번 노드에서 b번 노드로 가는 비용이 c라는 의미
graph[a].append((b, c))
#방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
def get_smallest_node():
min_value = INF
index = 0 # 가장 최단 거리가 짧은 노드의 번호를 반환
for i in range(1, n + 1):
if distance[i] < min_value and not visted[i]:
min_value = distance[i]
index = i
return index
def dijkstra(strat):
#시작 노드에 대해서 초기화
distance[start] = 0
visted[start] = True
for j in graph[start]:
distance[j[0]] = j[1]
#시작 노드를 제외한 전체 n-1개의 노드에 대해 반복
for i in range(n - 1):
#현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
now = get_smallest_node()
visted[now] = True
#현재 노드와 연결된 다른 노드를 확인
for j in graph[now]:
cost = distance[now] + j[1]
#현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
if cost < distance[j[0]]:
distance[j[0]] = cost
dijkstra(start)
#모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n+1):
# 도달 할 수 없는 경우, 무한(INFINITY)이라고 출력
if distance[i] == INF:
print("INFINITY")
#도달할 수 있는 경우 거리를 출력
else:
print(distance[i])
간단한 다익스트라 알고리즘의 시간 복잡도
- O(v²)
- 총 O(v)번에 걸쳐서 최단 거리가 가장 짧은 노드를 매번 선형 탐색해야하고, 현재 노드와 연결된 노드를 매번 일일히 확인하기 때문이다.
- 따라서 코딩 테스트의 최단 경로 문제에서 전체 노드가 5,000개 이하라면 이 코드로 풀 수 있지만, 전체 노드가 10,000개가 넘어간다면 개선된 다익스트라 알고리즘을 이용해야한다.
방법 2. 개선된 다익스트라 알고리즘
- 개선된 다익스트라 알고리즘의 시간복잡도는 O(ElogV)를 보장한다.
- 간단한 다익스트라 알고리즘은 '최단거리가 가장 짧은 노드"를 찾기 위해서, 매번 최단 거리 테이블을 선형적으로(모든 원소를 앞에서부터 하나씩) 탐색해야 했다.
- 개선된 다익스트라 자료구조는 힙(Heap)자료구조를 사용한다. 힙 자료구조를 이용하게 되면 특정 노드까지의 최단 거리에 대한 정보를 힙에 담아서 처리하므로 출발 노드로부터 가장 거리가 짧은 노드를 더욱 빠르게 찾을 수 있다. 이 과정에서 선형 시간이 아닌 로그 시간이 걸린다.
힙 설명
- 힙 자료구조는 우선순위 큐(Priority queue)를 구현하기 위하여 사용하는 자료구조 중 하나다.
- 우선순위 큐는 우선순위가 가장 높은 데이터를 가장 먼저 삭제 한다는 특징을 가지고 있다.
- 이러한 우선순위 큐는 데이터를 우선순위에 따라 처리하고 싶을 때 사용한다.
- 파이썬은 우선순위 큐가 필요할 때 PriorityQueue 혹은 heapq를 사용할 수 있는데, 이 두 라이브러릴는 모두 우선순위 큐 기능을 지원한다.
- 다만 PriorityQueue 보다는 일반적으로 heapq가 더 빠르게 동작하기 때문에 수행 시간이 제한된 상황에서는 heapq를 사용하는 것을 권장한다.
- 우선순위 값을 표현할 때는 일반적으로 정수형 자료형의 변수가 사용된다. 데이터가 (가치, 물건)으로 구성된다면 "가치"값이 우선순위 값이 되는 것이다.
- 우선순위 큐를 구현할 때는 내부적으로 최소 힙 혹은 최대 힙을 이용한다.
- 최소 힙을 이용하는 경우 "값이 낮은 데이터가 먼저 삭제(가장 먼저 나감)", 최대 힙을 이용하는 경우 "값이 큰 데이터가 먼저 삭제"
- 파이썬에서는 기본적으로 최소 힙 구조를 이용하는데 다익스트라 알고리즘에서는 비용이 적은 노드를 우선하여 방문하므로 최소 힙 구조를 기반으로 하는 파이썬의 우선순위 큐 라이브러리를 그대로 사용하면 적합하다.
- 최소 힙을 최대 힙처럼 사용하기 위해서 일부러 우선순위에 해당하는 값에 음수 부호(-)를 붙여서 넣었다가, 나중에 우선순위 큐에서 꺼낸 다음에 다시 음수 부호(-)를 붙여서 원래의 값으로 돌리는 방식을 사용할 수 있다.
- 우선순위 큐를 이용해서 시작 노드로부터 "거리"가 짧은 노드 순서대로 큐에서 나올 수 있도록 다익스트라 알고리즘을 작성
- 최단 거리를 저장하기 위한 1차원 리스트(최단 거리 테이블)는 아까와 같이 그대로 이용하고, 현재 가장 가까운 노드를 저장하기 위한 목적으로만 우선순위 큐를 추가로 이용한다.
- 앞의 코드와 비교했을 때 get_smallest_node()라는 함수를 작성할 필요가 없다는 특징이 있다. "최단 거리가 가장 짧은 노드"를 선택하는 과정을 다익스트라 최단 경로 함수 안에서 우선순위 큐를 이용하는 방식으로 대체한다.
import heapq
import sys
input = sys.stdin.readline
INF = int(1e9) #무한을 의미하는 값으로 10억을 설정
#노드의 개수, 간선의 개수를 입력받기
n,m = map(int, input().split())
#시작 노드 번호를 입력받기
start = int(input())
#각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for i in range(n + 1)]
#최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n+1)
#모든 간선 정보를 입력받기
for _ in range(m):
a, b, c = map(int, input().split())
# a번 노드에서 b번 노드로 가는 비용이 c라는 의미
graph[a].append((b,c))
def dijkstra(start):
q = []
#시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
heapq.heappush(q, (0, start))
distance[start] = 0
while q: #이렇게 쓰는거 자체가 큐가 비어있지 않을때까지 반복을 돌게 해준다.
#가장 거리가 짧은 노드에 대한 정보 꺼내기
dist, now = heapq.heappop(q)
#현재 노드가 이미 처리된 적이 있는 노드라면 무시
if distance[now] < dist:
continue
#현재 노드와 연결된 다른 인접한 노드들을 확인
for i in graph[now]:
cost = dist + i[1]
#현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
if cost < distance[i[0]]:
distance[i[0]] = cost
heapq.heappush(q, (cost, i[0]))
#다익스트라 알고리즘
dijkstra(start)
#모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n+1):
#도달할 수 없는 경우, 무한(INFINITY)이라고 출력
if distance[i] == INF:
print("INFINITY")
else:
print(distance[i])
개선된 다익스트라 알고리즘의 시간 복잡도
- O(ElogV)
- 간단한 다익스트라 알고리즘에 비해 시간 복잡도가 훨씬 빠르다는 특징이 있다.
- 이는 한 번 처리된 노드는 더 이상 처리되지 않기 때문이다.노드를 하나씩 꺼내 검사하는 반복문(while문)은 노드의 개수 V 이상의 횟수로는 반복되지 않는다.
- 또한 V번 반복될 때마다 각각 자신과 연결된 간선들을 모두 확인한다. 따라서 현재 우선순위 큐에서 꺼낸 노드와 연결된 다른 노드들을 확인하는 총횟수는 총 최대 간선의 개수(E)만큼 연산이 수행될 수 있다.
🍃 플로이드 워셜 알고리즘
- 다익스트라 알고리즘은 "한 지점에서 다른 특정 지점까지의 최단 경로를 구해야 하는 경우"에 사용할 수 있는 최단 경로 알고리즘"이다.
플로이드 워셜 알고리즘은 모든 지점에서 다른 모든 지점까지의 최단 경로를 구해야 하는 경우 사용할 수 있는 알고리즘이다.
- 소스코드 또한 매우 짧아서 구현 과정에서 어려움이 덜 하다.
- 플로이드워셜 알고리즘 또한 단계마다 거쳐 가는 노드를 기준으로 알고리즘을 수행한다. 하지만 매번 방문하지 않은노드 중에서 최단 거리를 갖는 노드를 찾을 필요가 없다는 점이 다르다.
- 다익스트라는 1차원 리스트를 이용했지만, 플로이드 워셜 알고리즘은 2차원 리스트에 최단 거리 정보를 저장한다는 특징이 있다.
- 플로이드 워셜 알고리즘은 다이나믹 프로그래밍이라는 특징이 잇다. 노드의 갯수가 N이라고 할 때, N번 만큼의 단계를 반복하며 '점화식에 맞게' 2차원 리스트를 갱신하기 때문이다.
구체적인 점화식
Dab = min(Dab, Dak + Dkb)
INF = int(1e9) #무한을 의미하는 값으로 10억을 설정
#노드의 개수 및 간선의 개수를 입력받기
n = int(input())
m = int(input())
#2차원 리스트(그래프 표현)
graph = [[INF] * (n + 1) for _ in range(n + 1)]
#자기 자신에서 자기 자신으로 가는 비용은 0으로 초기화
for a in range(1, n + 1):
for b in range(1, n+1):
if a == b:
graph[a][b] = 0
#각 간선에 대한 정보를 입력받아, 그 값으로 초기화
for _ in range(m):
#A에서 B로 가는 비용은 C라고 설정
a, b, c = map(int, input().split())
graph[a][b] = c
#점화식에 따라 플로이드 워셜 알고리즘 수행
for k in range(1, n+1):
for a in range(n + 1):
for b in range(1, n+1):
graph[a][b] = min(graph[a][b], graph[a][k] + graph[k][b])
for a in range(1, n+1):
for b in range(1, n+1):
#도달 할 수 없는 경우, 무한이라고 출력
if graph[a][b] == INF:
print("무한", end=" ")
#도달할 수 있는 경우 거리를 출력
else:
print(graph[a][b], end="")
print()
플로이드 워셜 알고리즘의 시간 복잡도
- O(N³)
- 단계마다 O(N²)의 연산을 통해 현재 노드를 거쳐 가는 모든 경로를 고려한다.
반응형
'[알고리즘] > Algorithm' 카테고리의 다른 글
브루트 포스 알고리즘(aka.완전탐색) (0) | 2023.10.27 |
---|---|
Python x 알고리즘 : 그래프 이론 (0) | 2023.08.27 |
Python x 알고리즘 : 다이나믹 프로그래밍(동적 계획법) (0) | 2023.08.17 |
Python x 알고리즘 : 이진탐색 (0) | 2023.08.14 |
Python x 알고리즘 : 정렬 (0) | 2023.08.09 |