Python x 알고리즘 : 이진탐색

2023. 8. 14. 11:36[알고리즘]/Algorithm

🍃 순차 탐색

  • 순차 탐색이란, 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법이다.
  • 보통 정렬되지 않은 리스트에서 데이터를 찾아야 할 때 사용한다.
  • 리스트 내에 데이터가 아무리 많아도 시간만 충분하다면 항상 원하는 데이터를 찾을 수 있다는 장점이 있다.

순차 탐색 소스

def sequential_search(n, target, array):
    # 각 원소를 하나씩 확인하며
    for i in range(n):
        # 현재의 원소가 찾고자 하는 원소와 동일한 경우
        if array[i] == target:
            return i+1

print("생성할 원소 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요.")
input_data = input().split()
n = int(input_data[0]) # 원소의 개수
target = input_data[1] # 찾고자 하는 문자열

print("앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.")
array = input().split()

# 순차 탐색 수행 결과 분석
print(sequential_search(n, target, array))

순차 탐색의 시간 복잡도

  • 데이터 정렬 여부와 상관없이 가장 앞에 있는 원소부터 하나씩 확인해야 하므로 데이터가 N개일 때 최대 N번의 비교 연산이 필요하다.
  • 따라서 최악의 경우 시간 복잡도는 O(N)개이다.

 

🍃 이진 탐색(Binary Search)

  • 이진 탐색은 배열 내부의 데이터가 정렬되어 있어야만 사용할 수 있다.
  • 이진 탐색은 탐색 범위를 절반씩 좁혀가며 데이터를 탐색하는 특징이 있다.
  • 이진 탐색은 위치를 나타내는 변수 3개를 사용하는데 탐색하고자 하는 범위의 시작점, 끝점, 중간점이다.
  • 찾으려는 데이터와 중간점에 위치에 있는 데이터를 반복적으로 비교해서 원하는 데이터를 찾는게 이진 탐색 과정이다.

재귀 함수로 구현한 이진탐색 소스

# 이진 탐색 소스코드 구현 (재귀 함수)
def binary_search(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2
    # 찾은 경우 중간점 인덱스 반환
    if array[mid] == target:
        return mid
    # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
    elif array[mid] > target:
        return binary_search(array, target, start, mid-1)
    # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
    elif array[mid] < target:
        return binary_search(array, target, mid+1, end)

n, target = list(map(int, input().split()))
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n-1)
if result == None:
    print("원소가 존재하지 않습니다.")
else:
    print(result + 1)

반복문으로 구현한 이진 탐색 소스

def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2
        # 찾은 경우 중간점 인덱스 반환
        if array[mid] == target:
            return mid
        # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
        elif array[mid] > target:
            end = mid - 1
        # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
        elif array[mid] < target:
            start = mid + 1
    return None

n, target = list(map(int, input().split()))
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n-1)
if result == None:
    print("원소가 존재하지 않습니다.")
else:
    print(result + 1)

이진 탐색의 시간 복잡도

  • 이진 탐색은 한 번 확인할 때마다 확인하는 원소의 개수가 절반씩 줄어든다는 점에서 시간 복잡도가 O(logN)이다.
  • 절반씩 데이터를 줄어들도록 만든다는 점은 퀵 정렬과 공통점이 있다.

 

🍃 코딩테스트에서의 이진 탐색

  • 이진 탐색은 코딩 테스트에서 자주 나오는 유형의 문제이므로 암기가 중요하다.
  • 제대로 이진 코드를 작성한 프로그래머는 10% 내외라 할 정도로 실제 구현은 까다롭다.
  • 탐색 범위가 큰 상황에서의 탐색을 가정하는 문제에서 이진 탐색으로 접근하면 좋다.

 

🍃트리 자료구조

  • 이진 탐색은 전제조건이 데이터 정렬이다.
  • 데이터베이스는 내부적으로 대용량 데이터 처리에 적합한 트리(Tree) 자료구조를 이용하여 항상 데이터가 정렬되어 있다.
  • 트리 자료구조는 노드와 노드의 연결로 표현하며, 여기서 노드는 정보의 단위로서 어떠한 정보를 가지고 있는 개체로 이해할 수 있다.
  • 큰 데이터를 처리하는 소프트웨어는 대부분 데이터를 트리 자료구조로 저장해서 이진탐색 기법을 활요해 빠르게 탐색이 가능하다.

트리 자료구조의 특징

  • 트리는 부모 노드와 자식 노드의 관계로 표현된다.
  • 트리의 최상단 노드를 루트 노드라 한다.
  • 트리의 최하단 노드를 단말 노드라 한다.
  • 트리에서 일부를 뗴어내도 트리 구조이며 이를 서브 트리라 한다.
  • 트리는 파일 시스템과 같이 계층적이고 정렬된 데이터를 다루기에 적합하다.

 

🍃 이진 탐색 트리

  • 트리 자료구조 중 가장 간단한 형태가 이진 탐색 트리이다.
  • 이진 탐색 트리란 이진 탐색이 동작할 수 있도록 고안된, 효율적인 탐색이 가능한 자료구조이다.

이진 탐색 트리의 특징

  • 부모 노드보다 왼쪽 자식 노드가 작다.
  • 부모 노드보다 오른쪽 자식 노드가 크다.
  • 왼쪽 자식노드 < 부모노드 < 오른쪽 자식노드

 

반응형