numpy.unique()
는 배열에서 유일한 값만 남기는, 중복 요소를 제거하는 함수입니다.
1. 1차원 배열의 중복 제거
1차원 배열에 대해서 numpy.array(arr)
를 호출하면, 중복이 모두 제거된 배열이 리턴됩니다.
import numpy as np
arr = np.array([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])
unique_arr = np.unique(arr)
print(unique_arr)
Output:
[1 2 3 4]
2. 2차원 배열의 중복 제거
2차원 배열에 대해서 numpy.unique(arr)
을 적용하면, 1차 배열로 평탄화되고 중복된 값이 모두 제거됩니다.
import numpy as np
arr = np.array([[1, 2], [2, 3], [1, 2], [3, 4]])
unique_arr = np.unique(arr)
print(arr)
print(unique_arr)
Output:
[[1 2]
[2 3]
[1 2]
[3 4]]
[1 2 3 4]
2.1 행(Row) 중복 제거
배열의 행(Row)을 비교하여, 동일한 행이 있으면 중복을 제거할 수 있습니다.
- 2차 배열에서
axis=0
은 행을 의미 unique(arr, axis=0)
는 배열에서 중복 행을 제거
import numpy as np
arr = np.array([[1, 2],
[2, 3],
[1, 2],
[3, 4]])
unique_arr = np.unique(arr, axis=0)
print(arr)
print(unique_arr)
Output:
[[1 2]
[2 3]
[1 2]
[3 4]]
[[1 2]
[2 3]
[3 4]]
2.2 열(Column) 중복 제거
배열의 열(Column)을 비교하여, 값이 동일한 열이 있으면 중복을 제거할 수 있습니다.
- 2차 배열에서
axis=1
은 열을 의미 unique(arr, axis=1)
는 배열에서 중복 열을 제거
import numpy as np
arr = np.array([[1, 2, 1],
[3, 3, 3],
[1, 2, 1]])
unique_arr = np.unique(arr, axis=1)
print(arr)
print(unique_arr)
실행 결과를 보면, 2차 배열에서 1열과 3열이 '1, 3, 1' 값을 갖고 있습니다. 하나를 제거합니다. Output:
[[1 2 1]
[3 3 3]
[1 2 1]]
[[1 2]
[3 3]
[1 2]]
3. 중복 요소 개수 리턴 (return_counts)
아래 예제는 중복을 제거하며, 배열에서 각 요소에 해당하는 값이 몇개씩 있는지 개수를 함께 리턴합니다.
return_counts=true
인자 전달 시, 중복 요소 개수도 함께 배열로 리턴
import numpy as np
arr = np.array([1, 1, 2, 2, 2, 3, 3, 4, 4, 4, 4])
unique_arr, counts = np.unique(arr, return_counts=True)
print(unique_arr)
print(counts)
실행 결과를 보면, unique_arr
의 Index 1은 값이 1이며, 배열에서 이 값의 중복 요소 개수는 counts
의 Index 1에 해당하는 값입니다.
[1 2 3 4]
[2 3 2 4]
4. unique 값의 실제 배열 Index 정보 (return_index)
중복이 제거된 unique 값을 얻었을 때, 이 값이 실제 배열에서 어디에 위치해있는지 Index 정보를 가져올 수 있습니다.
return_index=true
인자 전달 시, unique 값이 실제 배열에서 위치한 Index를 함께 리턴
import numpy as np
arr = np.array([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])
unique_arr, index = np.unique(arr, return_index=True)
print(unique_arr)
print(index)
실행 결과를 보면, unique_arr
의 첫번째 요소는 배열에서 Index 0(index[0]
)에 위치해있습니다.
[1 2 3 4]
[0 1 3 6]
5. 배열 값에 대한 unique_arr의 Index 정보 (return_inverse)
return_index=true
를 사용한 것과 반대로, 배열의 실제 값이 리턴되는 unique_arr
의 어떤 위치에 있는지 정보를 가져올 수도 있습니다.
return_index=true
인자 전달 시, unique 값이 실제 배열에서 위치한 Index를 함께 리턴
import numpy as np
arr = np.array([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])
unique_arr, inverse = np.unique(arr, return_inverse=True)
print(unique_arr)
print(inverse)
실행 결과를 보면, inverse
의 Index 0의 값은 실제 배열의 첫번째 요소(arr[0]
)가 unique_arr
에 위치한 Index를 의미합니다.
Output:
[1 2 3 4]
[0 1 1 2 2 2 3 3 3 3]
Related Posts
- Python - Yaml 파일 파싱하는 방법
- Python - 파일 내용 삭제
- Python - for문에서 리스트 순회 중 요소 값 제거
- Python - 두 리스트에서 공통 요소 값 찾기
- Python - 문자열 앞(뒤)에 0으로 채우기
- Python - 공백으로 문자열 분리
- Python - 중첩 리스트 평탄화(1차원 리스트 변환)
- Python - 16진수 문자열을 Int로 변환
- Python - 두 날짜, 시간 비교
- Python f-string으로 변수 이름, 값 쉽게 출력 (변수명 = )
- Python - nonlocal과 global 사용 방법
- Python 바다코끼리 연산자 := 알아보기
- Python - pip와 requirements.txt로 패키지 관리
- Python - 딕셔너리 보기 좋게 출력 (pprint)
- Python - Requests 사용 방법 (GET/POST/PUT/PATCH/DELETE)
- Python - 온라인 컴파일러 사이트 추천
- Python - os.walk()를 사용하여 디렉토리, 파일 탐색
- Python - 문자열 비교 방법
- Python - Text 파일 읽고 쓰는 방법 (read, write, append)
- Python - 리스트에서 첫번째, 마지막 요소 가져오는 방법
- Python - 두개의 리스트 하나로 합치기
- Python - 리스트의 마지막 요소 제거
- Python - 리스트의 첫번째 요소 제거
- Python 소수점 버림, 4가지 방법
- Python 코드 안에서 버전 확인 방법
- Python 소수점 반올림, round() 예제
- Python - 리스트 평균 구하기, 3가지 방법
- Python - bytes를 String으로 변환하는 방법
- Python - String을 bytes로 변환하는 방법
- Python 버전 확인 방법 (터미널, cmd 명령어)
- Python - 람다(Lambda) 함수 사용 방법
- Python - dict 정렬 (Key, Value로 sorting)
- Python - range() 사용 방법 및 예제
- Python - 리스트를 문자열로 변환
- Python - 문자를 숫자로 변환 (String to Integer, Float)