[NumPy] 배열의 백분위수 구하기: np.percentile() 사용 및 설명
소개 np.percentile(a, q, axis=None, out=None, overwrite_input=False, interpolation='linear', keepdims=False)는 배열 a에서 q 백분위수를 계산하는 함수입니다. 백분위수는 데이터 분포에서 주어진 비율에 해당하는 값을 나타냅니다. 예를 들어, q=50은 중앙값(50번째 백분위수), q=25는 1사분위수(25번째 백분위수) 등을 의미합니다. 이 함수는 데이터 분석, 통계 처리, 그리고 머신러닝에서 자주 사용됩니다. 기본 사용법import numpy as np# 1차원 배열에서 25%, 50%, 75% 백분위수 계산array = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])percentiles = n..
2024. 10. 3.
[NumPy] 배열의 중앙값 구하기: np.median() 사용 및 설명
소개 np.median(a, axis=None, out=None, overwrite_input=False, keepdims=False)는 주어진 배열 a의 중앙값(중위수)을 계산하는 함수입니다. 중앙값은 데이터셋을 오름차순으로 정렬했을 때, 가운데 위치한 값을 의미하며, 데이터 분포의 중심을 측정하는 데 자주 사용됩니다. 배열의 전체 중앙값을 구하거나, 특정 축(axis)에 따라 중앙값을 계산할 수 있습니다. 기본 사용법import numpy as np# 1차원 배열의 중앙값 계산array = np.array([1, 2, 3, 4, 5])median_value = np.median(array)# 2차원 배열에서 축(axis)별 중앙값 계산array2d = np.array([[1, 2, 3], [4, 5..
2024. 10. 3.
[NumPy] 배열 정렬 인덱스 구하기: np.argsort() 사용 및 설명
소개 np.argsort(a, axis=-1, kind=None, order=None)는 배열 a의 요소들을 지정한 축(axis)을 따라 정렬한 후, 그 정렬된 순서에 해당하는 인덱스를 반환하는 함수입니다. 정렬된 배열을 생성하는 것이 아니라, 배열을 정렬하는 데 필요한 인덱스를 반환하므로, 이 인덱스를 통해 원본 배열을 정렬된 상태로 재구성할 수 있습니다. 기본 사용법import numpy as np# 1차원 배열의 정렬된 순서의 인덱스 반환array = np.array([3, 1, 2, 5, 4])sorted_indices = np.argsort(array)# 정렬된 순서대로 배열 재구성sorted_array = array[sorted_indices]print("정렬된 순서의 인덱스:", sorte..
2024. 10. 3.
[NumPy] 배열 정렬하기: np.sort() 사용 및 설명
소개 np.sort(a, axis=-1, kind=None, order=None)는 주어진 배열 a의 요소들을 지정한 축(axis)을 따라 정렬하는 함수입니다. 배열 전체 또는 특정 축에 따라 오름차순으로 정렬할 수 있으며, 다양한 정렬 알고리즘과 구조화된 배열의 필드를 선택적으로 사용할 수 있습니다. 이 함수는 데이터 처리, 정렬, 분석 작업에서 자주 사용됩니다. 기본 사용법import numpy as np# 1차원 배열의 정렬array1 = np.array([3, 1, 2, 5, 4])sorted_array1 = np.sort(array1)# 2차원 배열에서 축(axis)별 정렬array2d = np.array([[3, 1, 2], [6, 5, 4]])sorted_axis0 = np.sort(arr..
2024. 10. 3.
[NumPy] 배열의 중복 제거 및 고유 값 찾기: np.unique() 사용 및 설명
소개 np.unique(ar, return_index=False, return_inverse=False, return_counts=False, axis=None)는 배열 ar의 중복된 요소를 제거하고 고유한 값들을 반환하는 함수입니다. 필요에 따라 고유 값의 인덱스, 역 인덱스, 각 값의 빈도 수도 반환할 수 있어 데이터 분석 및 중복 제거 작업에 매우 유용합니다. 기본 사용법import numpy as np# 1차원 배열에서 고유 값 찾기array = np.array([1, 2, 2, 3, 3, 3])unique_values = np.unique(array)print("배열의 고유 값:", unique_values)상세 설명ar: 고유 값을 추출할 배열로, 다차원 배열도 가능합니다. 배열에서 중복된 ..
2024. 10. 3.
[NumPy] 조건에 따른 배열 선택: np.where() 사용 및 설명
소개 np.where(condition, [x, y])는 주어진 condition이 참인 경우 x를 반환하고, 거짓인 경우 y를 반환하는 함수입니다. 조건에 따라 배열의 값을 선택하거나, 조건을 만족하는 요소의 인덱스를 반환할 수 있습니다. 이 함수는 데이터 분석, 조건부 연산, 마스킹 처리 등에서 자주 사용됩니다. 기본 사용법import numpy as np# 조건이 참이면 1, 거짓이면 0을 반환array = np.array([1, 2, 3, 4, 5])result = np.where(array > 3, 1, 0)print("조건에 따른 배열 선택 결과:", result)# 조건을 만족하는 인덱스 반환index_result = np.where(array > 3)print("조건을 만족하는 요소의 인..
2024. 10. 3.
[NumPy] 배열의 제곱근 구하기: np.sqrt() 사용 및 설명
소개 np.sqrt(x, out=None, where=True)는 주어진 배열 x의 각 요소에 대해 제곱근을 계산하는 함수입니다. 이 함수는 배열의 모든 요소에 대해 제곱근을 계산하며, 수학적 연산, 데이터 분석, 과학적 계산에서 자주 사용됩니다. out과 where 같은 선택적 파라미터를 활용하여 조건부 계산 및 메모리 절약이 가능합니다. 기본 사용법import numpy as np# 1차원 배열에서 제곱근 계산array = np.array([1, 4, 9, 16])sqrt_array = np.sqrt(array)print("배열의 제곱근 결과:", sqrt_array)상세 설명x: 제곱근을 계산할 배열입니다. 각 요소에 대해 제곱근이 계산됩니다.예시: np.sqrt([1, 4, 9, 16])는 [s..
2024. 10. 2.