[NumPy] 행렬의 고유값 및 고유벡터 구하기: np.linalg.eig() 사용 및 설명
소개 np.linalg.eig(a) 함수는 주어진 행렬 a의 고유값과 고유벡터를 계산하는 함수입니다. 고유값과 고유벡터는 선형대수학에서 중요한 개념으로, 행렬의 변환 성질을 분석하는 데 유용합니다. np.linalg.eig() 함수는 행렬의 대각화, 시스템 안정성 분석, 과학적 계산, 데이터 분석 등의 다양한 분야에서 사용됩니다. 기본 사용법import numpy as np# 2x2 행렬의 고유값과 고유벡터 계산matrix = np.array([[1, 2], [2, 3]])eigenvalues, eigenvectors = np.linalg.eig(matrix)print("고유값:\n", eigenvalues)print("고유벡터:\n", eigenvectors)상세 설명a: 고유값과 고유벡터를 계산할 ..
2024. 10. 3.
[NumPy] 상관 계수 구하기: np.corrcoef() 사용 및 설명
소개 np.corrcoef(x, y=None, rowvar=True, bias=, ddof=, dtype=None) 함수는 주어진 데이터 x와 선택적으로 y의 상관 계수 행렬을 계산하는 함수입니다. 상관 계수는 두 변수 간의 선형 관계를 측정하며, -1에서 1 사이의 값을 가집니다. 1에 가까울수록 양의 상관, -1에 가까울수록 음의 상관, 0에 가까울수록 무상관을 나타냅니다. 이 함수는 데이터 분석과 통계학에서 변수 간의 관계를 파악할 때 자주 사용됩니다. 기본 사용법import numpy as np# 두 변수 간의 상관 계수 행렬 계산x = np.array([1, 2, 3, 4, 5])y = np.array([10, 9, 6, 3, 1])corr_matrix = np.corrcoef(x, y)pri..
2024. 10. 3.
[NumPy] 공분산 구하기: np.cov() 사용 및 설명
소개 np.cov(m, y=None, rowvar=True, bias=False, ddof=None, fweights=None, aweights=None) 함수는 주어진 데이터 m의 공분산 행렬을 계산하는 함수입니다. 공분산은 두 변수 간의 선형 관계를 나타내며, 이 함수는 변수 간의 상관성을 분석할 때 유용합니다. np.cov()는 데이터 분석, 통계학, 금융 분석 등에서 자주 사용됩니다. 기본 사용법import numpy as np# 두 변수 간의 공분산 계산x = np.array([1, 2, 3, 4, 5])y = np.array([5, 4, 6, 8, 10])cov_matrix = np.cov(x, y)print("공분산 행렬:\n", cov_matrix)상세 설명m: 공분산을 계산할 데이터 배..
2024. 10. 3.
[NumPy] 배열의 백분위수 구하기: np.percentile() 사용 및 설명
소개 np.percentile(a, q, axis=None, out=None, overwrite_input=False, interpolation='linear', keepdims=False)는 배열 a에서 q 백분위수를 계산하는 함수입니다. 백분위수는 데이터 분포에서 주어진 비율에 해당하는 값을 나타냅니다. 예를 들어, q=50은 중앙값(50번째 백분위수), q=25는 1사분위수(25번째 백분위수) 등을 의미합니다. 이 함수는 데이터 분석, 통계 처리, 그리고 머신러닝에서 자주 사용됩니다. 기본 사용법import numpy as np# 1차원 배열에서 25%, 50%, 75% 백분위수 계산array = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])percentiles = n..
2024. 10. 3.
[NumPy] 배열의 중앙값 구하기: np.median() 사용 및 설명
소개 np.median(a, axis=None, out=None, overwrite_input=False, keepdims=False)는 주어진 배열 a의 중앙값(중위수)을 계산하는 함수입니다. 중앙값은 데이터셋을 오름차순으로 정렬했을 때, 가운데 위치한 값을 의미하며, 데이터 분포의 중심을 측정하는 데 자주 사용됩니다. 배열의 전체 중앙값을 구하거나, 특정 축(axis)에 따라 중앙값을 계산할 수 있습니다. 기본 사용법import numpy as np# 1차원 배열의 중앙값 계산array = np.array([1, 2, 3, 4, 5])median_value = np.median(array)# 2차원 배열에서 축(axis)별 중앙값 계산array2d = np.array([[1, 2, 3], [4, 5..
2024. 10. 3.
[NumPy] 배열 정렬 인덱스 구하기: np.argsort() 사용 및 설명
소개 np.argsort(a, axis=-1, kind=None, order=None)는 배열 a의 요소들을 지정한 축(axis)을 따라 정렬한 후, 그 정렬된 순서에 해당하는 인덱스를 반환하는 함수입니다. 정렬된 배열을 생성하는 것이 아니라, 배열을 정렬하는 데 필요한 인덱스를 반환하므로, 이 인덱스를 통해 원본 배열을 정렬된 상태로 재구성할 수 있습니다. 기본 사용법import numpy as np# 1차원 배열의 정렬된 순서의 인덱스 반환array = np.array([3, 1, 2, 5, 4])sorted_indices = np.argsort(array)# 정렬된 순서대로 배열 재구성sorted_array = array[sorted_indices]print("정렬된 순서의 인덱스:", sorte..
2024. 10. 3.