본문 바로가기
함수 설명/기본 및 범용

[NumPy] 배열의 분산 구하기: np.var() 사용 및 설명

by First Adventure 2024. 10. 2.
반응형

소개

  np.var(a, axis=None, dtype=None, out=None, ddof=0, keepdims=False, where=True)는 주어진 배열 a의 요소들의 분산(Variance)을 계산하는 함수입니다. 이 함수는 배열의 전체 분산을 계산하거나, 특정 축(axis)을 따라 분산을 구할 수 있습니다. 분산은 데이터 값들이 평균으로부터 얼마나 떨어져 있는지를 나타내는 척도로, 데이터 분석 및 통계 작업에서 자주 사용됩니다.

 

기본 사용법

import numpy as np

# 1차원 배열의 분산 계산
array1 = np.array([1, 2, 3, 4, 5])
var_array1 = np.var(array1)

# 2차원 배열에서 특정 축(axis)별 분산 계산
array2d = np.array([[1, 2], [3, 4], [5, 6]])
var_axis0 = np.var(array2d, axis=0)  # 열 기준 분산
var_axis1 = np.var(array2d, axis=1)  # 행 기준 분산

print("1D 배열의 분산:", var_array1)
print("2D 배열의 열별 분산:", var_axis0)
print("2D 배열의 행별 분산:", var_axis1)

상세 설명

  • a: 분산을 구할 배열입니다. 다차원 배열도 허용되며, 전체 또는 특정 축을 따라 분산을 계산합니다.
    • 예시: np.var([1, 2, 3, 4, 5])는 배열의 모든 요소의 분산을 계산하여 2.0을 반환합니다.
  • axis (선택사항): 배열에서 분산을 구할 축을 지정합니다. axis=0은 열을 기준으로, axis=1은 행을 기준으로 분산을 계산합니다.
    • 예시: np.var(array2d, axis=0)은 각 열의 분산을 계산하여 [2.6667, 2.6667]을 반환합니다.
  • dtype (선택사항): 연산 결과의 데이터 타입을 명시적으로 설정할 수 있습니다. 기본값은 입력 배열의 데이터 타입을 따릅니다.
  • out (선택사항): 결과를 저장할 배열을 지정할 수 있습니다. 입력 배열과 크기가 같아야 하며, 메모리 절약을 위해 유용합니다.
  • ddof (선택사항): 자유도를 결정하는 매개변수로, 기본값은 0입니다. 자유도를 조정하면 분산과 표준편차 계산에서 더 정확한 값을 얻을 수 있습니다.
    • 예시: np.var(array, ddof=1)은 표본 분산을 계산합니다.
  • keepdims (선택사항): True로 설정하면 축을 따라 계산한 후에도 결과 배열의 차원을 유지합니다. 기본값은 False입니다.
  • where (선택사항): 특정 조건이 참인 요소에 대해서만 분산을 계산할 수 있습니다.
  • 활용
    • 데이터 분석 및 통계: 배열의 분산을 계산하여 데이터의 산포도를 파악하고, 통계 처리에서 평균값과의 차이를 분석할 때 유용합니다.
    • 과학적 계산 및 머신러닝: 분산을 통해 데이터의 변동성을 분석하고, 모델 학습에 사용되는 데이터를 평가하는 데 필수적으로 사용됩니다.

 

라이센스

  NumPy는 BSD-3-Clause 라이센스를 따릅니다. 자유롭게 사용, 수정, 배포할 수 있으며 상업적 목적으로도 사용할 수 있습니다. 라이센스와 저작권 정보는 NumPy의 공식 GitHub 리포지토리에서 확인할 수 있습니다.

 

관련 내용

  [NumPy] 배열의 제곱근 구하기: np.sqrt() 사용 및 설명

  [NumPy] 배열의 자연 로그 구하기: np.log() 사용 및 설명

  [NumPy] 배열의 지수 연산 수행하기: np.exp() 사용 및 설명

  [NumPy] 배열의 최솟값 인덱스 찾기: np.argmin() 사용 및 설명

  [NumPy] 배열의 최댓값 인덱스 찾기: np.argmax() 사용 및 설명

  [NumPy] 배열의 최솟값 구하기: np.min() 사용 및 설명

  [NumPy] 배열의 최댓값 구하기: np.max() 사용 및 설명

  [NumPy] 배열의 분산 구하기: np.var() 사용 및 설명

  [NumPy] 배열의 표준편차 구하기: np.std() 사용 및 설명

  [NumPy] 배열 요소 평균 구하기: np.mean() 사용 및 설명

  [NumPy] 배열 요소 합 구하기: np.sum() 사용 및 설명

반응형