소개
np.std(a, axis=None, dtype=None, out=None, ddof=0, keepdims=False, where=True)는 주어진 배열 a의 요소들의 표준편차(Standard Deviation)를 계산하는 함수입니다. 이 함수는 전체 배열 또는 특정 축(axis)을 따라 표준편차를 계산할 수 있으며, 데이터 분석과 통계 처리에서 자주 사용됩니다. 표준편차는 데이터의 산포도를 나타내는 중요한 지표로, 데이터의 분산 정도를 파악하는 데 유용합니다.
기본 사용법
import numpy as np
# 1차원 배열의 표준편차 계산
array1 = np.array([1, 2, 3, 4, 5])
std_array1 = np.std(array1)
# 2차원 배열에서 특정 축(axis)별 표준편차 계산
array2d = np.array([[1, 2], [3, 4], [5, 6]])
std_axis0 = np.std(array2d, axis=0) # 열 기준 표준편차
std_axis1 = np.std(array2d, axis=1) # 행 기준 표준편차
print("1D 배열의 표준편차:", std_array1)
print("2D 배열의 열별 표준편차:", std_axis0)
print("2D 배열의 행별 표준편차:", std_axis1)
상세 설명
- a: 표준편차를 구할 배열입니다. 다차원 배열도 허용되며, 전체 또는 특정 축을 따라 표준편차를 계산합니다.
- 예시: np.std([1, 2, 3, 4, 5])는 배열의 모든 요소의 표준편차를 계산하여 1.414를 반환합니다.
- axis (선택사항): 배열에서 표준편차를 구할 축을 지정합니다. axis=0은 열을 기준으로, axis=1은 행을 기준으로 표준편차를 계산합니다.
- 예시: np.std(array2d, axis=0)은 각 열의 표준편차를 계산하여 [1.632, 1.632]를 반환합니다.
- dtype (선택사항): 연산 결과의 데이터 타입을 명시적으로 설정할 수 있습니다. 기본값은 입력 배열의 데이터 타입을 따릅니다.
- out (선택사항): 결과를 저장할 배열을 지정할 수 있습니다. 입력 배열과 크기가 같아야 하며, 메모리를 절약하는 데 유용합니다.
- ddof (선택사항): 자유도를 결정하는 매개변수로, 기본값은 0입니다. 자유도를 조정하면 분산과 표준편차 계산에서 더 정확한 값을 얻을 수 있습니다.
- 예시: np.std(array, ddof=1)은 표본 표준편차를 계산합니다.
- keepdims (선택사항): True로 설정하면 축을 따라 계산한 후에도 결과 배열의 차원을 유지합니다. 기본값은 False입니다.
- where (선택사항): 특정 조건이 참인 요소에 대해서만 표준편차를 계산할 수 있습니다.
- 활용
- 데이터 분석 및 통계: 배열의 표준편차를 계산하여 데이터의 산포도를 파악하고, 통계 처리에서 평균값과의 차이를 분석할 때 유용합니다.
- 과학적 계산 및 머신러닝: 표준편차를 통해 데이터의 변동성을 분석하고, 모델 학습에 사용되는 데이터를 평가하는 데 필수적으로 사용됩니다.
라이센스
NumPy는 BSD-3-Clause 라이센스를 따릅니다. 자유롭게 사용, 수정, 배포할 수 있으며 상업적 목적으로도 사용할 수 있습니다. 라이센스와 저작권 정보는 NumPy의 공식 GitHub 리포지토리에서 확인할 수 있습니다.
관련 내용
[NumPy] 배열의 제곱근 구하기: np.sqrt() 사용 및 설명
[NumPy] 배열의 자연 로그 구하기: np.log() 사용 및 설명
[NumPy] 배열의 지수 연산 수행하기: np.exp() 사용 및 설명
[NumPy] 배열의 최솟값 인덱스 찾기: np.argmin() 사용 및 설명
[NumPy] 배열의 최댓값 인덱스 찾기: np.argmax() 사용 및 설명
[NumPy] 배열의 최솟값 구하기: np.min() 사용 및 설명
[NumPy] 배열의 최댓값 구하기: np.max() 사용 및 설명
[NumPy] 배열의 분산 구하기: np.var() 사용 및 설명
[NumPy] 배열의 표준편차 구하기: np.std() 사용 및 설명
'함수 설명 > 기본 및 범용' 카테고리의 다른 글
[NumPy] 배열의 최댓값 구하기: np.max() 사용 및 설명 (0) | 2024.10.02 |
---|---|
[NumPy] 배열의 분산 구하기: np.var() 사용 및 설명 (0) | 2024.10.02 |
[NumPy] 배열 요소 평균 구하기: np.mean() 사용 및 설명 (0) | 2024.10.02 |
[NumPy] 배열 요소 합 구하기: np.sum() 사용 및 설명 (0) | 2024.10.02 |
[NumPy] 배열 간 거듭제곱 계산하기: np.power() 사용 및 설명 (0) | 2024.10.02 |