서론
통계는 우리 일상에서 일어나는 많은 일들을 예측할 수 있게 해줍니다. 우리가 궁금한 것에 대해 표본을 통해 그 답을 주는 방식으로 우리는 실제로 모든 것을 알지 못하더라도 예측할 수 있게 됩니다. 이러한 통계는 그 필요에 따라 많은 방법들이 발전하였으며, 최근에는 컴퓨터 공학과 접목되어 데이터 사이언스로 발전하게 되었습니다. 저는 이 과정 중 통계의 어떤 부분에서 부족함이 있어 데이터 사이언스를 활용하게 되었는지 살펴보기 위해 통계를 우선적으로 공부하고 있습니다. 오늘은 통계학적으로 어떤 기법들이 사용되며, 예측을 위한 통계기법들은 어떨 때 사용되는지 살펴보도록 하겠습니다.
통계 기법설명
예시
1. 기술통계학
- 예시: 평균, 중앙값, 표준편차, 분위수
- 활용예시: 학급의 시험 점수를 분석하여 평균과 표준편차를 계산하여 학생들의 성적 분포를 파악할 수 있습니다.
2. 확률분포
- 예시: 이항분포, 정규분포, 포아송 분포 등
- 활용예시: 제품의 결함률을 이항분포로 모델링하여 품질 통제를 위한 통계적 검사 기준을 설정할 수 있습니다.
3. 추론통계학
-예시: 가설 검정, 신뢰 구간 추정, t-검정, 카이제곱 검정 등
- 활용예시: 새로운 약의 효과를 검증하기 위해 임상 실험을 수행하여 가설 검정을 실시하고, 결과를 통해 약의 효과를 결론 짓습니다.
4. 상관분석:
- 예시: 피어슨 상관계수, 스피어만 순위 상관계수 등
- 활용예시: 날씨와 아이스크림 판매량 간의 상관관계를 분석하여, 날씨가 아이스크림 판매량에 어떤 영향을 미치는지 파악할 수 있습니다.
5. 회귀분석
- 예시: 단순선형회귀, 다중선형회귀, 로지스틱 회귀 등
- 활용예시: 광고 비용과 제품 판매량 간의 관계를 분석하여, 광고에 얼마나 많은 예산을 투자해야 판매량이 증가하는지 예측할 수 있습니다.
6. 시계열 분석
- 예시: ARIMA, 지수평활법, 계절성 분석 등
- 활용예시: 주식 가격의 일정 기간 동안의 변동 패턴을 분석하여 향후 주식 가격을 예측할 수 있습니다.
7.. 분산분석 (ANOVA)
- 예시: 일원 분산분석, 이원 분산분석 등
- 활용예시: 교육 수준에 따른 연봉 차이를 분석하여, 교육 수준이 연봉에 미치는 영향을 확인할 수 있습니다.
8. 요인분석
- 예시: 주성분 분석, 군집분석 등
- 활용예시: 소비자들의 구매 패턴을 분석하여, 제품 속성에 따라 어떤 요인이 소비자들의 구매 결정에 영향을 미치는지 파악할 수 있습니다.
9. 클러스터 분석
- 예시: K-평균 군집화, 계층적 군집화 등
- 활용예시: 고객들의 구매 이력을 분석하여, 비슷한 구매 패턴을 가진 고객들을 그룹화하여 개별적인 마케팅 전략을 수립할 수 있습니다.
결론
이렇게 각 통계 기법의 예시와 활용예시를 제시하여 통계학의 다양한 분야에서 어떻게 활용되는지를 알아보았습니다. 통계 기법은 다양한 상황에서 데이터 분석과 의사 결정에 활용되며, 실제 데이터와 함께 적용하면 더욱 효과적인 결과를 얻을 수 있습니다.
오늘은 예측을 위한 통계 기법들을 알아보았습니다. 가장 중요한 것은 사용 목적에 알맞은 도구들을 적용하는 것입니다. 그러기 위해서는 문제를 정의하고, 어떤 정보들이 필요한지 먼저 파악하는 것이 필요합니다. 또한, 예측에 대해 어느 정도 까지 신뢰할 지에 대해서도 고민할 필요가 있습니다. 이렇듯 통계는 그 자체만으로 활용하기에는 다소 보조가 필요하며, 적절한 보조가 이루어졌을 때 그 효과는 배가될 것 입니다.
'데이터 사이언스 > 기초' 카테고리의 다른 글
분류(Classification)은 무엇일까요? (30) | 2023.11.07 |
---|---|
회귀(Regression)은 무엇일까요? (30) | 2023.11.06 |
통계학의 기본, 통계량 (30) | 2023.10.28 |
일상을 유용하게 하는 도구: 통계 (0) | 2023.10.25 |
Data Science 거스를 수 없는 시대의 흐름 (0) | 2023.10.24 |