목록Statistics (19)
CKtrace's Devlog

What are Numercial Data and Categorical Data? 수치형 자료와 범주형 자료를 표현하는 여러 가지 방법들에 대해 알아보기 전에 수치형 자료와 범주형 자료란 무엇인지 알아야 합니다! 제가 이전에 수치형 자료와 범주형 자료에 대해 작성했던 글을 통해 알아보시면 좋을 것 같습니다! 바로 아래에 링크를 남겨두었으니 여러분들께 도움이 되었으면 좋겠습니다! [통계] - 자료의 분류 Numerical Data VS Categorical Data 자료는 크게 수치 자료와 범주형 자료로 나눌 수 있습니다. 수치 자료는 숫자로 표현한 자료이고, 범주형 자료는 원칙적으로 숫자가 아닌 문자로 표현하는 자료이며, cktrace.tistory.com 이제 본격적으로 수치형 자료와 범주형 자료 표현..

Before entering... 변동 계수에 대해 알아보기 전에 표준 편차란 무엇인지에 대해 알아야 합니다. 혹시 표준 편차에 대한 개념이 조금 분명하지 않거나 무엇인지 모르시는 분들께 도움이 되고자 제가 작성했던 포스팅의 링크를 첨부하도록 하겠습니다. [통계] - 산포의 척도 Dispersion(산포) 산포(Dispersion)이란 자료들이 서로 얼마나 퍼져 있는지를 나타내는 측도입니다. 그뿐만 아니라 중심위치가 얼마나 안정적인지에 대한 중요한 정보도 제공합니다. 그렇다면 산포에 cktrace.tistory.com 위 포스팅을 통해 표준 편차에 대해 알아보시고 이 포스팅을 읽으시면 더 잘 이해가 되실 거라 믿습니다! 그러면 이제 변동 계수에 대해 알아보도록 하겠습니다! Why do we use Coe..

Dispersion(산포) 산포(Dispersion)이란 자료들이 서로 얼마나 퍼져 있는지를 나타내는 측도입니다. 그뿐만 아니라 중심위치가 얼마나 안정적인지에 대한 중요한 정보도 제공합니다. 그렇다면 산포에 따른 중심위치에 대한 정보는 어떻게 변동되는지에 대해 알아보도록 하겠습니다. 위와 같이 산포에 따라 중심위치에 대한 정보는 변동됩니다. What is Robust in statistics? 여러 가지 산포의 척도에 대해 알아보기 앞서 통계학에서 Robust란 무엇인지 알아보도록 하겠습니다. 이상점(Outlier)이란 변수의 분포에서 특출 나게 크거나 작은 값을 의미합니다. 분포의 산포를 확인하게 해주는 값이 이상점에 영향을 크게 받을수록 이상점에 Robust 하지 않다고 합니다. 역으로 이상점에 영향..

Numerical Data VS Categorical Data 자료는 크게 수치 자료와 범주형 자료로 나눌 수 있습니다. 수치 자료는 숫자로 표현한 자료이고, 범주형 자료는 원칙적으로 숫자가 아닌 문자로 표현하는 자료이며, 카테고리로 나눌 수 있는 자료입니다. 수치 자료에는 이산 자료, 연속 자료가 존재합니다. 범주형 자료에는 명목 자료, 순서 자료가 존재합니다. 이해를 위해 한눈에 알아보실 수 있도록 필기 그림을 준비해보았습니다. 자료는 어떻게 분류가 되는지 알아보았으니 각 자료들의 특징과 예시에 대해 하나씩 알아보도록 하겠습니다! Categorical Data - Nominal Data - 명목 자료의 대표적인 예시 mbti 혈핵형 Categorical Data - Ordinal Data - 순서 자..

Joint Distribution(결합분포) 결합분포란 두 개 혹은 그 이상의 변수들을 고려한 확률 분포입니다. 결합분포를 구성하는 변수들이 이산확률변수일 때는 이산확률변수에 대해 결합확률질량함수를 갖습니다. 예를 들어, 결합분포를 구성한 변수 두 개가 이산확률변수라면 결합확률질량함수는 아래와 같습니다. 변수들이 이산확률변수인 경우가 존재하는 것처럼, 연속확률변수인 경우도 존재합니다. 결합분포를 구성하는 변수들이 연속확률변수일 때는 연속확률변수에 대해 결합확률밀도함수를 갖습니다. 예를 들어, 결합분포를 구성한 변수 두 개가 연속확률변수라면 결합확률밀도함수는 아래와 같습니다. 위 필기 본에서 알 수 있다시피 결합확률밀도함수는 두 가지 특징을 갖기 때문에 이 부분 알아가시면 좋을 것 같습니다! 즉, 정리해보..

Before Entering... 가중치(Weight)에 대한 설명에 앞서서 우선 설명을 이해하기 위해서는 표본 추출 방법에 대해 알고 계셔야 합니다! [통계] - 표본 추출 방법 Probability Sampling VS Non-Probability Sampling 표본 추출 방법은 크게 확률표본추출(Probability Sampling), 비확률표본추출(Non-Probability Sampling)로 나눌 수 있습니다. 모집단에서 표본이 추출된 확률.. cktrace.tistory.com 위에 링크를 걸어둔 글을 참고하시면 도움이 되실 것 같습니다! What is Weight(가중치)? 가중치(Weight)란 표본 조사의 결과의 정확도를 높일 수 있게 해주는 중요한 요소입니다. 예를 들어, 여러 모집..