목록전체 글 (48)
CKtrace's Devlog

Dispersion(산포) 산포(Dispersion)이란 자료들이 서로 얼마나 퍼져 있는지를 나타내는 측도입니다. 그뿐만 아니라 중심위치가 얼마나 안정적인지에 대한 중요한 정보도 제공합니다. 그렇다면 산포에 따른 중심위치에 대한 정보는 어떻게 변동되는지에 대해 알아보도록 하겠습니다. 위와 같이 산포에 따라 중심위치에 대한 정보는 변동됩니다. What is Robust in statistics? 여러 가지 산포의 척도에 대해 알아보기 앞서 통계학에서 Robust란 무엇인지 알아보도록 하겠습니다. 이상점(Outlier)이란 변수의 분포에서 특출 나게 크거나 작은 값을 의미합니다. 분포의 산포를 확인하게 해주는 값이 이상점에 영향을 크게 받을수록 이상점에 Robust 하지 않다고 합니다. 역으로 이상점에 영향..

Numerical Data VS Categorical Data 자료는 크게 수치 자료와 범주형 자료로 나눌 수 있습니다. 수치 자료는 숫자로 표현한 자료이고, 범주형 자료는 원칙적으로 숫자가 아닌 문자로 표현하는 자료이며, 카테고리로 나눌 수 있는 자료입니다. 수치 자료에는 이산 자료, 연속 자료가 존재합니다. 범주형 자료에는 명목 자료, 순서 자료가 존재합니다. 이해를 위해 한눈에 알아보실 수 있도록 필기 그림을 준비해보았습니다. 자료는 어떻게 분류가 되는지 알아보았으니 각 자료들의 특징과 예시에 대해 하나씩 알아보도록 하겠습니다! Categorical Data - Nominal Data - 명목 자료의 대표적인 예시 mbti 혈핵형 Categorical Data - Ordinal Data - 순서 자..

기본적인 for문 형태 for문은 실행시키고자 하는 코드나 코드들을 일일이 다 작성하지 않고 반복을 통해 코드의 수를 줄여주는 매우 유용한 반복문입니다. 기본적인 for문의 형태는 아래의 그림과 같습니다. 예시를 통해서도 한 번 알아보도록 하겠습니다. # 기본적인 for문을 이용해 Hello World! 5번 출력 for i in range (5): print('Hello World!\n'); # 출력 결과 # Hello World! # Hello World! # Hello World! # Hello World! # Hello World! 이제 기본적인 for문의 형태와 사용 방법에 대해 알아보았으니 다양한 for문 사용법에 대해 알아보도록 하겠습니다. range()를 이용한 다른 for문 기본적인 fo..

Joint Distribution(결합분포) 결합분포란 두 개 혹은 그 이상의 변수들을 고려한 확률 분포입니다. 결합분포를 구성하는 변수들이 이산확률변수일 때는 이산확률변수에 대해 결합확률질량함수를 갖습니다. 예를 들어, 결합분포를 구성한 변수 두 개가 이산확률변수라면 결합확률질량함수는 아래와 같습니다. 변수들이 이산확률변수인 경우가 존재하는 것처럼, 연속확률변수인 경우도 존재합니다. 결합분포를 구성하는 변수들이 연속확률변수일 때는 연속확률변수에 대해 결합확률밀도함수를 갖습니다. 예를 들어, 결합분포를 구성한 변수 두 개가 연속확률변수라면 결합확률밀도함수는 아래와 같습니다. 위 필기 본에서 알 수 있다시피 결합확률밀도함수는 두 가지 특징을 갖기 때문에 이 부분 알아가시면 좋을 것 같습니다! 즉, 정리해보..

Before Entering... 가중치(Weight)에 대한 설명에 앞서서 우선 설명을 이해하기 위해서는 표본 추출 방법에 대해 알고 계셔야 합니다! [통계] - 표본 추출 방법 Probability Sampling VS Non-Probability Sampling 표본 추출 방법은 크게 확률표본추출(Probability Sampling), 비확률표본추출(Non-Probability Sampling)로 나눌 수 있습니다. 모집단에서 표본이 추출된 확률.. cktrace.tistory.com 위에 링크를 걸어둔 글을 참고하시면 도움이 되실 것 같습니다! What is Weight(가중치)? 가중치(Weight)란 표본 조사의 결과의 정확도를 높일 수 있게 해주는 중요한 요소입니다. 예를 들어, 여러 모집..

Probability Sampling VS Non-Probability Sampling 표본 추출 방법은 크게 확률표본추출(Probability Sampling), 비확률표본추출(Non-Probability Sampling)로 나눌 수 있습니다. 모집단에서 표본이 추출된 확률을 알 수 있는 추출을 확률표본추출이라고 합니다. 모집단에서 표본이 추출된 확률을 알 수 없는 추출이 비확률표본추출입니다. 그리고 확률표본추출과 비확률표본추출 안에도 여러 가지 추출 방법으로 나뉩니다. 필기 그림을 통해 알아보도록 하겠습니다! 확률표본추출에는 단순임의추출, 체계적추출, 층화임의추출, 집락추출이 있고, 비확률표본추출에는 편의표본추출, 할당표본추출, 판단표본추출이 있습니다. 이제 표본 추출 방법은 어떻게 나뉘는지 그리고 ..