목록전체 글 (48)
CKtrace's Devlog

공분산 & 상관 계수 (feat. 산점도) 산점도(Scatter plot) 공분산과 상관계수를 알기 위해서는 산점도란 무엇인지 우선 알아야 합니다. 산점도(Scatter) 연속형 변수 두 개 간의 관계를 보기 위해서 평면에 점을 찍어 만든 통계 그래프입 cktrace.tistory.com 공분산과 상관 계수의 포스팅을 이어서 작성하는 것이기에 위 글을 먼저 보고 이 포스팅을 보는 것을 추천드립니다! 피어슨 상관 계수 (Pearson Correlation Coefficient) 피어슨 상관 계수(Pearson Correlation Coefficient)는 공분산을 표준화 한 값이고, 값의 범위는 -1부터 1 사이입니다. 피어슨 상관 계수의 일반식과 간편식에 대해 알아보도록 하겠습니다. 피어슨 상관 계수 성..

산점도(Scatter plot) 공분산과 상관계수를 알기 위해서는 산점도란 무엇인지 우선 알아야 합니다. 산점도(Scatter) 연속형 변수 두 개 간의 관계를 보기 위해서 평면에 점을 찍어 만든 통계 그래프입니다. 산점도 그래프를 보아 알 수 있듯이 점들은 두 변수 x, y 순서쌍 자료 값에 맞게 찍힙니다. 공분산(Covariance) 공분산(Covariance)은 두 변수 간에 직선 관계가 어느 정도인지를 나타내 주는 통계 값입니다. 공분산은 위에서 설명한 산점도를 통해서 두 변수 간에 관계의 존재 여부를 시각적으로 확인할 수 있습니다. 평균 순서쌍 값인 (x, y)를 기준으로 분포하는 형태에 따라 아래의 두 가지 관계로 분류할 수 있습니다. 평균 순서쌍 값인 (x, y)를 중심으로 1 사분면과 3 ..

집합(Set) - Feature 집합은 리스트, 튜플, 딕셔너리와 같이 여러 개의 자료를 저장하는 자료형입니다. 그런데 특이하게도 리스트, 튜플, 딕셔너리와 달리 자료 간의 순서가 없습니다. 아래와 같이 집합의 성질을 표로 정리해보았습니다. 집합(Set) 순서 X 중복 X 수정 X 삭제 O 집합(Set) - Declaration 위에서 집합 자료형이란 무엇이고, 어떤 성질을 갖는지 알아보았습니다. 지금부터는 집합 선언 방법을 코드 블록을 통해 알아보도록 하겠습니다. # set([])을 이용한 선언 방식 a = set([1, 4, 5, 7, 9]) b = set([1, 2, 'Plate', 'Car', 'Earth']) # {}을 이용한 선언 방식 c = {'cos', 'sin', 'tan'} d = {3..

딕서녀리(Dictionary) - Feature 딕셔너리(Dictionary)는 여러 개의 자료를 각각 key와 value로 저장한 자료형입니다. key와 value로 저장했다는 것이 무슨 말인지 지금은 이해되지 않을 수 있지만, 밑에서 여러 예시와 설명을 통해 이해하실 수 있을테니 지금은 "아, key와 value라는 것들로 저장된 자료형이구나" 정도만 알고 계시면 될 것 같습니다. 이제 딕셔너리의 성질을 표를 통해 알아보도록 하겠습니다. 딕셔너리(Dictionary) 순서 X (Key) 중복 X 수정 O 삭제 O 딕셔너리는 key와 value로 이루어진 자료형! 이 문장을 잘 기억하시면서 글을 읽어 나가시면 좋을 것 같습니다. 딕셔너리(Dictionary) - Declaration 딕셔너리란 무엇이며..

포아송 분포(Poisson Distribution)란 무엇인가? 포아송 분포(Poisson Distribution) -> 발생할 가능성이 매우 희박한 사건이 임의의 구간 혹은 시간 안에서 평균적으로 λ번 발생하는 사건이 있다고 가정해봅시다. 이때 이 사건이 일어날 횟수의 분포를 포아송 분포라고 합니다. 포아송 분포의 조건은 두 가지가 있습니다. 나눈 각각의 시간 혹은 구간의 발생 빈도는 서로 독립입니다. 시간 혹은 구간의 위치와 관계없이 동일한 길이의 시간 혹은 구간에서 평균 발생 빈도는 동일합니다. 포아송 분포는 이항 분포를 근사한 분포입니다. 어째서 이항분포를 근사해서 사용하는지는 차근차근 알아보도록 하겠습니다. 이항 분포에 대한 내용을 알아보고 싶으신 분들을 위해 제가 이전에 작성한 포스팅의 링크를..

튜플(Tuple) - Feature 튜플(Tuple)은 여러 개의 자료를 하나로 묶는 데 사용하는 자료형으로 리스트(List)와 유사한 자료형입니다. 하지만 튜플은 리스트와 유사하지만 아래의 표와 같이 리스트의 특징과 다른 부분들이 존재합니다. 튜플(Tuple) 순서 O 중복 O 수정 X 삭제 X " 튜플은 '불변'한다! " 이 문장을 기억하시면 좋을 것 같습니다. 튜플(Tuple) - Declaration 이제 튜플을 선언하는 방법을 코드 블록을 통해 알아보도록 하겠습니다! # 빈 튜플 선언 tuple_a = () # 한 개의 자료만 저장된 튜플 선언 tuple_b = (1,) # tuple_b = (1)로 선언할 경우 튜플로 저장되는 것이 아닌 정수 1이 저장된 변수가 됩니다. # 여러 개의 자료(같..