통계분석7 [누구나 파이썬 통계분석]_Ch03. 2차원 데이터 정리_상관성 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 짧고도 긴 여행을 다녀오느라 블로그를 잠시 쉬었습니다. 이제 다시 시작하는 마음으로 포스팅을 하겠습니다. 지난 포스팅까지 우리는 평균, 분산, 히스토그램, 상자그림 등을 이용하여 1차원 데이터를 정리하는 것을 연습했습니다. 즉, 영어 시험 점수 하나를 이용하.. 2024. 2. 11. [누구나 파이썬 통계분석]_Ch02.1차원 데이터 정리_시각화 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 저번 포스팅에서 우리는 도수분포표를 사용해서 데이터를 잘 파악할 수 있었습니다. 이번 포스팅에서는 데이터를 시각화하여 파악해보겠습니다. 2.4.2 히스토그램 히스토그램은 도수분포표를 막대그래프로 나타낸 것입니다. 시각화할 때 많이 사용하는 Matplotlib.. 2024. 1. 13. [누구나 파이썬 통계분석]_Ch02.1차원 데이터 정리_도수분포표 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 오늘은 데이터의 특징을 표나 그림을 통해 시각적으로 파악할 수 있는 방법 중 도수분포표에 대해 배워보겠습니다. 오늘 것을 하고 나면, 그 다음 포스팅 내용은 자연스레 따라올 것입니다! 2.4.1 도수분포표(frequency distribution) 데이터의 .. 2024. 1. 11. [누구나 파이썬 통계분석]_Ch02.1차원 데이터 정리_정규화 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 2.3 데이터의 정규화 어려운 시험에서 얻은 60점과 쉬운 시험에서 얻은 60점은 느낌이 다르죠? 수능 점수에도 쓰이는 표준점수는 시험 난이도를 고려하여 점수를 새로 산출한 것입니다. 데이터를 통일된 지표로 변환하는 것을 정규화(normalization)라고.. 2024. 1. 8. [누구나 파이썬 통계분석]_Ch02.1차원 데이터 정리_산포도 지표 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 이번 포스팅에서는 데이터의 산포도를 나타내는 지표에 대해서 살펴보겠습니다. 평균값이나 중앙값이 동일해도, 데이터의 퍼짐 정도가 다를 수 있습니다. 데이터의 퍼짐 정도를 산포도라고 합니다. 그것을 수치로 표현해보겠습니다. 2.2.1 분산과 표준편차 편차(dev.. 2024. 1. 8. [누구나 파이썬 통계분석]_Ch02. 1차원 데이터 정리_대푯값 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 데이터 불러오기 Ch02에 해당하는 데이터를 불러옵니다. 이때 student number라는 컬럼을 index로 설정합니다. english 컬럼에서 위에서부터 10번째까지의 점수를 따로 데이터프레임화 하겠습니다. import numpy as np scores.. 2024. 1. 5. [누구나 파이썬 통계분석]_Ch01. 데이터_변수에 대하여 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 질적 변수, 양적 변수 / 이산형 변수, 연속형 변수 Ch1의 주어진 data는 다음과 같습니다. 여기서 학년, 악력, 윗몸일으키기, 점수, 순위는 변수에 해당합니다. 학생번호는 원래 변수에 속했지만 제가 인덱스로 설정하였기 때문에 우선 현재 변수에서는 빼겠.. 2024. 1. 3. 이전 1 다음 반응형