본문 바로가기

Python30

[누구나 파이썬 통계분석]_Ch03. 2차원 데이터 정리_상관성 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 짧고도 긴 여행을 다녀오느라 블로그를 잠시 쉬었습니다. 이제 다시 시작하는 마음으로 포스팅을 하겠습니다. 지난 포스팅까지 우리는 평균, 분산, 히스토그램, 상자그림 등을 이용하여 1차원 데이터를 정리하는 것을 연습했습니다. 즉, 영어 시험 점수 하나를 이용하.. 2024. 2. 11.
[누구나 파이썬 통계분석]_Ch02.1차원 데이터 정리_시각화 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 저번 포스팅에서 우리는 도수분포표를 사용해서 데이터를 잘 파악할 수 있었습니다. 이번 포스팅에서는 데이터를 시각화하여 파악해보겠습니다. 2.4.2 히스토그램 히스토그램은 도수분포표를 막대그래프로 나타낸 것입니다. 시각화할 때 많이 사용하는 Matplotlib.. 2024. 1. 13.
[누구나 파이썬 통계분석]_Ch02.1차원 데이터 정리_도수분포표 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 오늘은 데이터의 특징을 표나 그림을 통해 시각적으로 파악할 수 있는 방법 중 도수분포표에 대해 배워보겠습니다. 오늘 것을 하고 나면, 그 다음 포스팅 내용은 자연스레 따라올 것입니다! 2.4.1 도수분포표(frequency distribution) 데이터의 .. 2024. 1. 11.
[누구나 파이썬 통계분석]_Ch02.1차원 데이터 정리_정규화 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 2.3 데이터의 정규화 어려운 시험에서 얻은 60점과 쉬운 시험에서 얻은 60점은 느낌이 다르죠? 수능 점수에도 쓰이는 표준점수는 시험 난이도를 고려하여 점수를 새로 산출한 것입니다. 데이터를 통일된 지표로 변환하는 것을 정규화(normalization)라고.. 2024. 1. 8.
[누구나 파이썬 통계분석]_Ch02.1차원 데이터 정리_산포도 지표 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 이번 포스팅에서는 데이터의 산포도를 나타내는 지표에 대해서 살펴보겠습니다. 평균값이나 중앙값이 동일해도, 데이터의 퍼짐 정도가 다를 수 있습니다. 데이터의 퍼짐 정도를 산포도라고 합니다. 그것을 수치로 표현해보겠습니다. 2.2.1 분산과 표준편차 편차(dev.. 2024. 1. 8.
[누구나 파이썬 통계분석]_Ch02. 1차원 데이터 정리_대푯값 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 데이터 불러오기 Ch02에 해당하는 데이터를 불러옵니다. 이때 student number라는 컬럼을 index로 설정합니다. english 컬럼에서 위에서부터 10번째까지의 점수를 따로 데이터프레임화 하겠습니다. import numpy as np scores.. 2024. 1. 5.
[누구나 파이썬 통계분석]_Ch01. 데이터_변수에 대하여 파이썬으로 간단하게 통계 내용을 공부해보아요. 오늘부터 열심히 달려보겠습니다. 포스팅은 타니아이 히로키님의 '누구나 파이썬 통계 분석' 책의 내용을 실습한 것입니다. 감사합니다. 소스코드와 데이터는 아래의 웹페이지에 공개되어 있습니다. - 한빛출판네트워크(https://www.hanbit.co.kr/support/supplement_list.html) - 깃허브(https://github.com/ghmagazine/python_stat_sample) 질적 변수, 양적 변수 / 이산형 변수, 연속형 변수 Ch1의 주어진 data는 다음과 같습니다. 여기서 학년, 악력, 윗몸일으키기, 점수, 순위는 변수에 해당합니다. 학생번호는 원래 변수에 속했지만 제가 인덱스로 설정하였기 때문에 우선 현재 변수에서는 빼겠.. 2024. 1. 3.
[빅분기실기]_작업형 1유형 까먹을 것 같은 것 정리하기!(5)_Pivot/Merge, Concat https://www.datamanim.com/dataset/99_pandas/pandasMain.html 를 참고하였습니다. 감사합니다. 익숙한 줄 알았던 Pandas를 다시 해보니 가물가물합니다. 꾸준한 노력, 연습만이 합격!을 가져올 것입니다!! 이번 시간에는 정말정말 중요한 Pivot 에 대해 연습하겠습니다. 회사원 친구에게도 들었는데, 데이터 관련 전공을 하지 않더라고 실무에 필요한 부분이라고 하더라구요. 우리 모두 화이팅!! Pivot 이런 데이터프레임입니다. Indicator 컬럼을 삭제하고 First Tooltip 컬럼에서 신뢰구간에 해당하는 표현을 지우기 df.drop('Indicator', axis=1, inplace=True) df['First Tooltip'] = df['First .. 2023. 10. 18.
[빅분기실기]_작업형 1유형 까먹을 것 같은 것 정리하기!(4)_Time_Series https://www.datamanim.com/dataset/99_pandas/pandasMain.html 를 참고하였습니다. 감사합니다. 익숙한 줄 알았던 Pandas를 다시 해보니 가물가물합니다. 꾸준한 노력, 연습만이 합격!을 가져올 것입니다!! 이번 시간은 시계열 데이터(주가 데이터)를 가지고 연습하겠습니다. Time_Series Yr_Mo_Dy 컬럼을 datetime64 타입으로 변경하기 직관적인 코드! pd.to_datetime()를 사용합니다. df['Yr_Mo_Dy'] = pd.to_datetime(df['Yr_Mo_Dy']) df.info() Yr_Mo_Dy 에 존재하는 연도의 유일값을 모두 출력하기 datetime64에서 연도를 보고 싶을 땐 dt.year를 사용합니다. dt.month.. 2023. 10. 17.
[빅분기실기]_작업형 1유형 까먹을 것 같은 것 정리하기!(3)_apply, map https://www.datamanim.com/dataset/99_pandas/pandasMain.html 를 참고하였습니다. 감사합니다. 익숙한 줄 알았던 Pandas를 다시 해보니 가물가물합니다. 꾸준한 노력, 연습만이 합격!을 가져올 것입니다!! APPLY, MAP apply(), map()은 모두 데이터 프레임에 함수를 적용하는 메서드입니다. 따라서 lambda와도 자주 사용합니다. apply()는 Series, 데이터프레임의 행, 열 등에 모두 사용이 가능합니다. map()은 Series에만 사용이 가능합니다. Income_Category의 카테고리를 map함수를 이용하여 다음과 같이 변경하여 newIncome 컬럼에 매핑하기 Unknown : N Less than $40K : a $40K~$6.. 2023. 10. 15.
반응형