빅데이터분석기사6 데이터 분석 자격증, 한 번에 합격! 후기 풉니다. 2023년은 저의 커리어를 바꿔보고자 노력한 한 해였습니다. 가장 먼저 한 것은 자격증을 알아본 것입니다. 막연히 공부하는 것보다 눈에 보이는 성취가 있으면 제가 더 열심히 할 것 같아서 자격증을 알아본 것입니다. 가장 먼저 시작한 것이 ADsP입니다. ADsP(데이터분석 준전문가) - 37회, 2023년 5월 비전공자에, 관련 수업도 전무한 저의 첫 도전입니다. 실기 시험이 없다는 것이 가장 큰 유혹이었습니다. 약 2주간 열심히 책의 내용을 (무식하게) 외웠습니다. 제가 사용한 책은 그 유명한 '민트책'입니다. 하지만 절대 추천하지 않습니다. 내용이 부실하다 이런 개념보다는, 너무 말도 안되는 오타가 많은 것으로 보아 책의 검수를 꼼꼼하게 하지 않는 것 같더군요. 오타 갯수도 많고, 내용에 반하는 오타.. 2024. 1. 2. [빅분기실기]_작업형 1유형 까먹을 것 같은 것 정리하기!(5)_Pivot/Merge, Concat https://www.datamanim.com/dataset/99_pandas/pandasMain.html 를 참고하였습니다. 감사합니다. 익숙한 줄 알았던 Pandas를 다시 해보니 가물가물합니다. 꾸준한 노력, 연습만이 합격!을 가져올 것입니다!! 이번 시간에는 정말정말 중요한 Pivot 에 대해 연습하겠습니다. 회사원 친구에게도 들었는데, 데이터 관련 전공을 하지 않더라고 실무에 필요한 부분이라고 하더라구요. 우리 모두 화이팅!! Pivot 이런 데이터프레임입니다. Indicator 컬럼을 삭제하고 First Tooltip 컬럼에서 신뢰구간에 해당하는 표현을 지우기 df.drop('Indicator', axis=1, inplace=True) df['First Tooltip'] = df['First .. 2023. 10. 18. [빅분기실기]_작업형 1유형 까먹을 것 같은 것 정리하기!(4)_Time_Series https://www.datamanim.com/dataset/99_pandas/pandasMain.html 를 참고하였습니다. 감사합니다. 익숙한 줄 알았던 Pandas를 다시 해보니 가물가물합니다. 꾸준한 노력, 연습만이 합격!을 가져올 것입니다!! 이번 시간은 시계열 데이터(주가 데이터)를 가지고 연습하겠습니다. Time_Series Yr_Mo_Dy 컬럼을 datetime64 타입으로 변경하기 직관적인 코드! pd.to_datetime()를 사용합니다. df['Yr_Mo_Dy'] = pd.to_datetime(df['Yr_Mo_Dy']) df.info() Yr_Mo_Dy 에 존재하는 연도의 유일값을 모두 출력하기 datetime64에서 연도를 보고 싶을 땐 dt.year를 사용합니다. dt.month.. 2023. 10. 17. [빅분기실기]_작업형 1유형 까먹을 것 같은 것 정리하기!(3)_apply, map https://www.datamanim.com/dataset/99_pandas/pandasMain.html 를 참고하였습니다. 감사합니다. 익숙한 줄 알았던 Pandas를 다시 해보니 가물가물합니다. 꾸준한 노력, 연습만이 합격!을 가져올 것입니다!! APPLY, MAP apply(), map()은 모두 데이터 프레임에 함수를 적용하는 메서드입니다. 따라서 lambda와도 자주 사용합니다. apply()는 Series, 데이터프레임의 행, 열 등에 모두 사용이 가능합니다. map()은 Series에만 사용이 가능합니다. Income_Category의 카테고리를 map함수를 이용하여 다음과 같이 변경하여 newIncome 컬럼에 매핑하기 Unknown : N Less than $40K : a $40K~$6.. 2023. 10. 15. [빅분기실기]_작업형 1유형 까먹을 것 같은 것 정리하기!(2)_groupby https://www.datamanim.com/dataset/99_pandas/pandasMain.html 를 참고하였습니다. 감사합니다. 익숙한 줄 알았던 Pandas를 다시 해보니 가물가물합니다. 꾸준한 노력, 연습만이 합격!을 가져올 것입니다!! GROUPING host_name 컬럼에서 각 host_name의 빈도수를 구하고 host_name으로 정렬하여 상위 5개 출력하기 groupby('컬럼명').size() : 컬럼의 각 unique value끼리 묶어 주는 것(grouping)이 groupby()입니다. size()는 묶어준 각 group의 요소들의 count(size)를 계산하여 Series로 반환합니다. df.groupby('host_name').size().head() 또는 df.ho.. 2023. 10. 12. [빅분기실기]_작업형 1유형 까먹을 것 같은 것 정리하기!(1)_data기본처리 https://www.datamanim.com/dataset/99_pandas/pandasMain.html 를 참고하였습니다. 감사합니다. 익숙한 줄 알았던 Pandas를 다시 해보니 가물가물합니다. 꾸준한 노력, 연습만이 합격!을 가져올 것입니다!! 데이터 불러오고 파악하기 '\t'를 기준으로 구분되어 있는 데이터를 로드하기 sep = '\t' 쓰는 것 잊지 마세요!!! 구분자(separator)가 있을 경우에 사용하는 옵션입니다. import pandas as pd df = pd.read_csv('경로/데이터.csv', sep = '\t') 컬럼이 한글일 경우 encoding 옵션을 넣어줍니다. encoding = 'euc-kr' url = 'https://raw.githubusercontent.co.. 2023. 10. 11. 이전 1 다음 반응형