DataAnalysis-with-Python

다양한 공개된 데이터셋을 파이썬과 여러 오픈소스들을 사용하여 분석해본다.


See More

DataAnalysis-with-Python

‘파이썬으로 데이터 주무르기’라는 책을 참고하여 다양한 데이터들을 파이썬으로 직접 분석해 본다.

1. 서울시 자치구별 노인 복지수준 분석 [main code]

서울시 구별 노인복지시설과 노인인구수 데이터를 비교하여 상관관계를 비교해보고 구별 복지수준을 분석해 본다.

png

2. 서울시 공공자전거 대여소별 이용 분석(2018) [main code]

서울시 공공자전거데이터를 이용하여 대여소별 이용건수와 시간대별 이용건수를 알아보기 쉽게 지도에 직접 나타내보고 그림으로 나타내 보면서 시각화하여 경향을 분석해본다.

png png

3. LOL 플레이어 data 분석 [main code]

사용자의 LOL플레이 데이터가 있는 OP.GG에서 사용자의 게임플레이 데이터를 가져와 아이디를 입력하면 최근 100경기의 경향을 분석해주는 프로그램을 만든다.

OP.GG가 크롤링을 방지하기위해 주기적으로 코드를 변경하여 작동되지 않을 수 있음.

png

4. 에브리타임에서 공과대학 강좌목록 가져오기 [main code]

학교의 모든 강좌목록이 있는 에브리타임에서 selenium으로 자동으로 클릭하여 공과대학내의 모든 수강과목을 과별로 나눠서 .xls형태로 저장한다.

에브리타임이 크롤링을 방지하기위해 주기적으로 코드를 변경하여 작동되지 않을 수 있음.

png

5. 기차역간 수송량 분석 및 마케팅 활용 방안 [main code]

2016년 기차역간 수송량 데이터를 Lucypark님이 만드신 catogram을 이용하여 시각화하여 기차역사이에 수송량을 알아보기 쉽게 나타낸다.

png

6. 한국전력거래소 17년간 발전실적 분석및 예측 [main code]

2001년부터 2017년까지의 한국전력거래소의 발전실적을 시계열데이터로 나타내어 요일, 월, 년도별로 경향을 분석해보고 fbprophet을 이용하여 1년간 데이터를 예측해본다.

png

7. 백종원의 더본코리아 브랜드별 소비자 인식 조사 [main code]

naver api를 사용해서 네이버 블로그에서 더본코리아의 11개의 브랜드들이 어떤 키워드로 많이 언급되는지 조사하여 자연어처리 후 wordcloud로 나타내고 키워드들을 분석해본다.

png

8. 원자재가격과 주가의 관계 분석 [main code]

각종 원자재 가격과 주가의 상관관계를 알아보기위해 5년간 KOSPI 주가의 등락과 원자재가격의 등락을 비교하고 해당기업과 원자재 간의 관계를 해석해 보았다.

png

9. 머신러닝으로 FIFA 19 선수 포지션 예측하기 [main code]

다양한 머신러닝 알고리즘을 사용하여 FIFA 19데이터의 포지션을 예측해본다.

png

10. 머신러닝으로 타이타닉 생존자 예측하기 [main code]

타이타닉 생존자 데이터를 분석하며 Decision tree 와 Randomforest 비교해 본다.

png

2019


© 2020. All rights reserved.