본문 바로가기

빅데이터/따릉이

떠오르는 소형 모빌리티 [따릉이] -따릉이(1)

여러분 다 [따릉이] 이용해 보셨나요? 

다들 아시겠지만 혹시 모르시는 분들을 위해 설명드릴게요ㅎㅎ

[따릉이]는

"서울시가 친환경 교통수단인 자전거 이용의 활성화를 통해 시민건강 증진을 실현하고, 대기질 개선 효과를 유도하기 위해 서울시가 실시하고 있는 자전거 대여제도"

라고 합니다 ㅎㅎ

 

요즘 소형 모빌리티 서비스가 다양하게 출시되면서 많은 기대를 받고 있는데 그 중 가장 대표격인 따릉이에 대해 조사를 하면서 좀 더 편하고 유동적으로 직장과 집을 오갈 수 있게 될까? 라는 궁금증과 약간의 기대를 가지면서 분석을 해보게 됬습니다ㅎㅎ


따릉이를 키워드로  검색했을 때  뉴스들입니다.

따릉이 서비스가 출시한지 벌써 5년차인데 연간 두배이상씩 사용량이 늘어나면서 2019년에는 벌써  대여건수 3000만 건 돌파했다고 합니다또한, 서울시는 따릉이  운영 확대에 대한 계획을 발표 했다고 합니다.

기사내용을 한번 읽어드리면, 

2015150개 대여소와 2,000여 대의 따릉이를 도입한 이래, 20194월 기준 1,540개 대여소에서 20,000여 대의 따릉이를 운영하고 있다. 2015~2018년까지 구축비(자전거 구매+대여소 설치) 310, 운영비 약 227억이 소요되었다.

서울시는 20193만대 운영을 목표로 약 885천여만원을 들여 1만여 대의 따릉이를 추가 구매할 예정이다. 대여소 600여개 확충 예산 339천만 원도 계획되어 있다.

 

하지만 그에 반면따릉이 운영 확대에 대한 우려의 목소리도 있는데요.

 따릉이’가 최소한의 안전도 확보되지 못한 상태에서 다수의 시민들이 위험하게 이용하고 있다는 겁니다.

 “공공자전거의 이용을 장려하려면 안전하게 탈 수 있는 최소한의 환경을 확보해줘야 한다 ”고 주장했다고 합니다.

과연 대체 교통 수단이 될 수 있을지 계속해서 살펴보겠습니다


제가 얻은 데이터들은 다 공공데이터입니다.

서울 열린데이터 광장에서 대부분 데이터를 얻었고 좀더 들어가서 서울시를 지역구별 지도 데이터로 시각화 하면 좋을 것 같아 naver reverse geocoding을 함께 이용하였습니다

 

먼저 정리한 데이터셋을 보여드리겠습니다

대여소번호 : 서울시 따릉이 대여소의 고유번호

대여소명 : 대여소의 고유이름

대여구분코드 : 대여의 종류입니다. 대부분은 정기권을 이용해서 할인을 받으시는걸로 알고있습니다

연령대코드는 10대이하는 10대로 , 60대 이상은 60대로 구분하였습니다

구분: 대여소가 속해있는 행정구역상의 구이름

동 : 대여소가 속해있는 행정구역상의 동이름

time, month :  시간대별 , 월별 이용량을 보기위해 date에서 추출했습니다

 

다음으로

temp : temperature 

미세먼지와 초미세먼지는 2018년에 변경된 등급을 기준으로 했습니다

rain과 snow는 각각 강우량 , 강설량 입니다

기준은 제가 정하였습니다.

# 강설 기준
- 0: 눈 x
- 1: 눈 소량 (2미만)
- 2 :눈 적당히 (2~5)
- 3 :눈 많이 (5~)

# 강우 기준
- 0: 비 x
- 1: 눈 소량 (5미만)
- 2 :눈 적당히 (5~10)
- 3 :눈 많이 (10~)

workingday와 towork 입니다 

workingday 는 평일,주말 구분이고 towork는 평일오전출근시간 or 평일오후퇴근시간 입니다

# workingday
0 : Saturday, Sunday
1 : Monday ~ Friday
    
# towork
0: 평일 오전10시부터 18시전까지 이용시
1: 오전 7시부터 오전 10시까지 or 오후 18시부터 오후 21시까지 이용시
important.loc[(important['workingday']==1)&((important['time']>=7)&(important['time']<=10)),'towork']=1  #평일 출근시간(3h)
important.loc[(important['workingday']==1)&((important['time']>=18)&(important['time']<=21)),'towork']=1  #평일 퇴근시간(3H)

다음 포스팅부터 시각화를 통해 변수별로 살펴보겠습니다.