지도 위에 지역별 부동산 동향을 표시하자
자료의 선택과 표현
지금 하고자 하는 것을 조금씩 실현해 나가고자 한다. 매일 머리만 굴리고 기다릴 수만은 없다. 그래서 선택한 것이 자료의 선택과 표현이다. 어떤 자료를 수집하고 어떻게 표현해서 쓸모 있는 데이터를 만들지 고민해 보자.
자료의 선택
손쉽게 구할 수 있는 좋은 정보로 KB 부동산의 월별 시세가 있다. 최초 네이버나 다음의 부동산 정보를 가져오는 방법을 찾아보았다. 크롬에서 F12 눌러서 개발자 모드 들어가서 network 상에 보이는 POST 패킷의 쿼리스트링 변수와 결과 JSON 데이터를 분석하는 것도 하나의 방법이었다. 하지만 이 방법을 당장 사용하기에는 무리가 있어 보였다. 가장 큰 이유는 부동산에 대해서 내가 아는 것이 거의 없다는 것이다. 그래서 좀 더 쉽고 객관적인 데이터부터 찾아보자는 생각을 하게 되었다.
그렇게해서 찾아낸 것이 바로 KB 부동산 월별 시세였다. 해당 사이트에서 다운로드 받은 엑셀 파일을 이용하면, 시군별 매매/전세 시세 정보를 수집할 수 있다. 엑셀 그 자체만으로도 그 추이를 파악할 수 있지만, 해당 데이터를 좀 더 의미있게 볼 수 있는 방법이 있지 않을까 하는게 생각이다. 내가 하고자 하는건 우선은 시각화다. 그리고 시각화 자료를 토대로 이유를 찾는 것이다. 예를 들면 이런게 있을 수 있겠다. 특정 해에 갑자기 매매나 전세 가격이 오른다거나, 떨어진다거나, 다른 지역 대비 다른 모습을 보여준다거나 하는 그 이유를 추론하고 싶은 것이다. 그 전후로 어떤 뉴스 또는 이벤트가 있었는가 하는 것이다. 이것은 과거의 데이터일 수 있지만, 미래를 예측할 수 있는 근거이기도 하다.
표현
표현하고자 하는 방법은 지도 API 위에 정보를 한눈에 볼 수 있도록 제공하는 것이다. 다음과 같은 정보를 볼 수 있으면 좋겠다.
- 동네별 가격 현황
- 동네별 과거 시세 변화
- 해당 과거 관련 이벤트 시각화 (중요도에 따른 부각화)
어떤 동향인가?
엑셀 파일은 생각보다 내용이 많은 것 같다. 엑셀 파일만으로도 갖가지 데이터를 종합해서 볼 수 있거나 비교할 수 있다. 하지만 내가 원하는 그림은 그려지지 않는다. 아마 아실분은 아실지도 모르겠으나, 이건 예전에 입원하고 있을 때 실제로 은행 VVIP라는 고객으로부터 들은 이야기다. 보통 은행은 특히 부동산 또는 개발과 관련되어 상당히 고급 정보를 미리 가지고 있고, 그 데이터는 VVIP 고객과 공유하여 고객의 자산 관리에 잇점을 준다. 보통 개발이 시작된다고 하면, 인근 땅은 이미 모두 확보가 된 상태에서 들어가는게 그런 예라 할 수 있다.
그럼 어떤 정보가 알고 싶은걸까? 예를 들면 이런 것이다.
경기도 광명의 2011년 전세 시세는 전년대비 전세 가격이 추락하던 모습에서 급격하게 성장하는 모습을 보여준다.
왜 그럴까? 무슨 일이 있었던 것일까? (09년과 10년에 철산역, 10년 소하동에 아파트가 생겼다. 10년 10월 소하동 이마트 예정, 11년 6월 광명 코스트코 확정.. 등)
해야 할 일 요약
- 엑셀 데이터 스터디 및 DB화 → 8월
- 지도 API 선정 → 7월 (구글, 다음, 네이버)
- 지도 API를 이용한 구역별 DB화 → 8월
- 구역별 폴리곤 데이터 작성, 이건 어디 있는지 찾아볼 예정… 아마 디버깅 하면 찾을 수 있을것 같다. 어딘가는 있겠지…
- 없으면 폴리곤 데이터 작성을 위한 에디터 만들 수 있으나… 최악의 경우임
- 선택 기간에 따른 구역별 매매, 전세 동향 또는 가격 차별화 시각화 표시
- 지역별, 기간별 발생한 사건을 기록하여 가중치를 부여하여 표시 (javascript timeline 관련 스터디 필요) → 이게 핵심인듯
다음 포스팅 내용
- 엑셀 데이터 분석
- DB화
- 이후 : 지도 API에 몇개 지역에 대한 폴리곤에 데이터 시각화 표현