전체 글 562

1장 / 분석 모형 설계

1. 분석 모형 선정 (1) 통계 기반 분석 - 기술통계분석 개요 가장 기초적인 분석 방법으로, 주어진 데이터의 특성을 요약하고 집계하는 것을 의미 데이터를 분석하기에 앞서 데이터에 대한 통계적 수치를 탐색 기본적으로 사분위값, 평균, 최솟값, 최댓값 등의 통계 결과를 반환 자료의 형태에 따라 반환되는 통계 결과가 달라짐 자료의 형태는 질적 척도와 양적 척도로 구분 질적 척도에는 명목 & 서열 척도 양적 척도에는 등간 & 비율 척도 EDA(탐색적 자료 분석) 시각화와 기술동계를 통해서 데이터를 이해하는 단계 독립변수와 종속변수 독립변수는 입력값이나 원인이 되는 변수로써 설명변수, 실험변수, 예측변수, 통제변수, 조작변수 등으로 불림 종속변수는 결과물이나 효과를 나타내는 것 종속변수 = 결과변수, 반응변수..

팀 프로젝트 1 주차(2021.3.16~19)

프로젝트 배경 YGL에서 처음으로 팀프로젝트를 진행하였는데, 저희 조는 소셜미디어를 활용한 상권예측이라는 주제로 SNS를 바탕으로 웹크롤링과 공공데이터를 활용하여 지역상권분석에 초점을 맞춘 프로젝트를 진행하려고 한다. 프로젝트 목표 우선 소셜미디어에서 웹크롤링을 진행하고, 부동산 공공데이터를 국토교통부, 서울시 사이트에서 수집하여 활용하고 앞으로 주목받을 상권 지역을 예측하여 부동산 상권 투자를 좀 더 효율적으로 할 수 있게 하는데 중점을 두었다. 절차 첫날인 만큼 먼저 각 역할별로 sns 웹크롤링(유튜브, 인스타그램), 공공데이터 자료수집(공시지가, 공실률, 거래내역, 임대차내역 등)의 역할을 나누어서 데이터간 상관관계를 찾는것을 우선적으로 실습한다. 요약 소셜 미디어의 내용을 통해서 해당 상권이 앞으..

project(OpenCV) 2021.03.16