본문 바로가기
프로그래밍/하루하루

빅데이터 5

by Luhie 2017. 7. 28.

BigData.7z



영화 마이너리티 리포트 한번보기!


분류 Classfication


데이터분석은 인문학적 소양이 매우 필요하다.

기술로만은 불가능 하다. 

암이었다가 암이 아닌 모델이 훨씬 더 좋은 모델이라고 한다. 


1. 각 데이터의 표준화 필요

2. 분류의 결과가 악성이나 양성

id값이 필요한 이유 A란 사람의 생활패턴이 필요




2~4 = 1~ 10


0.2 -0.2 0.4-0.2 0.4-0.3

------ 0 ------ 1 ------ 0.5

0.4-0.2 0.4-0.2 0.4-0.2



최대값 -a a - 최대값

--------- 현 위치 ---------

최대값-최소값 최대값 - 최소값


2 - 5 -3 5-1 4

---- ---- ---- ---

2 - 1    1 2-1 1



0.4-0.3 0.1 0.3-0.2 -0.2

--- -- ------ ----

0.4-0.2 0.2 0.4-0.2 0.2



(max(x) -min(x)) - (max(x)-x)

-------------------------

max(x) - min(x)



군집 분석 (Cluster Analysis)

그룹으로 묶어서 

다수의 대상(소비자, 제품, 기타)들 그들이 소유하는 특성을 토대로 유사한 대상들끼리 그룹핑

군집내의 구성원들은 가그벅 유사하게, 군집들간에는 가그벅 상이하게 대상을 그룹핑


시장세분화, 유사브랜드 그룹핑 -> 어느 브랜드와 직접적 경쟁관계에 있는지 알 수 있음


k-means 군집화

--

--



'프로그래밍 > 하루하루' 카테고리의 다른 글

빅데이터 4  (0) 2017.07.27
빅데이터 3  (0) 2017.07.26
빅데이터 2  (2) 2017.07.25