영화 마이너리티 리포트 한번보기!
분류 Classfication
데이터분석은 인문학적 소양이 매우 필요하다.
기술로만은 불가능 하다.
암이었다가 암이 아닌 모델이 훨씬 더 좋은 모델이라고 한다.
1. 각 데이터의 표준화 필요
2. 분류의 결과가 악성이나 양성
id값이 필요한 이유 A란 사람의 생활패턴이 필요
2~4 = 1~ 10
0.2 -0.2 0.4-0.2 0.4-0.3
------ 0 ------ 1 ------ 0.5
0.4-0.2 0.4-0.2 0.4-0.2
최대값 -a a - 최대값
--------- 현 위치 ---------
최대값-최소값 최대값 - 최소값
2 - 5 -3 5-1 4
---- ---- ---- ---
2 - 1 1 2-1 1
0.4-0.3 0.1 0.3-0.2 -0.2
--- -- ------ ----
0.4-0.2 0.2 0.4-0.2 0.2
(max(x) -min(x)) - (max(x)-x)
-------------------------
max(x) - min(x)
군집 분석 (Cluster Analysis)
그룹으로 묶어서
다수의 대상(소비자, 제품, 기타)들 그들이 소유하는 특성을 토대로 유사한 대상들끼리 그룹핑
군집내의 구성원들은 가그벅 유사하게, 군집들간에는 가그벅 상이하게 대상을 그룹핑
시장세분화, 유사브랜드 그룹핑 -> 어느 브랜드와 직접적 경쟁관계에 있는지 알 수 있음
k-means 군집화
--
--