본문 바로가기
프로그래밍/하루하루

빅데이터 3

by Luhie 2017. 7. 26.

하삼각 / 상삼각 행렬들 예

빅데이터에 꼭 필요한것 정수론 


apply()군 함수


리스트

서로 다른 데이터 형의 집합을 정의할 필요가 있을 때 사용할 수 있는 데이터 객체

벡터가 서로 같은 데이터 형으로 구성된다면, 리스트는 서로다른 데이터 형으로 구성된 객체


unlist()

lapply()

sapply()



데이터 프레임


데이터마이닝 ? 통계에서는 기본적으로 유의미한 시점을 지나가면 데이터를 버린다

데이터 에선 버리지 않는다 하지만 관련된 의미가 없으면 그때 버리지 미리 버리진 않는다


연관규칙(Association Rule)

임의 데이터에서 어떤 데이터의 발생을 예측하는 규칙

데이터 간의 연관성 및 상관관계를 표한하는 규칙

A -> B (A와 B는 데이터의 부분집합)

A를  left-hand-side, B를 right-hand-side라 지칭

적용분야

백화점이나 수퍼마켓에서의 소비자 구매 행태 분석

관계형 데이터베이스 시스템에서 연관 규칙 탐사

WWW등에서 사용자 접근 패턴 분석




support A와 B를 모두 포함하는 경우의 확률

Confidence A를 포함하는 경우에 B를 포함한 경우의 확률

데이터 마이닝을 태동시켰다 -> 없었으면 분석이 어렵다. 왜 ? 통계는 반복 (버려지는게 없다) 

마이닝 툴을 사용하면 내가 원하는 것만 컨트롤 할 수 있다.

토정비결은 -> 통계적 수치 순수하게!

연관규칙을 사람에 붙이면 ~~? 좋아하는 스타일이 항상 같다 


연관규칙 : 연관검색어/무언가 있으면 비가온다/옆사람의 이름이 기억안나면 옆사람을 연관하여/송준기 -> 송혜교/송혜교->


송준기


연관검색으로 가장 피해보는사람 -> 연예인?


csv csv 각각의 컴마로 구조화 되어있는 파일 txt파일은 구조화 X


데이터 분석

read.transaction()

파일로부터 트랜잭션 형태로 로딩하는 함수

read.transaction(file="파일명", format="basket | single", seq="구분자"

Arules 패키지 내에서 데이터는 트랜잭션으로 처리하는데 read.transaction()을 사용하여 파일로부터 트랜잭션 형태로 데이터를 로딩

Inspect()

트랜잭션 데이터의 내용을 출력하는 함수

apriori()



분석 !!!!!!!!!


'프로그래밍 > 하루하루' 카테고리의 다른 글

빅데이터 4  (0) 2017.07.27
빅데이터 2  (2) 2017.07.25
데이터베이스 1  (0) 2017.07.24