자격증 공부/빅데이터 분석기사 필기

1. 빅데이터의 특징

망토맨 2021. 1. 27. 02:17

▶ (1) 빅데이터(Big Data) 개념

  • 막데한 양의 정형&비정형 데이터
  • 데이터로부터 가치를 추출하고 결과를 분석하는 기술의 의미로도 통용됨
  • 데이터로부터 가치를 추출하는 과정을 Ackoff, R.L이 DIKW 피라미드*로 도식화 하였음

(아래에서부터, Data 부터 순서대로 읽으세요)

 

 

- 지혜 (Wisdom) : 지식에 대한 깊은 이해를 바탕으로 도출되는 아이디어

  예) 특정 이어폰이 A마트가 더 저렴하므로 다른 물건들도 B마드보다 저렴할 것이라 예상

- 지식 (Knowledge) : 획득된 정보를 유의미한 정보로 분류하고 일반화 시킨 결과물

  예) A마트에서 특정 이어폰이 더 싸기 때문에 A마트에서 사기로 결정

- 정보 (Information) : 가공된 데이터간의 연관 관계와 함께 의미가 도출된 데이터

  예) 특정 이어폰은 A마트가 B마트보다 싸다.

- 데이터 (Data) : 객관적 사실로 가공전의 순수한 수치 및 기호

  예)  특정 이어폰의 가격이 A마트에선 5만원, B마트에선 7만원

 

 

 

 

▶ (2) 빅데이터 특징

  • 빅데이터는 전통적으로 3V(Volume, Varietu, Velocity)의 특징이 있지만 5V(Veracity, Value), 7V(Validity, Volatility)까지 확장되어지고 있다.

빅데이터의 특징

▶ (3) 빅데이터의 유형

  • 빅데이터의 유형은 데이터 구조적 관점에서 정형 / 반정형 / 비정형 데이터로 구분된다.
  • 정형 데이터(Structured Data) : 관계형 데이터베이스(RDB)와 같이 속성이 저장된 데이터
    예 ) Oracle, Spreadsheet, CSV 등..
  • 반정형 데이터(Semi-structured Data) : 데이터의 구조 정보에 대한 메타데이터를 포함하고 있는 데이터, 반정형 데이터는 정형 데이터처럼 행과 열로 구조화 되어있지는 않지만 처리를 통해 쉽게 정형화 할 수 있다.
    예 ) XML, HTML, JSON 등..
  • 비정형 데이터(Unstructured Data) : 정의된 구조가 없는 데이터, 수집데이터 각가이 데이터 객체로 구분
    예 ) Binary File, 이미지, 동영상 등..

▶ (4) 데이터 지식경영

  • 데이터 기반 지식경영의 핵심은 암묵지와 형식지의 상호작용에 있다.
  • 암묵지 : 학습과 경험을 통해 개인에게 체화되어 있는 지식  -> 공통화, 내면화를 통해 상호작용
               겉으로 드러나지 않음, 공유되기 어려움              
  • 형식지 : 문서나 메뉴얼 형태로 보관된 지식                     -> 표출화, 연결화를 통해 상호작용
               공유가 쉬움
  • 암묵지와 형식지의 상호작용에는 내면화, 공통화, 표출화 ,연결화가 있다.
  • 내면화 : 행동과 실천교육 등, 형식지가 개인의 암묵지로 체화되는 단계
  • 공통화 : 다른 사람과 상호작용을 통해 개인이 암묵지를 습득하는 단계
  • 표출화 : 개인에게 체화된 암묵지를 객관적 문서나 매체로 저장, 가공하는 과정
  • 연결화 : 형식지가 상호결합하여 새로운 형식지를 창출하는 과정

 

참고1 : 데이터의 양을 나타내는 단위

지엽적인 것을 물어볼 경우 문제로 나올 수 있으니 알고 있을 것

 

 

- 본 포스팅은 건기원의 '수제비 2021 빅데이터 분석기사 필기' 서적을 참고하여 작성하였습니다. -

문제는 힘들어서 여기에 못 쓰겠습니다.

댓글과 구독은 힘이 됩니다.