▶ (1) 빅데이터(Big Data) 개념
- 막데한 양의 정형&비정형 데이터
- 데이터로부터 가치를 추출하고 결과를 분석하는 기술의 의미로도 통용됨
- 데이터로부터 가치를 추출하는 과정을 Ackoff, R.L이 DIKW 피라미드*로 도식화 하였음
(아래에서부터, Data 부터 순서대로 읽으세요)
- 지혜 (Wisdom) : 지식에 대한 깊은 이해를 바탕으로 도출되는 아이디어
예) 특정 이어폰이 A마트가 더 저렴하므로 다른 물건들도 B마드보다 저렴할 것이라 예상
- 지식 (Knowledge) : 획득된 정보를 유의미한 정보로 분류하고 일반화 시킨 결과물
예) A마트에서 특정 이어폰이 더 싸기 때문에 A마트에서 사기로 결정
- 정보 (Information) : 가공된 데이터간의 연관 관계와 함께 의미가 도출된 데이터
예) 특정 이어폰은 A마트가 B마트보다 싸다.
- 데이터 (Data) : 객관적 사실로 가공전의 순수한 수치 및 기호
예) 특정 이어폰의 가격이 A마트에선 5만원, B마트에선 7만원
▶ (2) 빅데이터 특징
- 빅데이터는 전통적으로 3V(Volume, Varietu, Velocity)의 특징이 있지만 5V(Veracity, Value), 7V(Validity, Volatility)까지 확장되어지고 있다.
▶ (3) 빅데이터의 유형
- 빅데이터의 유형은 데이터 구조적 관점에서 정형 / 반정형 / 비정형 데이터로 구분된다.
- 정형 데이터(Structured Data) : 관계형 데이터베이스(RDB)와 같이 속성이 저장된 데이터
예 ) Oracle, Spreadsheet, CSV 등.. - 반정형 데이터(Semi-structured Data) : 데이터의 구조 정보에 대한 메타데이터를 포함하고 있는 데이터, 반정형 데이터는 정형 데이터처럼 행과 열로 구조화 되어있지는 않지만 처리를 통해 쉽게 정형화 할 수 있다.
예 ) XML, HTML, JSON 등.. - 비정형 데이터(Unstructured Data) : 정의된 구조가 없는 데이터, 수집데이터 각가이 데이터 객체로 구분
예 ) Binary File, 이미지, 동영상 등..
▶ (4) 데이터 지식경영
- 데이터 기반 지식경영의 핵심은 암묵지와 형식지의 상호작용에 있다.
- 암묵지 : 학습과 경험을 통해 개인에게 체화되어 있는 지식 -> 공통화, 내면화를 통해 상호작용
겉으로 드러나지 않음, 공유되기 어려움 - 형식지 : 문서나 메뉴얼 형태로 보관된 지식 -> 표출화, 연결화를 통해 상호작용
공유가 쉬움 - 암묵지와 형식지의 상호작용에는 내면화, 공통화, 표출화 ,연결화가 있다.
- 내면화 : 행동과 실천교육 등, 형식지가 개인의 암묵지로 체화되는 단계
- 공통화 : 다른 사람과 상호작용을 통해 개인이 암묵지를 습득하는 단계
- 표출화 : 개인에게 체화된 암묵지를 객관적 문서나 매체로 저장, 가공하는 과정
- 연결화 : 형식지가 상호결합하여 새로운 형식지를 창출하는 과정
▶ 참고1 : 데이터의 양을 나타내는 단위
지엽적인 것을 물어볼 경우 문제로 나올 수 있으니 알고 있을 것
- 본 포스팅은 건기원의 '수제비 2021 빅데이터 분석기사 필기' 서적을 참고하여 작성하였습니다. -
문제는 힘들어서 여기에 못 쓰겠습니다.
댓글과 구독은 힘이 됩니다.
'자격증 공부 > 빅데이터 분석기사 필기' 카테고리의 다른 글
[데이터 전처리] 데이터 결측값(Data Missing Value)과 데이터 이상값(Data Outlier) 개념 (1) | 2023.05.16 |
---|---|
[데이터 전처리] 데이터 정제(Data Cleansing)와 데이터 세분화(Data Segmentation) (6) | 2022.04.29 |
빅데이터 분석기사 일정 & 데이터 분석 전문가 시험 일정(2022년도) (4) | 2021.12.29 |
빅데이터 분석기사 필기 과목 (빅데이터 분석기사 정보) (0) | 2021.01.26 |
빅데이터 분석기사란? / 2021 빅데이터 분석기사 시험 일정 (0) | 2021.01.25 |