Bit : 데이터 구성의 최소단위 0과 1
1Byte = 8Bit
1KB = 1000Byte
1MB = 1000KB
1GB = 1000MB
1TB = 1000GB
1PB = 1000TB
1EB = 1000PB
1ZB = 1000EB
1YB = 1000ZB
데이터의 특성
- 객관적 사실로의 개별 데이터는 중요하지 않다.
존재적 특성 : 있는 그대로의 객관적 사실
당위적 특성 : 추론,예측,전망,추정을 위한 근거
데이터의 유형
정성적 데이터: 언어, 문자 등
정량적 데이터: 수치,기호,도형 등
정형데이터
- 고정된 틀이 있으며 연산이 가능
표(테이블) 로 저장되어있는 것
비정형데이터
- 고정된 틀이 없으며 연산이 불가능
영상, 음성 등
반정형데이터
고정된 틀을 가지고 있지만 연산이 불가능
<HTML> 처럼 꺽쇠기호가 있어 고정된 틀은 있으나 연산이 불가능
암묵지
개인에게 습득되어 있지만 외부로 표출되지 않은 지식
형식지
유형의 대상이 있고 문서처럼 공유할 수 있는 지식
암묵지 > (표출화) > 형식지 > (연결화) > (내면화) > (공통화) > 암묵지
DIKW 피라미드
데이터(Data): 타 데이터와는 상관없는 순수한 수치나 기호
정보(Information): 데이터를 가공하고 상관관계간 이해를 통해 의미를 부여
지식(Knowledge): 패턴을 이해하여 추론한 것
지혜(Wisdom): 근본 원리에 대한 이해를 바탕으로 도출되는 아이디어(예측)
DB System
DB: 정보의 집합체
DBMS: DB 를 관리하는 프로그램(메모장, 한글,워드 등)
* 오라클, MySQL 등 도 DBMS
데이터베이스의 종류
관계형 데이터베이스(RDB) = 표(Table)
- 데이터를 행과 열로 표 형식으로 저장
- SQL을 사용하여 조작, 검색
- Oracle, MySQL, Postgresql 등
비관계형 데이터베이스(NoSQL)
- "Not Only SQL" 또는 "Non-SQL" 의 약자
- 표 형식이 아니라 다른 형태로 데이터를 저장
- 비정형 데이터와 대용량 데이터 분석 및 분산처리에 용이
데이터베이스의 일반적인 특징
통합된 데이터: 동일한 내용의 데이터가 중복되어 있지 않다.
저장된 데이터: 컴퓨터 기술을 바탕으로 저장 매체에 저장되는 것
공용 데이터: 다수의 사용자가 데이터를 이용한다는 것
변화되는 데이터: 데이터의 삽입,삭제,갱신으로 변화해도 정확한 데이터 상태를 유지
데이터베이스의 다양한 측면에서의 특징
정보의 축적 및 전달 측면(기계)
- 기계가독성, 검색가능성, 원격조작성
정보 이용 측면(사용)
- 신속하고, 정확하고 경제적으로 찾아낼 수 있다.
정보 관리 측면(데이터 관리)
- 데이터를 정리,저장,검색,관리할 수 있도록 대량의 정보를 관리
정보기술 발전의 측면
- 네트워크 기술 발전
경제,산업적 측면
- 인프라
기업내부 데이터베이스
OLTP: 정보시스템
- 트랜잭션 단위로 처리
- 데이터 갱신(수정), 조회 위주
OLAP: 분석 중심의 시스템
- 모아둔 데이터에 초점
- 데이터를 분석
CRM: 고객관계 관리
SCM: 공급망 관리
ERP: 기업이 보유한 자원을 효율적인 활용과 분배를 위한 목적(경영 자원 통합관리 )
BI: 기업 의사결정 프로세스
RTE: 업무 프로세스 중 발생하는 정보에 신속한 대응을 하기 위한 목적
사회기반구조로서의 데이터베이스
물류부문
- '실시간 차량 추적'을 위한 종합물류정보망 구축
지리부문
- GIS: 지리정보시스템
- GPS: 범지구위치결정시스템
-교통부분
- ITS: 지능형교통시스템
의료부문
- 의료정보시스템
교육부문
- NEIS: 교육행정정보시스템
'ADsP 내용 정리' 카테고리의 다른 글
데이터 전처리 (0) | 2024.04.01 |
---|---|
R을 활용한 분석 실습 (0) | 2024.04.01 |
분석 마스터플랜 (0) | 2024.04.01 |
데이터 분석 기획 (0) | 2024.04.01 |
데이터의 가치와 미래 (0) | 2024.04.01 |