반응형
데이터 유형 & 실제 예시
1. 수치형(Numerical Data)
숫자로 표현되며 크기 비교·수학 연산이 가능
(1) 연속형(Continuous)
- 값이 연속적인 범위 내에서 무한히 많음
- 예시값: 36.5 (체온), 172.4 (키 cm), 3.1415 (원주율), 65.3 (몸무게 kg), 1024.56 (계좌 잔고)
(2) 이산형(Discrete)
- 값이 정수 단위로 뚝뚝 떨어짐
- 예시값: 0 (연체 횟수), 3 (자녀 수), 42 (제품 재고 수량), 1500 (고객 수), 7 (주차 가능 대수)
2. 범주형(Categorical Data)
값이 숫자처럼 연산되지는 않고 ‘구분(label)’ 용도로만 사용
(1) 명목형(Nominal)
- 순서 없음
- 예시값: "남성", "여성", "미국", "한국", "독일", "개", "고양이"
(2) 서열형(Ordinal)
- 순서 있음
- 예시값: "상", "중", "하"
"초급", "중급", "고급"
"A등급", "B등급", "C등급"
3. 텍스트(Text Data)
자연어로 작성된 데이터
- 예시값:
"이 제품은 정말 좋습니다."
"오늘 날씨가 흐리고 비가 올 것 같습니다."
"계좌 이체가 완료되었습니다."
4. 시계열(Time-series Data)
시간 순서에 따라 기록된 값
- 예시값:
2025-08-14 09:00 → 101.5 (주가)
2025-08-14 09:01 → 101.8
2025-08-14 09:02 → 102.0
(시간과 값이 쌍으로 나옴)
5. 공간·위치(Spatial Data)
위치·지리정보
- 예시값:
위도 37.5665, 경도 126.9780 (서울 시청)
위도 40.7128, 경도 -74.0060 (뉴욕)
"도로명주소: 서울특별시 중구 세종대로 110"
6. 멀티미디어(Multimedia Data)
이미지, 오디오, 영상
- 예시값:
- 이미지: photo.png (640×480, RGB 값으로 픽셀 저장)
- 오디오: song.mp3 (샘플 값: 0.12, -0.35, 0.50…)
- 영상: video.mp4 (프레임 단위 이미지 + 오디오 신호)
7. 반정형 데이터(Semi-structured)
태그나 구조는 있으나 고정 스키마 없음
- 예시값 (JSON):
-
{ "name": "홍길동", "age": 35, "loans": ["주택담보", "자동차대출"], "credit_score": 720 }
8. 비정형 데이터(Unstructured)
구조가 없어 컴퓨터가 바로 표 형태로 읽기 어려움
- 예시값:
- 이미지 스캔된 계약서 PDF
- 유튜브 영상
- 고객 상담 음성 녹음 파일
- 손으로 쓴 메모 사진
반응형
'데이터분석' 카테고리의 다른 글
| JSON이 반정형 데이터에 속하는 이유 (11) | 2025.08.14 |
|---|---|
| 공공데이터포탈에서 오픈API 사용하는 방법 (2) (2) | 2025.08.14 |
| 공공데이터포탈에서 오픈API 사용하는 방법 (1) (3) | 2025.08.14 |
| 데이터(Data) (10) | 2025.08.14 |
| matplotlib Style sheets 지정 방법 - 시각화 (0) | 2025.08.08 |