본문 바로가기
데이터분석

데이터(Data)의 유형과 예시

by 데이터찻집 2025. 8. 14.
반응형

데이터 유형 & 실제 예시

1. 수치형(Numerical Data)

숫자로 표현되며 크기 비교·수학 연산이 가능

(1) 연속형(Continuous)

  • 값이 연속적인 범위 내에서 무한히 많음
  • 예시값: 36.5 (체온), 172.4 (키 cm), 3.1415 (원주율), 65.3 (몸무게 kg), 1024.56 (계좌 잔고)

(2) 이산형(Discrete)

  • 값이 정수 단위로 뚝뚝 떨어짐
  • 예시값: 0 (연체 횟수), 3 (자녀 수), 42 (제품 재고 수량), 1500 (고객 수), 7 (주차 가능 대수)

 

2. 범주형(Categorical Data)

값이 숫자처럼 연산되지는 않고 ‘구분(label)’ 용도로만 사용

(1) 명목형(Nominal)

  • 순서 없음
  • 예시값: "남성", "여성", "미국", "한국", "독일", "개", "고양이"

(2) 서열형(Ordinal)

  • 순서 있음
  • 예시값: "상", "중", "하"
    "초급", "중급", "고급"
    "A등급", "B등급", "C등급"

 

3. 텍스트(Text Data)

자연어로 작성된 데이터

  • 예시값:
    "이 제품은 정말 좋습니다."
    "오늘 날씨가 흐리고 비가 올 것 같습니다."
    "계좌 이체가 완료되었습니다."

 

4. 시계열(Time-series Data)

시간 순서에 따라 기록된 값

  • 예시값:
    2025-08-14 09:00 → 101.5 (주가)
    2025-08-14 09:01 → 101.8
    2025-08-14 09:02 → 102.0
    (시간과 값이 쌍으로 나옴)

 

5. 공간·위치(Spatial Data)

위치·지리정보

  • 예시값:
    위도 37.5665, 경도 126.9780 (서울 시청)
    위도 40.7128, 경도 -74.0060 (뉴욕)
    "도로명주소: 서울특별시 중구 세종대로 110"

 

6. 멀티미디어(Multimedia Data)

이미지, 오디오, 영상

  • 예시값:
    • 이미지: photo.png (640×480, RGB 값으로 픽셀 저장)
    • 오디오: song.mp3 (샘플 값: 0.12, -0.35, 0.50…)
    • 영상: video.mp4 (프레임 단위 이미지 + 오디오 신호)

 

7. 반정형 데이터(Semi-structured)

태그나 구조는 있으나 고정 스키마 없음

  • 예시값 (JSON):
  •  
    { "name": "홍길동", "age": 35, "loans": ["주택담보", "자동차대출"], "credit_score": 720 }

 

8. 비정형 데이터(Unstructured)

구조가 없어 컴퓨터가 바로 표 형태로 읽기 어려움

  • 예시값:
    • 이미지 스캔된 계약서 PDF
    • 유튜브 영상
    • 고객 상담 음성 녹음 파일
    • 손으로 쓴 메모 사진
반응형