• 빅데이터의 크기

    • 테라바이트를 넘어 페타(10^15) 정도의 크기
  • IDC(Industrial Development Corporation)의 정의

    • 방대한 데이터 → 고속 캐처, 데이터 탐색 분석 → 경제적 가치 추출 할 수 있도록 디자인된 기술
    • IDC는 2025년 빅데이터의 규모가 163ZB가 될 것이라 전망
  • 빅데이터의 3대 요소란?

    : 3V, Volume 양 / Velocity 속도 / Variety 종류 + Value 가치 / Veracity 진실성

  • Hadoop & Spark 와 같은 오픈 소스 프레임워크의 개발은 빅데이터의 성장에 도움을 주었다

  • Oracle의 경우 빅 데이터 사용 사례

    : 제품 개발 / 예측적 유지 보수 / 고객 경험

  • 빅데이터의 과제들

    • 데이터를 저장하는 것만으로는 충분 X, 가치있게 사용되어야 함. 데이터 과학자가 집중하고 있는 것?

      → **큐레이션(정제 데이터 확보)**에 따라 결정

  • 빅데이터의 가장 큰 이점

    : 비정형 데이터(텍스트, 음성, 이미지, 동영상)를 정형 데이터(정수, 실수)에 따라 조정할 수 있다는 점

  • 빅데이터 처리 기술

    • 자료관리 기술
      • 오픈소스 Hadoop
    • 자료분석 기술
      • 통계학
      • 기계학습
      • 인공신경망
      • 데이터 마이닝
    • 자료표현 기술
      • R 프로그래밍
  • 자라 → 다품종 소량생산 / 재고 최적 분배 시스템