반응형
반응형
빅데이터 처리과정과 요소기술 데이터 (생성) 데이터베이스나 파일 관리 시스템과 같은 내부 데이터 존재 인터넷으로 연결도니 외부로부터 생성된 파일이나 데이터 존재 수집 크롤링을 통해 데이터 원천으로부터 데이터 검색하여 수집 크롤링(Crawling) : 웹사이트 등 외부에 저장되어 있는 정보자원을 자동화된 방법으로 수집, 분류, 저장하는 것 ETL(추출, 정제, 가공)을 통해 소스 데이터로부터 추출, 변환, 적재 단순한 수집이 아니라 검색 및 수집, 변환 과정 모두 포함 로그 수집기나 센서 네트워크 및 Open API 등 활용 저장 (공유) 저렴한 비용으로 데이터를 쉽고 빠르게 많이 저장 정형 데이터뿐만 아니라 반정형, 비정형 데이터도 포함 벙렬 DBMS나 하둡(Hadoop), NoSQL 등 다양한 기술 사..
빅데이터 플랫폼 빅데이터 수집부터 저장, 처리, 분석 등 전 과정을 통합적으로 제공 제공된 기술들을 잘 사용할 수 있도록 준비된 환경 빅데이터를 분석 또는 활용하는데 필요한 필수적인 것, 빅데이터 기술의 집합체 빅데이터 플랫폼의 등장배경 비즈니스 요구사항 변화 빠른 의사결정 속도보다 장기적이고 전략적인 접근 필요 초저가의 대규모 프로세싱과 클라우드 컴퓨팅 기반의 분석 환경 등장 데이터 규모와 처리 복잡도 증가 다양한 형태의 데이터 수집과 복잡한 로직을 이용한 대용량 처리 필요 분산 처리가 불가피하며 이를 제어할 수 있는 고도의 기술 필요 데이터 구조의 변화와 신속성 요구 SNS 데이터나 로그 파일, 스트림 데이터 등 비정형 데이터의 비중과 실시간 처리에 대한 높은 요구 약한 관계형 스키마나 반정형 데이터..
빅데이터 조직 및 인력 데이터 분석 활용을 통한 성과 창출은 조직 역량의 개발, 인력의 영입 등과 같은 전사 관점의 전략 필요 기업의 경쟁력 확보를 위해 비즈니스 질문을 도출 이를 충족하기 위한 가치 발굴 비즈니스를 최적화하기 위한 빅데이터 조직 및 인력 구성 방안 수립 필요성 빅데이터와 관련된 기술적인 문제들은 기술의 발전으로 어느정도 해소 데이터 분석 및 활용을 위한 조직체계나 분석 전문가 확보에 어려움 존재 데이터 분석 관점의 컨트롤 타워에 대한 필요성 제기 조직의 역할 전사 및 부서의 분석 업무를 발굴 전문적인 분석 기법과 도구를 활용하여 빅데이터 속에서 인사이트를 확인 발견한 인사이트를 전파하고 이를 실행 * 인사이트(Insight) : 통찰력, 사물이나 현상을 통찰하는 능력 조직의 구성 통게학..
데이터 산업의 진화 데이터 산업은 데이터 처리 - 통합 - 분석 - 연결 - 권리 시대로 진화하고 있음 데이터 통합 시대까지 데이터의 역할은 거래를 정확하게 기록하고 거래의 자동화를 지원하는 것 데이터 분석 시대부터는 분석 수준이 향상되면서 데이터 자원을 활용 데이터 처리 시대 (1970~1980) 컴퓨터 프로그래밍 언어를 이용하여 대규모 데이터를 빠르고 정확하게 처리 결과는 파일 형태로 보관 기업들은 EDPS를 도입하여 급여 계산, 회계 전표 처리 등의 업무에 적용 데이터는 업무 처리의 대상으로 새로운 가치를 제공하지 않음 * EDPS(Electronic Data Processing System) : 전자 정보 처리 시스템, 전자 장치를 이용하여 조직의 행정 및 경영 기능을 보조하는 자료를 처리하는 시..
빅데이터의 가치 빅데이터의 역할 4차 산업혁명시대의 석탄이나 철, 원유와 같은 역할 사실관계를 상세하게 들여다볼 수 있는 렌즈 역할 다양한 개발자들에게 사업 기회를 주는 플랫폼 역할 빅데이터의 기능과 효과 고객 세분화와 맞춤형 개인 서비스 제공 알고리즘 기반 의서결정 지원 투명성을 높여 R&D 및 관리 효율성 증가 빅데이터 가치 측정의 어려움 특정 데이터의 가치는 활용 및 가치 창출 방식과 분석 기술의 발전 여부에 따라 달라짐 그렇기 때문에 가치를 측정하고 판단하는 것이 쉽지 않음 데이터 활용 방식 데이터 재사용, 재결합, 다목적용 데이터 개발 등이 일반화되면서 특정 데이터를 누가, 언제, 어디서 활용할지 알 수 없음 가치 창출 방식 어떠한 목적을 갖고서 어떻게 가공하는가에 따라 기존에 없던 가치를 창출..
빅데이터 개요 빅데이터란? 데이터가 방대하여 기존의 방법이나 도구로 수집/저장/분석 등이 어려운 정형 및 비정형 데이터들을 의미 데이터베이스로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처 작은 용량의 데이터에서 얻을 수 없었던 새로운 통찰이나 가치를 추출하여 이를 활용해 많은 분야에 적용하기 위한 것 데이터 규모와 기술 측면에 대한 문제로 시작했지만 점차 의미가 가치와 효과 측면으로 확대 빅데이터의 등장과 변화 빅데이터 등장 배경 기술 발전에 따른 필요한 기술 아키텍처 및 분석 기법 발전 * 데이터 사이언티스트 : 데이터의 다각적 분석을 통해 ..