빅데이터 이해하기
초보자를 위한 빅데이터 이해하기
실시간 분석 IoT 빅데이터 발표자료
데이터 사이언티스트의 역할
성공적인 빅데이터 활용 3대요소
R, 그리고 빅데이터 | R 시각화 1, 2, 3
하둡 플랫폼의 활용 | 이교수의 멘붕하둡
블록체인 이해하기
블록체인 2019
비트코인, 블록, 체인, 분산장
블록체인 비즈니스 모델
문과생 블록체인 이해하기 도서
스톡옵션 관련 정리 1
창업자 필수 성장통 13가지
블록체인 DApp 서비스 UX 개선을
[강의]빅데이터의 소스 유형 정리

빅데이터 활용방향과 인사이트 도출
데이터 3대 분석기법간 관계



 
작성일 : 15-10-28 11:24
데이터 처리 구조 구축 관련! hdfs, spark
 글쓴이 : 감자고구마
조회 : 1,797  
처음에 수집되는 데이터는 가공이 많이 필요할 데이터라 생각되어
hdfs에 분산저장 한 후 시간 단위로 hdfs에 저장된 데이터들을 불러와 spark에서 처리하여
결과 데이터는 rdb에 저장해서 추후 web에서 확인할 수 있도록 할려는데요!

현재는 수집된 데이터 바로 rdb 저장 후 쿼리연산 수행해서 처리하고 있습니다

저렇게 고치려는 이유가 데이터가 증가할수록 rdb가 처리하기엔 부담이 생길것 같아 
위와 같이 구조를 생각해보았는데 hdfs 용도가 저렇게 사용하는 것이 맞는지 이 구조에 대해 의견 부탁드려요
게시글을 twitter로 보내기 게시글을 facebook으로 보내기 게시글을 Me2Day로 보내기 게시글을 요즘으로 보내기
ygji 15-10-29 10:11
답변 삭제  
하둡은 대용량 데이터를 배치처리에 적합도록 설계되어 있습니다.
가장 일반적인 하둡용도는 위의 글 내용과 같습니다. RDB에 저장된 데이터를 활용해서 좀더 고급분석을 시도합니다.
 
 

전체 176 건
번호 제목 작성자 작성 조회
176 아주 기초적인 질문입니다. (1) 비틀비틀 07-05 2895
175 spark -> hbase 성능 질문 셔틀랜드 08-04 3805
174 Azkaban 병렬 스캐쥴 잡 등록 문의 우리집미니 03-07 5143
173 hive와 hbase에 관한 질문 (1) 하둡초보개발… 12-07 2452
172 hive 통계 배치 Tool 질문 (2) chosuky 11-23 2599
171 mapreduce와 hive관련 초보개발자의 질문입니다. (2) 하둡초보개발… 11-17 1030
170 하둡과 클라이언트 연동에 관한 초보 질문 (2) 하둡초보개발… 11-09 1429
169 하둡실행시에 jps치면 (1) 우아얌 11-03 1138
168    하둡실행시에 jps치면 (2) 우아얌 11-04 2017
167 데이터 처리 구조 구축 관련! hdfs, spark (1) 감자고구마 10-28 1798
166 하둡 실행이 안됩니다. (2) 우아얌 10-01 993
165    하둡 실행이 안됩니다. (1) 우아얌 10-03 801
164 HDFS 포맷, 실제 볼륨드라이브를 포맷? 아니면 특정 디렉토리를 … (1) 제임스윤 07-21 1603
163 고급 MapReduce 프로그램 책입니다. 2번째 (3) 태운아빠 05-06 2029
162 고급 MapReduce 프로그램 책입니다. (7) 태운아빠 05-06 2381
 1  2  3  4  5  6  7  8  9  10