빅데이터 이해하기
초보자를 위한 빅데이터 이해하기
실시간 분석 IoT 빅데이터 발표자료
데이터 사이언티스트의 역할
성공적인 빅데이터 활용 3대요소
R, 그리고 빅데이터 | R 시각화 1, 2, 3
하둡 플랫폼의 활용 | 이교수의 멘붕하둡
블록체인 이해하기
블록체인 2019
비트코인, 블록, 체인, 분산장
블록체인 비즈니스 모델
문과생 블록체인 이해하기 도서
스톡옵션 관련 정리 1
창업자 필수 성장통 13가지
블록체인 DApp 서비스 UX 개선을
[강의]빅데이터의 소스 유형 정리

빅데이터 활용방향과 인사이트 도출
데이터 3대 분석기법간 관계



 
작성일 : 15-02-16 18:27
[빅데이터 사례] datasift 성공 사례
 글쓴이 : gkgk123
조회 : 3,257  


활용 사례

매일 DataSift 6억건의 트윗, 페이스북의 좋아요, 그리고 블로그와 게시판의 댓글들과 같은 정보를 처리한다. 정보들은 하루에 2테라바이트 이상의 양이다. 트위터에서만 매일 4억건 이상의 트윗이 1테라바이트의 데이터가 산되며 DataSift 모든 트윗들을 역사의 산물로 저장한다. 분석을 위해 데이터를 저장하기 전에 DataSift 자연 언어처리(NLP), 주제 분석, 성별 파악, 사회적 영향력 분석과 같은 수많은 데이터 처리 작업을 수행한다. 또한 MapReduce 시간에 따른 정보를 처리함과 동시에 구조화된(semi-structed) 정보를 효율적으로 처리하기 위해 HBase 이용한다. 이는 우리가 Cloudera 플랫폼에 차용한 가장 주된 이유입니다. 라고 Halstead 언급한 . 우리가 생각하기에 Cloudera HBase 대한 가장 전문적인 지식을 갖고 있지요.

DataSift 다른 플랫폼, 그리고 기업만이 갖는 과거의 자료들을 포암한 다양한 Data set 함께 활용된다. 결과 사람들의 소셜 미디어에서 보이는 행동에 대한 통찰력과 그것을 시간의 창을 뛰어넘는 기업 고유의 Data Set 함께 연관지어 사용하는 힘을 고객에게 제공해 주게 된다.

[원문보기] blog.naver.com/ryuhyekyung/220273973246

[이 게시물은 빅데이터님에 의해 2018-03-09 22:10:01 개발자토크에서 이동 됨]
게시글을 twitter로 보내기 게시글을 facebook으로 보내기 게시글을 Me2Day로 보내기 게시글을 요즘으로 보내기
 
 

전체 238 건
번호 제목 작성자 작성 조회
148 2012년 전 세계 빅데이터 벤더 매출, 2013-2017 전망 해동 06-12 2686
147 '얀'이 왔다··· 하둡 앱 범람에 대비할 시점 빅데이터 06-10 1204
146 IT분야로 진로고민이나,취업,이직고민등 많은 궁금증이 있으시죠… 멘토쌤 08-05 268
145 SW개발자를 위한 PaaS 서비스 무료 제공 안내 클라우드 06-16 292
144 [TIPA] 제2회 출연(연) '의료.안전' 기술마켓 야도란 04-05 402
143 <클라우드혁신센터> 12월 1일 SW 스타트업 창업 성공 전략… 야도란 11-30 789
142 K-ICT 클라우드 혁신센터 2016년 제 2차 OpenPaaS 이용자 교육 … (1) 야도란 11-16 899
141 개인개발자 SW개발환경 지원사업 안내 야도란 10-11 839
140 기술과 아이디어만 가지고 창업하고 싶은 개발자들... secert444 07-20 865
139 [프리모아]빅데이터 시대에 조명받는 하둡 개발자 프리모아 07-27 2963
138 빅데이터 분석에 스파크를 이용해야 하는 5가지 이유 (8) 빅데이터 04-03 4083
137 [빅데이터 사례] datasift 성공 사례 gkgk123 02-16 3258
136 [빅데이터 사례] VOD스트리밍 넷플릭스 성공사례 gkgk123 02-16 5032
135 [빅데이터사례] 한국석유공사, 국내 유가 예보 서비스 gkgk123 02-02 1697
134 혁신적인 개발플랫폼 IBM 블루믹스란? (1) 바리제너럴 08-11 2121
 1  2  3  4  5  6  7  8  9  10