빅데이터 이해하기
초보자를 위한 빅데이터 이해하기
실시간 분석 IoT 빅데이터 발표자료
데이터 사이언티스트의 역할
성공적인 빅데이터 활용 3대요소
R, 그리고 빅데이터 | R 시각화 1, 2, 3
하둡 플랫폼의 활용 | 이교수의 멘붕하둡
블록체인 이해하기
블록체인 2019
비트코인, 블록, 체인, 분산장
블록체인 비즈니스 모델
문과생 블록체인 이해하기 도서
스톡옵션 관련 정리 1
창업자 필수 성장통 13가지
블록체인 DApp 서비스 UX 개선을
[강의]빅데이터의 소스 유형 정리

빅데이터 활용방향과 인사이트 도출
데이터 3대 분석기법간 관계



 
작성일 : 12-04-01 15:21
“몽고DB 쓰지 마세요”…왜?
 글쓴이 : 빅데이터
조회 : 5,230  
   http://www.bloter.net/archives/103400 [1514]
NoSQL을 대표하는 오픈소스로 각광받고 있는 ‘몽고DB’를 사용하지 말라는 얘기가 고개를 쳐든다. 지난해 말 엔터프라이즈 소프트웨어 개발자 모임인 인포매이션큐(InfoQ)를 시작으로 몽고DB 개발자 커뮤니티와 해커뉴스를 비롯한 다양한 사이트에서 몽고DB 성능을 문제 삼는 개발자들이 늘어나는 추세다. 이들은 몽고DB의 데이터 ‘안정성’을 문제 삼으며, 몽고DB가 명성에 비해 기능이 떨어진다고 지적했다.
몽고DB는 스키마 제약 없이 키와 밸류로 이뤄진 도큐먼트를 저장하는 오픈소스 NoSQL DB로 스키마 제약이 없기 때문에 좀 더 유연하게 데이터를 처리할 수 있다는 장점을 갖고 있다. 1천만 사용자를 갖고 있는 포스퀘어가 몽고DB를 도입해 데이터를 처리하기 시작하면서 널리 알려지기 시작했다.
지금까지 몽고DB는 데이터 처리가 빠르게 이뤄진다는 점에서 개발자들 눈길을 끌었다. 데이터를 쓸 때 메모리에 데이터를 저장한 후 백그라운드 쓰레드를 통해 디스크에 기록하는 특징 때문이었다. 이는 빅데이터 처리 오픈소스 대열에 하둡과 함께 몽고DB도 올라가게 만드는 요인이었다. 방대한 데이터를 몽고DB를 통해 빠르게 처리할 수 있다는 기대감에서다.
그러나 영국IT전문지 더레지스터는 “몽고DB개발자를 원하는 시장 수요가 많음에도 불구하고, 막상 개발자들은 몽고DB를 활용하려고 하지 않는다”라며 “몽고DB에서 카산드라로 이동하려는 움직임이 보인다”라고 전했다.
실제 적용해보니 ‘하둡’처럼 대용량으로 가는 시스템에 적합한 구조가 아닐 뿐더러 스케일 아웃에 한계가 있는 것으로 드러난 탓이다. 몽고DB 속도는 인덱스 사이즈와 메모리에 달려 있는데, 메모리가 가득 차서 HDD로 내려가 데이터를 처리할 경우 처리 속도가 급감한다고 설명했다.
한 개발자는 해커뉴스를 통해 다음과 같이 총 8가지 이유를 들어 몽고DB를 쓰지 말아야 한다고 밝혔다. 요컨대 ▲‘기본설정’으로 데이터를 쓰는(Write)것은 안전하지 않으며 ▲다양한 이유로 데이터가 그냥 날아갈 수 있고 ▲써야 할 데이터 양이 많으면 감당하지 못하며 ▲데이터를 불러올 때 ‘샤딩’이 정상적으로 작동하지 않을 때가 있으며 ▲데이터 삭제나 업데이트를 했을 때 단편화 문제를 발생시켜 데이터 처리에 필요 이상의 메모리를 사용하고 ▲몽고DB 1.8버전에서 문제가 해결됐지만, 데이터셋을 전부 다 날리는 경향이 있고 ▲몽고DB에서 발견된 버그가 빨리 해결되지 않으며 ▲데이터 복제가 필요 이상의 서버를 차지한다는 이유에서였다.
여기에 카산드라, HBASE, HIVE처럼 더 나은 데이터 처리 능력을 보이는 오픈소스들의 등장도 몽고DB 인기 제동에 한몫했다.
국내 업계 관계자는 “몽도DB로는 중요한 서비스를 구축하지 않는다”라며 “일시적인 데이터 처리에 사용하는 게 낫다”라고 말했다. 그는 “결국 DB 선택은 딱 맞는 게 없으니, 개발자가 해야 한다”라고 덧붙였다. 데이터 크기와 모델에 따라 장단점이 있다는 얘기다.
결국 어떤 오픈소스를 사용할 것이냐는 전적으로 개발자에게 달린 셈이다. 이 업계 관계자는 “개발자들이 쉽게 접하는 게 몽고DB고, 그 다음이 카산드라고, 하둡을 모르면 사용하기 까다로운 게 HBASE다”라며 “결국은 오픈소스에는 생각지도 못한 변수가 있기 때문에 항상 공부해야지, 공부 안하고 쓰면 큰코다친다”라고 지적했다.
[이 게시물은 빅데이터님에 의해 2018-03-09 22:10:33 개발자토크에서 이동 됨]
게시글을 twitter로 보내기 게시글을 facebook으로 보내기 게시글을 Me2Day로 보내기 게시글을 요즘으로 보내기
빅데이터 12-04-01 15:42
답변  
이 기사에 대한 반론이네요
반드시 읽어보세요
몽고DB 쓰지 마세요...라는 기사를 보며
http://www.jaso.co.kr/455
비비빅 12-06-11 14:26
답변  
완전화 되지 않은 기술을 벌써부터 폄하하는 판도가 생겼군요~
webdizen 12-06-12 14:48
답변  
MongoDB나 기타 No SQL 기술들의 완성도가 높아졌으면 좋겠네요 ^^
라플라스 12-07-06 13:24
답변  
궁금해서 책 샀는데..;
 
 

전체 238 건
번호 제목 작성자 작성 조회
208 하둡으로 가는 길 | 제1부 기술과 훈련 빅데이터 01-11 1551
207 아파치 하둡, 마침내 정식 버전 출시 빅데이터 01-05 1370
206 주목! 9가지 오픈소스 빅 데이터 기술 (1) 빅데이터 06-12 2144
205 [적용사례] 네이버 라인은 왜 카카오톡보다 병목현상이 적을까? (6) 빅데이터 05-14 11311
204 어제 얘길하면서 많이 논의되었는 NoSQL에 대한 부분에 있어 참… (7) chiro 05-10 3126
203 No-SQL? Non-SQL? (4) 시나브로 04-30 3337
202 하둡을 활용해 스토리지의 한계를 극복하는 방법 리절트 04-20 1883
201 트위터, 빅데이터 처리 노하우 공개 빅데이터 04-10 2021
200 "하둡 전문가 어디 없소?"…속타는 기업들 (3) 빅데이터 04-10 2348
199 아파치, 하둡 관련 스쿱 프로젝트 전력 지원 빅데이터 04-03 3412
198    스쿱 사용자/개발자 가이드 번역본 (5) 전두엽 04-25 2460
197 DB툴 ‘토드’와 ‘NoSQL’이 만나면? (1) 빅데이터 04-01 2137
196 “몽고DB 쓰지 마세요”…왜? (4) 빅데이터 04-01 5231
195 빅데이터 응용 개발 경진대회 PDPARK 03-26 1547
194 "데이터 과학자가 되려면..." 빅데이터 03-19 2802
 1  2  3  4  5  6  7  8  9  10