빅데이터 이해하기
초보자를 위한 빅데이터 이해하기
실시간 분석 IoT 빅데이터 발표자료
데이터 사이언티스트의 역할
성공적인 빅데이터 활용 3대요소
R, 그리고 빅데이터 | R 시각화 1, 2, 3
하둡 플랫폼의 활용 | 이교수의 멘붕하둡
블록체인 이해하기
블록체인 2019
비트코인, 블록, 체인, 분산장
블록체인 비즈니스 모델
문과생 블록체인 이해하기 도서
스톡옵션 관련 정리 1
창업자 필수 성장통 13가지
블록체인 DApp 서비스 UX 개선을
[강의]빅데이터의 소스 유형 정리

빅데이터 활용방향과 인사이트 도출
데이터 3대 분석기법간 관계



 
작성일 : 12-04-01 15:21
“몽고DB 쓰지 마세요”…왜?
 글쓴이 : 빅데이터
조회 : 5,357  
   http://www.bloter.net/archives/103400 [1597]
NoSQL을 대표하는 오픈소스로 각광받고 있는 ‘몽고DB’를 사용하지 말라는 얘기가 고개를 쳐든다. 지난해 말 엔터프라이즈 소프트웨어 개발자 모임인 인포매이션큐(InfoQ)를 시작으로 몽고DB 개발자 커뮤니티와 해커뉴스를 비롯한 다양한 사이트에서 몽고DB 성능을 문제 삼는 개발자들이 늘어나는 추세다. 이들은 몽고DB의 데이터 ‘안정성’을 문제 삼으며, 몽고DB가 명성에 비해 기능이 떨어진다고 지적했다.
몽고DB는 스키마 제약 없이 키와 밸류로 이뤄진 도큐먼트를 저장하는 오픈소스 NoSQL DB로 스키마 제약이 없기 때문에 좀 더 유연하게 데이터를 처리할 수 있다는 장점을 갖고 있다. 1천만 사용자를 갖고 있는 포스퀘어가 몽고DB를 도입해 데이터를 처리하기 시작하면서 널리 알려지기 시작했다.
지금까지 몽고DB는 데이터 처리가 빠르게 이뤄진다는 점에서 개발자들 눈길을 끌었다. 데이터를 쓸 때 메모리에 데이터를 저장한 후 백그라운드 쓰레드를 통해 디스크에 기록하는 특징 때문이었다. 이는 빅데이터 처리 오픈소스 대열에 하둡과 함께 몽고DB도 올라가게 만드는 요인이었다. 방대한 데이터를 몽고DB를 통해 빠르게 처리할 수 있다는 기대감에서다.
그러나 영국IT전문지 더레지스터는 “몽고DB개발자를 원하는 시장 수요가 많음에도 불구하고, 막상 개발자들은 몽고DB를 활용하려고 하지 않는다”라며 “몽고DB에서 카산드라로 이동하려는 움직임이 보인다”라고 전했다.
실제 적용해보니 ‘하둡’처럼 대용량으로 가는 시스템에 적합한 구조가 아닐 뿐더러 스케일 아웃에 한계가 있는 것으로 드러난 탓이다. 몽고DB 속도는 인덱스 사이즈와 메모리에 달려 있는데, 메모리가 가득 차서 HDD로 내려가 데이터를 처리할 경우 처리 속도가 급감한다고 설명했다.
한 개발자는 해커뉴스를 통해 다음과 같이 총 8가지 이유를 들어 몽고DB를 쓰지 말아야 한다고 밝혔다. 요컨대 ▲‘기본설정’으로 데이터를 쓰는(Write)것은 안전하지 않으며 ▲다양한 이유로 데이터가 그냥 날아갈 수 있고 ▲써야 할 데이터 양이 많으면 감당하지 못하며 ▲데이터를 불러올 때 ‘샤딩’이 정상적으로 작동하지 않을 때가 있으며 ▲데이터 삭제나 업데이트를 했을 때 단편화 문제를 발생시켜 데이터 처리에 필요 이상의 메모리를 사용하고 ▲몽고DB 1.8버전에서 문제가 해결됐지만, 데이터셋을 전부 다 날리는 경향이 있고 ▲몽고DB에서 발견된 버그가 빨리 해결되지 않으며 ▲데이터 복제가 필요 이상의 서버를 차지한다는 이유에서였다.
여기에 카산드라, HBASE, HIVE처럼 더 나은 데이터 처리 능력을 보이는 오픈소스들의 등장도 몽고DB 인기 제동에 한몫했다.
국내 업계 관계자는 “몽도DB로는 중요한 서비스를 구축하지 않는다”라며 “일시적인 데이터 처리에 사용하는 게 낫다”라고 말했다. 그는 “결국 DB 선택은 딱 맞는 게 없으니, 개발자가 해야 한다”라고 덧붙였다. 데이터 크기와 모델에 따라 장단점이 있다는 얘기다.
결국 어떤 오픈소스를 사용할 것이냐는 전적으로 개발자에게 달린 셈이다. 이 업계 관계자는 “개발자들이 쉽게 접하는 게 몽고DB고, 그 다음이 카산드라고, 하둡을 모르면 사용하기 까다로운 게 HBASE다”라며 “결국은 오픈소스에는 생각지도 못한 변수가 있기 때문에 항상 공부해야지, 공부 안하고 쓰면 큰코다친다”라고 지적했다.
[이 게시물은 빅데이터님에 의해 2018-03-09 22:10:33 개발자토크에서 이동 됨]
게시글을 twitter로 보내기 게시글을 facebook으로 보내기 게시글을 Me2Day로 보내기 게시글을 요즘으로 보내기
빅데이터 12-04-01 15:42
답변  
이 기사에 대한 반론이네요
반드시 읽어보세요
몽고DB 쓰지 마세요...라는 기사를 보며
http://www.jaso.co.kr/455
비비빅 12-06-11 14:26
답변  
완전화 되지 않은 기술을 벌써부터 폄하하는 판도가 생겼군요~
webdizen 12-06-12 14:48
답변  
MongoDB나 기타 No SQL 기술들의 완성도가 높아졌으면 좋겠네요 ^^
라플라스 12-07-06 13:24
답변  
궁금해서 책 샀는데..;
 
 

전체 239 건
번호 제목 작성자 작성 조회
239 빅데이터 & 머신러닝 국비지원 무료교육 아이티윌교육 09-29 363
238 [빅데이터 아카데미] 금융·의료·유통 빅데이터 분석 전문가/빅… RWDAS 07-29 1214
237 [빅데이터 아카데미] 제1회 빅데이터 제조·기획 분야 전문가 과… RWDAS 06-23 1759
236 ★★★ 2019년~ 최고의 웹사이트와 모바일앱을 찾습니다 ★★★ 한국인터넷전… 10-22 2390
235 시각화 비즈니스 대시보드를 시작하는 비기너를 위한 가이드 올리비아 09-23 2125
234 빅데이터 및 블록체인 교육 안내 행복만땅 07-24 2302
233 [기상청X다음소프트XGS25·랄라블라] 2019 날씨 빅데이터 콘테스… 다우 05-31 1702
232 SK(주) C&C | 직무소개 영상 4편 [빅데이터] 와리바시 05-27 1743
231 [데이터랩] 현직개발자의 드립력으로 배우는 쉽고 재미있는 빅데… (1) findme 01-15 1623
230 "빅데이터 비즈니스 멘토링" BIGTORY 4기 예비창업자과정 참가자… 빅데이터팀 03-21 1737
229 EMC, 클라우드 교육·자격증 과정 신설 빅데이터 12-28 5011
228 구글, 연구용 하둡 클러스터 서비스 중단 빅데이터 12-28 2358
227 “향후 5년 간 데이터 과학자 수요 폭발적으로 늘어날 것” 빅데이터 12-06 2499
226 대한민국 SW개발자여 "다시 일어나라" (1) 빅데이터 11-25 3666
225 페이스북-트위터 DB기술 핵심 NoSQL ‘카산드라 완벽 가이드’ (1) 빅데이터 11-25 7306
 1  2  3  4  5  6  7  8  9  10