빅데이터 이해하기
초보자를 위한 빅데이터 이해하기
실시간 분석 IoT 빅데이터 발표자료
데이터 사이언티스트의 역할
성공적인 빅데이터 활용 3대요소
R, 그리고 빅데이터 | R 시각화 1, 2, 3
하둡 플랫폼의 활용 | 이교수의 멘붕하둡
블록체인 이해하기
블록체인 2019
비트코인, 블록, 체인, 분산장
블록체인 비즈니스 모델
문과생 블록체인 이해하기 도서
스톡옵션 관련 정리 1
창업자 필수 성장통 13가지
블록체인 DApp 서비스 UX 개선을
[강의]빅데이터의 소스 유형 정리

빅데이터 활용방향과 인사이트 도출
데이터 3대 분석기법간 관계

 
작성일 : 21-01-11 18:21
GWAS 전체유전체 상관분석연구 genome-wide association study
 글쓴이 : 빅데이터
조회 : 38  
   https://blog.naver.com/movementwater/222080335840 [14]
질병이 없는 사람들과 질병을 가진 사람의 전체 유전체를 대조하여 DNA 표지자를 비교하는 연구. 이 연구는 암 뿐만 아니라 여러 질병의 예방, 진단 및 치료를 돕기 위한 단서를 제공할 수 있다.

GWAS라고도 한다.

GWAS는 Genome Wide Association Study의 약자로 GWA study라고도 불린다.

​유전학에서 연구하는 것 중 대표적인 하나의 영역은 표현형과 유전형의 관계를 연구하는 것이다. 표현형과 유전형의 관계를 연구하는 방법에는 크게 두 가지가 있다. Forward genetics와 Reverse genetics다. Forward genetics는 phenotype을 통해 genotype을 밝혀내는 방법이다. 즉, 특정 표현형을 가진 사람 혹은 질병을 가진 사람의 genotype이 일반인과 비교해서 차이점을 밝혀내는 방법이다. 그에 반해 Reverse genetics는 Genotype을 통해 Phenotype을 밝혀내는 방법이다. 즉, 우리가 관심이 있는 genotype에 변형을 인위적으로 주어 바뀐 표현형을 살펴보는 방법이다. 이 방식의 대표적인 실험은 Knock-out Gene, Knock-out Animal을 이용하는 방법이다.

​이렇듯 유전학에서는 Genotype에 큰 관심을 가지고 있다. 유전학의 큰 사건 중 하나는 1990년대부터 시작한 Human Genome Project를 통해 인간의 genome을 밝혀낸 것이다. Genome 이란 유전자의 전체 부분, 다시 말해 단순히 전사 번역되어 형질로 발현되는 부분에 한정되지 않고 Whole gene set을 의미한다.

​같은 종의 경우에는 전반적으로 유사한 Genome을 갖고 있다. 특히 형질이 발현되는 부분이라면 더욱이 잘 보존되어 있다. 물론 모든 개체에서 완전하게 동일한 Sequence를 갖고 있지 않다. 전사와 번역을 통해 단백질이 발현되지 않는 서열의 경우에는 개체별로 다른 부위가 존재하고, 심지어 번역되는 유전자도 그러한 부분이 존재한다. 이러한 차이를 Genetic Variant라고 부르고, GWAS는 여기에 관심을 갖고 분석을 한다.

대표적인 Genetic Variant에는 SNPs(스닙, Single Nucleotide polymorphism)이 존재한다. SNP는 쉽게 말해 개체 사이에 다르게 존재하는 염기를 이야기한다. 그리고 이러한 SNP 자리를 한곳에 모아둔 것이 SNPs이다.

​SNP

그렇다면 왜 우리는 SNP와 같은 Genetic variants에 관심을 갖는 것일까? 그 대답은 첫 문단에서 설명한 두 가지 방법론적인 부분에 포함되어 있다. 이러한 Genotype의 변이가 Phenotype에 영향을 주기 때문이다. 여기에는 Quantitative Trait(혈압, 머리카락 색, 눈동자의 색, 키, 몸무게)의 다양성부터 심각한 질병에까지 영향을 줄 수 있다. 

​Qunatitative Trait by SNP

물론 이러한 표현형과 유전형은 환경에 의해서 발현 양상이 변할 수 있고 발현되지 않을 수도 있다. 따라서 환경에 대한 변수를 Metadata 화 시켜 GWA Study에 참고해야 한다. 또한 Phenotype 즉, Quantitative Trait을 사용하는 실험보다는 형질을 만드는 Protein을 대신해서 사용하는 연구가 많다. 이유는 Phenotype 과 Genotype 이 있다면 Protein은 그 사이에서 Genotype 과 더욱 가까운 관계를 우선적으로 취하기 때문이다. 

Manhattan plot

Manhattan plot

몇몇 강하게 연관되어 있는 위험한 Locus(좌위)를 나타내는 GWAS에서 자주 사용되는 시각화 자료. 

각각의 Dot은 SNP를 나타내며, X축은 유전적 위치를 Y 축은 Association level을 나타낸다. 

​GWAS 연구 방법

​1) NGS

2) SNP chip

3) GBS

GWAS Database

1) dbSNP

2) HapMap

3) 1000 genome project

​GWAS 분석 도구

PLINK
게시글을 twitter로 보내기 게시글을 facebook으로 보내기 게시글을 Me2Day로 보내기 게시글을 요즘으로 보내기
 
 

전체 8 건
번호 제목 작성자 작성 조회
8 "기형아 가능성이 높게 나왔네요" 빅데이터 01-14 23
7 유전체 의학(Genomic Medicine) - (2) 유전자를 통한 질병 예측 빅데이터 01-14 29
6 유전체 의학(Genomic Medicine) - (1) 배경 지식 빅데이터 01-12 42
5 GWAS 전체유전체 상관분석연구 genome-wide association study 빅데이터 01-11 39
4 2년내 유전체 데이터 유통 플랫폼 구축 가능…규제 등 준비 필요… 빅데이터 01-08 56
3 DTC(Direct To Customer) 정의 빅데이터 01-08 51
2 유전자 검사 정의 빅데이터 01-08 42
1 유전자 데이터 정의 빅데이터 01-08 42