UK 바이오뱅크 참가자 490,640명에 대한 전장 유전체 시퀀싱
- Kyoung-Hwan Choi
- 8월 8일
- 3분 분량
영국 바이오뱅크 참가자 490,640명의 전장 유전체 시퀀싱(WGS) 데이터 분석 결과가 발표되었습니다. 기존의 유전자형 분석 및 전장 엑솜 시퀀싱(WES) 노력에 기반하여 인간 유전체의 포괄적이고 편향 없는 시각을 제공합니다. 이 대규모 데이터셋은 질병 생물학 및 건강과의 유전학적 연관성에 대한 이해를 심화하고, 진단 및 치료법 개발, 정밀 의학 전략을 발전시키는 데 기여할 것으로 기대됩니다.

주요 포인트
1. 전장 유전체 시퀀싱(WGS)의 독보적인 가치
변이 발견의 폭발적인 증가: WGS는 이전의 유전자형 분석(imputed array)에 비해 18.8배, WES에 비해 40배 이상 증가한 인간 변이(SNP, indel, SV)를 발견했습니다. 이는 WES가 놓쳤던 전사되지만 번역되지 않는 엑손 내 변이(5' UTR의 69.2%, 3' UTR의 89.9%가 WES에서 누락)를 포함하며, 심지어 코딩 엑손 내에서도 13.7%의 변이가 WES에서 누락되었음을 보여줍니다.
희귀 비암호화 변이의 탐색 잠재력: 희귀한 비암호화(non-coding) 변이는 인간 질병과 기타 복합 형질에 기여하는 것으로 알려져 있지만 이에 대한 연구는 상대적으로 부족한 실정이다. 이번 대규모의 정밀 표현형 정보를 갖춘 WGS 데이터셋은 건강과 질병에서 희귀 비암호화 변이가 수행하는 역할에 대한 이해를 확장할 수 있는 가능성을 제공할 것으로 보입니다. 기존 기술로는 특징화하기 어려웠던 희귀 유전 변이 및 복합적인 유전체 영역에 대한 정확한 특성화를 가능하게 합니다.
구조적 변이(SVs)의 향상된 검출: WGS는 구조적 변이(SV)를 정확하게 유전자형으로 분석하는 능력을 향상 시켰습니다. 이번 데이터셋에서는 신뢰할 수 있게 판별된 구조적 변이(SV)의 수가 약 3배 증가했습니다. 코딩 영역과 UTR 서열 모두에서 구조적 변이와 엑손 변이를 보다 정확하게 유전형 분석할 수 있는 능력이 향상되면서, 기존의 전장 엑솜 시퀀싱 분석보다 강화된 결과와 새로운 통찰을 도출할 수 있게 되었습니다.
2. 질병 연관성 및 새로운 유전적/임상적 통찰
새로운 희귀 변이 발견: WGS 데이터셋은 일반 변이 연관성 발견의 증가는 보통이었지만, 연관성 신호의 미세 매핑 능력을 향상 시켰습니다. 특히 WGS에서 새롭게 확인된 연관 변이 대부분은 희귀 변이였으며, 이 중 86%는 소수 대립유전자 빈도(minor allele frequency, MAF)가 0.0001 미만인 변이였습니다. 이 중 3,991개(12.05%)는 어레이 기반 추정 변이만을 사용했을 때는 확인되지 않았던 것으로, WGS 데이터에서 새롭게 발견된 변이들 입니다.
다인종 메타 분석의 중요성: 비유럽인(non-NFE) 조상 그룹의 샘플 크기가 작음에도 불구하고, 다인종 메타 분석을 통해 1,934개의 새로운 연관성이 발견되었으며, 이 중 126개는 비유럽인 조상 그룹에서 가장 강력한 신호를 보였습니다. 특히 말라리아와 같은 지역 특이 환경 요인에 의한 선택 으로 설명됩니다.
질병 형질과의 대부분의 연관성은 주로 유럽 혈통(individuals of European ancestries)에서 관찰 되었지만, 아프리카 및 아시아 혈통에서도 강력하거나 새로운 신호들이 확인되었습니다. 메타 분 석에서 유의미한 연관성 중 126개는 NFE(비핀란드 유럽인)보다 훨씬 작은 표본 수에도 불구하고, NFE보다 다른 혈통(비-NFE)에서 더 유의미한 것으로 나타났습니다.
예를 들어, 겸상적혈구병과 빈혈에 각각 관련된 HBB와 G6PD 유전자의 미스센스(missense) 원인 변이는 아프리카 혈통(AFR)에서 NFE보다 1,500배 이상 더 흔하게 나타났습니다. 이 변이들이 중 증 말라리아로부터 보호 효과를 가지고 있으며, 전체 말라리아 사례의 95%가 아프리카에서 발생 하기 때문입니다.
WGS와 WES의 유전자-표현형 연관성 비교: WGS와 WES는 유전자-표현형 연관성 결과에서 높은 상관 관계를 보였지만, WGS는 특정 유전자(예: PKHD1)에서 더 나은 커버리지를 제공하여 연관성 통계치를 개선했습니다. WGS는 WES에서 잘 포착되지 않는 영역의 변이를 확인하고 연관성을 파악하는 데 유용함을 입증했습니다. WES에 비해 WGS에서 일부 유전자의 커버리지가 향상된 것은, 일부 단백질 코딩 영역에서 WGS가 새로운 발견 가능성을 높이는 데 가치를 지닌다는 것을 보여줍니다.
UTR 변이의 표현형 효과: WGS는 단백질 코딩 유전자의 UTR(5' 및 3' UTR)에 있는 희귀 변이와 표현형 간의 유의미한 연관성을 발견하는 데 사용되었습니다. UTR 변이만을 사용하거나 UTR 변이를 단백질 절단 변이와 결합하여 분석한 결과, 새로운 유전자-표현형 연관성이 발견되었고, 일부는 단백질 코딩 신호를 강화했습니다. 이는 비코딩 영역의 질병 관련 희귀 변이 연관성을 탐색하는 WGS의 큰 잠재력을 보여 줍니다.전사되지 않는(non-protein-coding) 변이와 표현형 간의 연관성을 식별하는 데 있어 전장 유전체 시퀀싱(WGS)의 가능성을 보여줍니다.
또한, UTR과 단백질 코딩 영역을 포함한 PheWAS(표현형 연관 연구)에서는 27개의 유의 가능성이 있는 연관성이 관찰되었으나, 단백질 코딩 영역만을 대상으로 한 collapsing PheWAS에서는 이 기준에 도달하지 못했습니다.
액션 가능 유전자형(Actionable genotypes) 식별 증가: 개인의 0.60%는 상염색체 우성의 단백질 기능 상실(LoF)을 유발할 것으로 예측되는 구조적 변이(SV)를 보유하고 있습니다. 이 결과가 확인된다면, 의료적으로 조치 가능한 유전형(actionable genotype)을 가진 개인 수가 14.8% 증가하게 됩니다.
3. 연구 자원의 활용 및 향후 방향
오픈 리소스 및 글로벌 협력: 방대한 WGS 데이터셋은 UK 바이오뱅크 연구 커뮤니티에 개방되어, 인간 유전체에 대한 이해를 높이고, 더 높은 효능과 개선된 안전성 프로필을 가진 진단 및 치료법 발견을 촉진하며, 정밀 의학 전략을 가능하게 합니다.
다양성 증진의 필요성: 현재의 인간 유전체 참조 자료와 바이오뱅크 데이터는 인간 집단의 다양성을 완전히 반영하지 못하고 있으며, 여전히 유럽 혈통 중심으로 구성되어 있습니다. 이로 인해 비유럽 지역에 특이적인 유전 변이의 탐지가 제한되고, 다양한 인구 집단에서 질병의 유전적 기초에 대한 이해에 근본적인 편향이 발생하게 됩니다. 본 연구는 다인종 메타 분석을 통해 이러한 한계를 일부 극복하려 노력했습니다.
향후 연구 방향: 다음 단계로는 비단백질 코딩 자격 변이 정의를 추가 필터로 더욱 정교화 하고, 비단백질 코딩 신호의 독립성을 테스트하기 위한 조건부 분석을 수행하며, 다른 표현형 및 다른 종류의 비단백질 코딩 영역으로 확장하는 것을 포함할 수 있습니다.
UK 바이오뱅크의 490,640명 참가자에 대한 전장 유전체 시퀀싱은 인간 유전체 변이와 질병 발생 기전 간의 복잡한 관계에 대한 전례 없는 통찰력을 제공하는 획기적인 연구입니다. 특히 희귀 비암호화 변이 및 구조적 변이의 발견 능력, 다인종 분석을 통한 새로운 유전적 연관성 식별, 그리고 액션 가능한 유전자형 식별의 증가는 질병 연구, 약물 발견 및 개발, 정밀 의학 분야에 지대한 영향을 미칠 것입니다. 이 방대한 데이터셋은 전 세계 과학자들의 협력을 통해 인간 질병 생물학에 대한 이해를 증진하고 안전하고 효과적인 의약품 개발에 기여할 것으로 확신합니다.
Comments