인기글 [05/20] (회원게시판) 대림동여경을 보고 현직소방이 남긴 글 (49)  
검색
홈으로 |로그인 | 무료회원가입 | 포인트출석 | 포인트적립방법 및 계급정책 
자동
회원가입 | 아이디 · 비밀번호 찾기
알뜰공간
 업체정보  | 핫딜정보
 컴퓨터견적  | eTo마켓
 자동차업체  | 남성스타일
 보험상담실  | 대출상담실
자료공간
 공개자료실  | 추천사이트
포인트공간
 포인트배팅  | 포인트응모
 포인트선물  | 홍보포인트
 가위바위보 | 자동차경주
 포인트슬롯 | 포인트복권
 이벤트/충전소 | 포인트순위
이토공간
 공지사항  | 문의사항
 자주묻는질문  | 토렌트팁
 포인트적립 및 계급정책안내
   
[뉴스] 

알파고'후배 '알파폴드'도, 북한도 뛰어들었다…단백질 구조예측

[회원게시판]
글쓴이 : 포이에마 날짜 : 2019-03-16 (토) 08:53 조회 : 379 추천 : 1  
아미노산 서열만으로 단백질의 3차원 구조를 예측하는 컴퓨팅 기술이 진화하고 있다. 사진은 에이미 키팅 미국 매사추세츠공대(MIT) 생물학과 교수팀이 시뮬레이션한 3차원 단백질 구조다. 동아사이언스
아미노산 서열만으로 단백질의 3차원 구조를 예측하는 컴퓨팅 기술이 진화하고 있다. 사진은 에이미 키팅 미국 매사추세츠공대(MIT) 생물학과 교수팀이 시뮬레이션한 3차원 단백질 구조다. 동아사이언스

우리 몸속에는 단백질이 약 10만 개 있다. 각각 복잡한 3차원 구조를 가지며, 기능도 천차만별이다. 단백질은 세포 안에서 벌어지는 거의 모든 생명 반응에 관여하는 기본단위다. 세포의 핵에서는 유전물질인 DNA를 해독해 필요한 단백질을 끊임없이 만들고 있다. 이렇게 생성된 단백질의 구조와 기능, 생체 내 상호작용을 밝혀 생명의 비밀을 푸는 것이 생명과학 연구자들의 가장 근본적인 숙제 중 하나다. 


1958년 X선 결정학기법으로 단백질의 일종인 미오글로빈의 구조가 최초로 확인됐다. 최근에는 영하 200도 이하의 낮은 온도에서 여러 단백질이 결합한 복합단백질의 구조까지 확인할 수 있는 극저온전자현미경기법도 널리 쓰인다. 


하지만 세포막 위에 존재하는 막단백질의 경우, 막에서 분리되면 구조가 변하기 때문에 실험을 통해 구조를 확인하기 매우 까다롭다. 또 이론적으로 만들 수 있는 무수한 단백질의 구조를 일일이 실험으로 확인하는 방법도 한계가 있다. 


이 때문에 1960년대 초부터 많은 과학자들이 단백질 구조를 실험적 기법 대신 계산을 통해 얻어내려는 연구를 진행했지만, 1990년대 이전까지 단백질 구조의 예측정확도는 거의 0% 수준이었다.


그런데 최근 컴퓨팅 기술이 발전하면서 단백질을 이루는 아미노산의 서열과 구조를 조합해 최적화된 단백질 구조를 계산하고 정확히 예측하는 기술이 급속히 발전하고 있다.

 

템플릿 기반-템플릿 프리, 두 부문 석권 

 

존 점퍼 구글 딥마인드 박사와 강범창 서울대 화학부 연구원이 제 13회 단백질 구조 예측대회에서 ′알파폴드′의 성능을 설명하는 발표자료 앞에 서 있다. 석차옥 제공
존 점퍼 구글 딥마인드 박사와 강범창 서울대 화학부 연구원이 제 13회 단백질 구조 예측대회에서 '알파폴드'의 성능을 설명하는 발표자료 앞에 서 있다. 석차옥 제공

지난해 12월 1~4일 멕시코 칸쿤에서 열린 ‘제13회 단백질 구조 예측(CASP·Critical Assessment of Structure Prediction) 대회’가 열렸다. 구조 예측 분야에 출전한 97개 팀들은 단백질 90종의 선형(1차원) 시퀀스를 받았다. 이들 단백질은 3차원(3D) 구조가 확인됐지만 아직 공개되지 않은 것들이었다. 97개 팀의 미션은 단백질의 1차원 시퀀스만 가지고 이들이 어떻게 3차원으로 접힐지(fold) 계산하라는 것이었다. 구글 딥마인드가 개발한 인공지능(AI) ‘알파고’의 후배쯤 되는 ‘알파폴드(AlphaFold)’가 저명한 연구팀들을 제치고 우승을 차지했다. 

 

1994년부터 2년마다 열리고 있는 CASP에는 전 세계 생물정보계산과학자들이 집결한다. CASP 조직위원회는 대회가 열리는 해의 5월부터 매일 2~3개씩 3차원 구조가 밝혀지지 않은 단백질 관련 문제를 무작위로 출제한다. 출전팀은 이에 대한 답안을 마련해 제출한다. 


실제 대회기간에는 출제된 문제를 7가지 세부 항목(템플릿 기반 구조 예측, 템플릿 프리 구조 예측, 인접 아미노산 예측, 정밀화, 복합체 구조, 구조 정확도 평가, 생물학 연구 활용성)으로 구분해 제출된 답안을 평가한다. 이들 답안과 실제 구조를 비교해 참가팀간 상대적으로 점수를 매긴다. 


이번 대회 심사위원을 맡은 석차옥 서울대 화학부 교수는 “알파폴드는 템플릿 기반 구조 예측 분야에서는 근소한 차로 정상에 올랐고, 템플릿 프리 구조 예측 분야에서는 압도적으로 1위를 차지했다”고 말했다.


템플릿은 이미 알려져 있는 아미노산 서열과 그에 맞는 구조에 대한 자료를 뜻한다. 무작위로 낸 단백질 문제 중 템플릿을 바탕으로 풀 수 있는 문제로 확인된 것은 평가 시 템플릿 기반 구조 예측 항목으로 분류된다. 


이런 템플릿이 없는 단백질은 템플릿 프리 구조 예측 항목에 포함된다. 템플릿 프리 구조 예측은 아미노산의 극성이나 소수성 등 물리·화학적 성질에 근거한 원리와 1차원 아미노산 서열의 규칙성 등을 종합해 결과를 만든다. 단백질 구조 예측에서는 템플릿 기반 구조 예측과 템플릿 프리 구조 예측의 두 가지가 핵심이다.


석 교수는 “대회에서는 아미노산의 규칙성을 찾아 단백질 구조를 예측한 문제를 인접 아미노산 예측으로 분류해 따로 평가했는데, 사실상 템플릿 프리 구조 예측 문제를 푸는 데는 인접 아미노산 예측값이 포함돼야 한다”며 “알파폴드는 인접 아미노산의 규칙성을 찾는 방식을 토대로 문제를 풀어 템플릿 프리 예측 분야에서 우승했다”고 설명했다. 

 

아미노산 서열 30% 같으면 구조는 80% 닮아


핵에 들어있는 DNA 속 염기 세 개(코돈)는 아미노산 한 개에 해당한다. 세포에서 단백질 합성 공장 역할을 하는 리보솜이 각 코돈에 맞는 아미노산을 이어 붙인다. 일반적으로 하나의 단백질은 100~200개의 아미노산으로 이뤄진다. 


100여 개의 아미노산으로 이뤄진 미지의 단백질 구조 문제가 주어지면, 알파폴드는 자체 서버를 통해 단백질정보은행(PDB)에 등록된 템플릿과 문제 속 아미노산 서열을 비교한다. PDB에는 현재 약 15만 개의 템플릿이 등록돼 있다. 템플릿 수는 계속 증가하고 있지만, 이론적으로 아미노산 서열이 9300만 개 이상 존재할 수 있다는 점을 고려하면 적은 편이다. 


최근에 사용되는 템플릿 기반 구조 예측 기술은 다음과 같다. 미지의 단백질에 포함된 아미노산 서열을 10개 이하로 쪼개 단위서열로 구분하고, PDB를 뒤져 이들 단위서열과 닮은 템플릿을 최대한 많이 찾는다(템플릿 찾기). 이렇게 찾아낸 템플릿들을 정렬시켜 모은 뒤(서열 정렬), 각 템플릿을 짜 맞추면서 이상적인 단백질 구조 모델을 만든다(모델 빌딩). 


석 교수는 “템플릿만 있다면 이를 토대로 단백질 구조를 예측하는 게 정확도가 높다”며 “단백질의 경우 아미노산 서열의 진화 속도보다 구조의 진화가 늦었기 때문”이라고 설명했다. 구조의 진화가 더뎌 서열의 일부만 같아도 구조적으로는 큰 차이가 없다는 것이다. 통계적으로는 아미노산 서열이 30%만 동일해도 구조는 80% 이상 닮은 것으로 알려졌다. 아미노산 서열에 대한 구조를 알고 있는 템플릿이 많을수록 예측 정확도가 크게 높아지는 셈이다. 


이번 대회에서 템플릿 기반 예측 분야로 판명된 문제는 90개 중 47개다. 알파폴드는 가장 높은 정확도로 문제를 풀어 2위인 미국 미시간대 연구팀을 근소하게 따돌리고 1위를 차지했다.

 

템플릿 프리 분야 43개 중 25개 정확히 예측 

 

알파폴드가 제출한 답안. 파란색이 알파폴드의 예측 모델이며� 초록색은 실제 측정된 구조로 둘을 겹쳐서 비교했다. 알파폴드는 복잡한 구조를 이루는 고난도 단백질 문제 43개 중 25개를 60% 이상의 높은 정확도로 맞추는 데 성공했다. 구글 딥마인드 제공
알파폴드가 제출한 답안. 파란색이 알파폴드의 예측 모델이며 초록색은 실제 측정된 구조로 둘을 겹쳐서 비교했다. 알파폴드는 복잡한 구조를 이루는 고난도 단백질 문제 43개 중 25개를 60% 이상의 높은 정확도로 맞추는 데 성공했다. 구글 딥마인드 제공

알파폴드의 진가는 템플릿 프리 구조 예측에서 드러났다. 알파폴드는 템플릿이 없는 것으로 확인된 43개 문제 중 25개를 가장 높은 정확도로 예측해 1위에 올랐다. 미국 미시간대 연구팀은 이 항목에서도 2위를 차지했는데, 세 문제에서 가장 높은 점수를 받는 데 그쳤다. 


그간 템플릿이 없는 고난도 단백질 구조 찾기는 대부분의 연구팀이 0점을 받을 만큼 기술적으로 진전이 없었다. 이번에 알파폴드가 이 분야의 기술을 크게 끌어올린 셈이다. 석 교수는 “고난도 단백질 구조 예측 정확도가 25~30점에서 60점 수준까지 높아졌다”며 “향후 복합 단백질의 구조와 기능을 예측하는 기술까지 더 개선되면 신약후보 물질로 쓸 단백질을 설계하는 데 큰 도움이 될 것”이라고 말했다. 


알파폴드는 딥러닝에 기반한 강화학습을 통해 인접한 아미노산이나 짧은 서열조각 사이의 진화적 규칙성을 찾는 데 집중한다. 학계에서는 인접한 아미노산의 관계가 진화적으로 연관된 여러 단백질에서 보존된다고 본다. 예를 들어, 전기적으로 양극(+)을 띠는 아미노산은 음극(-)을 띠는 아미노산과 서열상 인접해 있을 가능성이 크고, 구조적으로도 큰 영향을 미친다는 논리다. 
석 교수는 “알파폴드 같은 인공지능은 알고리듬을 이용해 아미노산 서열을 무수히 많은 조합으로 만들어볼 수 있어 진화적 연관성을 파악하기에 유리하다”며 “알파폴드가 1차원 아미노산 서열만으로 단백질의 3차원 구조를 예측할 수 있었던 것도 이 때문”이라고 설명했다.  


이번 대회에서 한군섭 북한 리과대학 자연과학연구원 연구사가 이끄는 연구팀이 구조정확도 평가 항목(로컬 부문)에 참가해 1위를 차지했다. 이 항목의 경우 전체 단백질 구조 정확도를 평가하는 글로벌 부문과 부분 구조를 평가하는 로컬 부문으로 나뉜다. 석 교수는 “북한 연구자들이 이미 완성된 답안에서 부분적인 단백질 구조의 정확성을 판단하는 기술을 확보한 것으로 볼 수 있다”며 “이는 결국 구조를 예측하는 기술과도 이어지기 때문에 상당한 기술력을 갖고 있다고 해석할 수 있다”고 말했다.

in principio creavit Deus caelum et terram

파지올리 2019-03-16 (토) 10:39
북한이 기초과학이 상당히 강한 나라라는. 공학이 약해서 문제지.
그래서 공학이 극강이고 기초과학이 약한 한국하고 교류를 하면 씨나지효꽈가 나온다는 겁니다.
     
       
글쓴이 2019-03-16 (토) 10:42
북한이 기초과학이 강하다는 게 어떤 자료로 이야기하시는지 모르겠네요
          
            
파지올리 2019-03-16 (토) 10:44
자료가 필요하면 직접 찾아보세요.
               
                 
포르토스 2019-03-16 (토) 11:44
웃고갑니다 ㅋㅋ
                    
                      
파지올리 2019-03-16 (토) 11:45
웃기는 애가 웃고 가네요.
                         
                           
포르토스 2019-03-16 (토) 11:47
그러게요 ㅋㅋㅋㅋㅋㅋ
파지올리 2019-03-16 (토) 11:48
수학도 한국보다 앞서 있음.

http://nk.chosun.com/news/articleView.html?idxno=11924

"북한의 산업기술 수준은 전반적으로 남한에 비해 낙후돼 있으나 기초과학 분야 인 물리학에서는 남한보다 앞섰다는 것이 일반적이 지적이다. 특히 핵개발에 필수적인 이론적 기반 구축에 역점을 둬 적어도 물리학 분야에서는 남한에 비해 훨씬 우수한 기술을 보유하고 있는 것으로 알려지고 있다."
   

(구)회원게시판
회원게시판  일간추천순 | 일간조회순 | 일간댓글순 | 주간추천순 | 주간조회순 | 주간댓글순
 
  • 시사제외
번호 제목 글쓴이 날짜 추천 조회
 [필독] 회원게시판 이용안내 및 게시물 삭제 안내 eToLAND 08-06 8
 [안내] 사이트 속도나 이미지 로딩 속도가 느릴 때 안내 eToLAND 08-06 0
 [필독] 게시물 및 댓글 작성시 욕설/반말/인신공격/비방 제재처리 안내 eToLAND 08-06 0
 [안내] 정치/시사 관련 내용은 시사게시판에 등록바랍니다. eToLAND 08-06 0
96046 [잡담]  하 TV 65인치 국내와 75인치 직구...선택장애가 옵니다 킹즈맨 11:53 0 34
96045 [사회]  6.25 한국전쟁 당시 이승만의 만행 이미지첨부 허밍타임2 11:52 0 56
96044 [고민]  늦게나마 대학을 갈려고하는데 (4) 미완성곡 11:50 0 65
96043 [잡담]  종합소득세 7만원 냈는데 이게 보통인가요??? (1) Dusic 11:43 0 159
96042 [일반]  기레기가 잘못 전달하는 518시민의 분노 이유... (3) belcowin 11:34 0 157
96041 [일반]  왕겜 마지막회 본 분들이....(노스포) (6) 카일러스 11:33 0 274
96040 [일반]  한성 적축 gk550 VS. mkf30s (6) 철수1234 11:32 0 63
96039 [고민]  아마존 WD하드대란 탑승했는데 고민입니다. (10) 뷰티풀라이프 11:22 0 321
96038 [일반]  맥도날드 빅맥 오늘 처음 먹어봤는데.. (7) 사모라노 11:20 1 297
96037 [사회]  조작날조 방송 한 KBS MBC SBS 관련자 책임자들도 모조리 감옥 가야함. (3) 이미지첨부 천재의긍지 11:19 0 228
96036 [일반]  경찰이 대림동 풀영상 공개한 이유가 뭘까요? (5) 쇠렌센 11:18 2 246
96035 [잡담]  빅스마일데이에 원하던 제품 하나 건졌습니다. (2) 이미지첨부 코스믹보보 11:17 0 246
96034 [일반]  오늘 여야 맥주회동에서 여당은 기죽지 마시라 (1) 산돌마을 11:09 0 166
96033 [잡담]  게임 광고 보다가 안좋은 것을 하나 알게 된 듯 싶네요 ㅡㅡ;; 그치지않는비 11:07 0 138
96032 [일반]  구글 화웨이 일부 서비스 중단 ... (5) 통합사회황국… 11:00 2 290
96031 [일반]  군사 퍼레이드.. 섶다리 10:58 0 156
96030 [일반]  영어 문법 너무 어려워요! 이건 어떤 걸까요 도와주세요~ (4) 조흐나아 10:50 0 128
96029 [일반]  경찰 논란 진짜 심하네요 (10) 별명뭘로 10:43 8 517
96028 [일반]  스파이더맨의 운명은 (엔드게임 스포 o) (6) I시나브로l 10:40 0 263
96027 [일반]  그 에어팟충전기 있잖아요? 그 자체로 충전이되나요? (2) 츄루륩춉츕 10:31 0 154
96026 [일반]  노래 좀 찾아주세요~ (컴앞 대기중) (10) TDU2 10:28 0 118
96025 [일반]  야구선수 팬서비스 논란 유튜브 영상에 달린 박찬호 댓글 (4) 이미지첨부 충혈된노을 10:24 6 569
96024 [일반]  경찰 업무에 체력적 물리적인 힘이 그다지 중요하지 않다고 ? (1) 스미노프 10:24 3 192
96023 [잡담]  갑자기 생각이 안나서 그러는데.. 정의가 무엇이냐는 질문에 학후 10:14 0 88
96022 [일반]  신용카드 처음 만들었는데 불편한 점이라고 해야 하나... (22) 꽃보다요가 10:01 0 408
96021 [일반]  여름에 꼭튀로 고민되시는 분들 작은 팁요 (6) 슈우풍 09:57 0 598
96020 [일반]  지지자? 아니면 위장일베충? (8) 이미지첨부 델몬트 09:56 0 416
96019 [고민]  사고는 한순간이네요. (12) 마자용™ 09:53 3 506
96018 [일반]  홍남기 "미중갈등 심화…우리경제에 심각한 영향 가능성"(종합) (2) 전사abj 09:48 0 157
96017 [일반]  우리나라는 플라스틱의 규제나 규격이 없을까 (17) 이미지첨부 순수의식 09:43 2 218
 1  2  3  4  5  6  7  8  9  10  다음