바로가기 및 건너띄기 링크
본문 바로가기
주메뉴 바로가기

전체

home 알림마당 기관별 공지사항 전체

URL 주소복사

AI 모델 예측 기술 활용한 단백질 분석으로 난치 질환 원인 규명에 한 걸음

AI 모델 예측 기술 활용한 단백질 분석으로 난치 질환 원인 규명에 한 걸음 : 작성자, 작성일, 조회수, 정보 제공
작성자 관리자
작성일 2026-02-05 조회수 82
출처 한국과학기술연구원
원문링크 https://kist.re.kr/ko/news/latest-research-results.do?mode=view&articleNo=17041&article.offset=0&articleLimit=10

AI 모델 예측 기술 활용한 단백질 분석으로 난치 질환 원인 규명에 한 걸음

  • 등록일 : 26-02-02
  • 화학생명융합연구센터
  • 조회수 : 91
  • 첨부파일 :


 AI 모델 예측 기술 활용한

단백질 분석으로 난치 질환 원인 규명에 한 걸음

몸 속 단백질 변형을 분자 수준에서 발굴검증하는 AI 모델 예측 기반 기술

적은 데이터로도 희귀 단백질 변형의 분석이 가능해 신약 개발 등에 활용 가능


암과 같은 난치성 질환은 세포 내부에서 일어나는 미세한 변화에서 시작되는 경우가 많아 정확한 원인을 규명하는 데 어려움이 따른다세포가 스트레스를 받을 때 나타나는 단백질의 미세한 변형은 질병과 밀접하지만기존 기술로는 이를 정확히 구분하기 어려운 것들이 많다이로 인해 질병의 근본 원인을 분자 수준에서 추적할 수 있는 새로운 분석 기술에 대한 요구가 커지고 있다.

한국과학기술연구원(KIST, 원장 오상록화학생명융합연구센터 이철주 박사 연구팀은 인공지능(AI) 학습모델을 활용해 기존에는 분석이 어려웠던 특이 단백질 변형을 정밀하게 찾아내는 기술을 개발했다고 밝혔다이번 기술은 세포 스트레스 반응 과정에서 극히 드물게 나타나는 단백질 변형을 가짜 신호와 구분해 정확히 검출할 수 있는 것이 특징이다.

연구팀이 주목한 아르기닐화는 단백질에 특정 아미노산이 붙어 단백질을 분해하거나 기능을 조절하는 신호로이 과정에 이상이 생기면 신경세포 손상이나 암 발생 등으로 이어질 수 있다그러나 아르기닐화 신호는 생체 내 존재량이 매우 적고 가짜 신호와 특성이 비슷해 기존 분석 기술로는 실제 신호를 구분하기 어려웠다연구팀은 이를 해결하기 위해 진짜와 매우 유사한 가짜 신호를 AI에 먼저 학습시키는 새로운 분석 방식을 도입했다.

그 결과기존 분석에서 검출되던 신호의 약 90%에 해당하는 가짜 신호를 제거하고 총 134개의 실제 아르기닐화 변형 위치를 규명하는 데 성공했다또한전이학습 기법을 적용해 소량의 데이터로도 희귀한 단백질 변형을 정밀하게 분석할 수 있음을 입증했다이 기술을 스트레스 환경의 세포에 적용한 분석에서 세포의 에너지 생산에 관여하는 단백질 중 일부에서 아르기닐화 변형이 확인됐다이는 암세포의 성장과 관련된 대사 과정을 새롭게 이해하는 데 도움이 될 수 있는 가능성을 보여준다.

이번 기술은 단백질 변형의 발굴부터 1차 검증까지를 하나의 AI 분석 체계로 구현해 신약 개발과 바이오 연구 현장에서 연구 비용과 시간을 크게 줄일 수 있다환자의 혈액이나 조직 분석에 적용될 경우질병 관련 단백질 변화를 보다 빠르고 정확하게 포착해 조기 진단과 정밀 의료 연구의 기반 기술로 활용될 가능성이 크다.

KIST 이철주 박사는 “AI의 발전 과정을 지켜보며 기존 연구에서 한계로 남아 있던 부분에 과감하게 AI를 도입한 연구 성과라며, “순수 국내 연구 기반으로 세계 최고 수준의 AI 기반 단백체 분석 원천 기술을 확보한 만큼 AI를 활용한 단백체 분석 연구의 확장에 기여하겠다라고 말했다.

본 연구는 과학기술정보통신부(장관 배경훈)의 지원을 받아 KIST 주요사업 및 개인기초연구사업(RS-2023-00279134), 바이오 연구데이터 활용기반조성사업(RS-2022-NR068428) 으로 수행됐다이번 연구 성과는 국제 학술지 Nature Communications」 (IF 15.7, JCR 분야 상위 7.0%)에 게재됐다.


논문명 Implementing N-terminomics and machine learning to probe Nt-arginylation



[그림 1] AI 기반 수식화 단백체 발굴 기술 개발 연구의 개요

연구팀은 실험 데이터 내에 존재하는 가짜 신호(Arg-starting peptides)’를 활용하여 AI를 학습시키는 전이 학습(Transfer Learning)’ 기법을 도입했다이를 통해 AI는 진짜 아르기닐화 단백질의 질량 스펙트럼(MS2)과 머무름 시간(RT)을 정확히 예측할 수 있게 되었다정확도를 높이기 위해 파편 스펙트럼 검정머무름 시간 검정질량 오차 통계적 검정(MET)으로 구성된 3단계 검증 시스템을 구축했다특히 질량 오차 통계적 검증(MET)은 기계적 측정 오차의 원리를 역이용하여통계적으로 유의미하지 않은 가짜 신호를 정교하게 걸러내는 새로운 기술이다세 가지의 엄격한 AI 및 통계 필터를 모두 통과한 데이터는 전체 의심 신호의 약 30%에 불과했다연구팀은 이렇게 살아남은 신호들이 생물학적으로 타당한 특징(진단 이온 검출구조적 불안정성 등)을 가지고 있음을 확인함으로써분석 플랫폼의 높은 신뢰도를 입증했다.



[그림 2] 세포 스트레스 환경에서의 수식화 변화 및 미토콘드리아 표적 규명

개발된 AI 플랫폼을 활용해 밝혀낸 생물학적 연구 성과를 나타낸다. (좌측세포에 가해지는 스트레스 강도가 높을수록(대조군 < MG132 < MGTG) 아르기닐화되는 단백질의 수가 뚜렷하게 증가함을 확인했으며이들 단백질이 세포 내 스트레스 반응(UPR )과 밀접하게 연관되어 있음을 규명했다. (우측특히 아르기닐화된 단백질들이 미토콘드리아 내 엽산 대사(folate metabolism)에 관여하는 핵심 효소(SHMT2, MTHFD2)임을 밝혔다세포 분획 실험을 통해 해당 단백질들이 세포질이 아닌 미토콘드리아 내부에 아르기닐화 된 상태로 존재한다는 사실을 입증함으로써아르기닐화가 암세포 대사 조절의 새로운 타깃이 될 수 있음을 시사한다.



[그림 3] AI 예측 모델 기반의 표적 단백질체 정밀 분석 및 시계열 변화 관측

본 그림은 앞서 발굴한 아르기닐화 단백질들이 실제 세포 내에서 시간에 따라 어떻게 변하는지를 추적한 '표적 단백질체 분석(Targeted Proteomics)' 결과를 나타낸다. AI 기반 표적 분석 워크플로우 (상단): 일반적으로 표적 분석을 위해서는 값비싼 '합성 표준물질'이 필요하다하지만 연구팀은 앞서 개발한 AI 모델을 활용해 가상의 표준물질 데이터(예측된 스펙트럼 및 머무름 시간)를 생성했다우측 그래프는 AI가 예측한 값과 실제 값이 거의 일치함을 보여주며이는 실제 표준물질 없이도 AI만으로 정확한 분석이 가능함을 증명한다. (하단): 개발된 기술을 이용해 세포에 스트레스를 준 후 시간 흐름(0~48시간)에 따른 단백질 변화를 측정했다좌측 (ATF4): 스트레스 반응 조절 단백질이 초기부터 증가함을 확인했다중앙 및 우측 (FLNA): 특히 FLNA 단백질의 경우효소(Caspase)에 의해 잘린 조각(중앙)이 먼저 생성되고이후 그 조각에 아르기닐화가 일어나는 현상(우측)을 시간 순서대로 포착했다이는 아르기닐화가 스트레스 상황에서 특정 단백질이 절단된 직후에 일어나는 후속 조치임을 명확히 보여주고 스트레스에 대한 반응으로서 단백질 변형이 일어남을 보여주는 증거이다.