Bioinformatics

질량분석(mass spectrometry)은 단백질을 분해한 펩타이드를 질량분석기에 돌려서 나온 질량스펙트럼(mass spectrum) 데이터를 연구/분석하는 학문이다. 질량스펙트럼을 분석하여 단백질에 어떤 펩타이드가 존재하는지 확인할 수 있고, 질병 샘플과 정상 샘플 사이에 펩타이드의 양이 어떻게 변화하였는지 정량분석을 통해 알 수 있다.

  • 기존의 THRASH알고리즘보다 빠르고 정확한 질량스펙트럼에서의 펩타이드 단동위질량 결정알고리즘을 개발함. (Analytical Chemistry, 2008)

De novo 시퀀스 어셈블리 (De novo sequence assembly)는 레퍼런스 시퀀스 (reference sequence) 없이 주어진 DNA 시퀀스 조각들로부터 하나의 DNA 시퀀스를 재조립하는 작업이다. De novo 시퀀스 어셈블리 작업은 Overlap, Layout, Consensus 단계로 진행되는데 overlap 단계가 가장 많은 시간을 차지한다. 컴퓨터 이론 분야에서는 이 overlap 단계를 All-Pairs Suffix-Prefix 문제로 정의하고 많은 연구가 진행되어왔다.

  • All-pairs suffix-prefix 문제를 푸는 세계 최고 성능의 알고리즘을 개발함 (Algorithm engineering for all-pairs suffix-prefix matching, International Symposium on Experimental Algorithms, 2017)

최근 주요 연구성과

  • [Theor. Comput. Sci. 2020] Fast string matching for DNA sequences
  • [BIBM 2020] Homomorphic Computation of Local Alignment
  • [J. Compute Biol 2024] Finding Highly Similar Regions of Genomic Sequences Through Homomorphic Encryption