Data Mining & Bioinformatics Laboratory

Data Science

The flood of big data represents immense opportunity for making discoveries. Data scientists exploit powerful new approaches by combining aspects of computer science, statistics, applied mathematics, and visualization so that they can translate the vast amounts of data into new insights and new knowledge in various fields, including medicine, social science, engineering, marketing, business, public affair and so on.

우리는 현재 방대한 양의 데이터 속에서 살아가고 있다. 많은 양의 데이터 중에서 우리가 필요한 정보를 발견하는 것이 바로 데이터 과학이다. 데이터 과학은 데이터를 분석하고 예측하여 의미 있는 정보를 발견하는 분야를 의미한다. 데이터의 양이 증가함에 따라 이를 효율적으로 처리하는 방법의 필요성이 부각되었다. 데이터 과학의 대표적인 예는 머신 러닝 (Machine learning), 인공지능 (Artificial intelligence) 등이 있다. 또한 데이터 과학은 의학, 소셜 미디어, 마케팅, 비즈니스와 같은 다양한 분야에서 활용되고 있다.

Network Biology & Network Medicine

Linear connections between genotype and phenotype had been expected to underlie biological system. But the reality is that the most genotype-phenotype relationships arise from a much higher complex biological systems. To decipher the properties of biological systems, network formalism is on demand. Network science simplify complex biological systems into biological network in which nodes are metabolites and macromolecules such as protein and edges are physical, biochemical and functional interactions. By exploring and analyzing the biological networks, we will be able to understand how complex systems operate inside cells. Furthermore, this research can be extended to other domains, including social network analysis.

네트워크 (Network)는 노드 (Node)와 연결선 (Edge)으로 이루어진 집합을 의미한다. 네트워크 이론은 응용수학과 물리학 분야에서 다루는 이론으로, 수학의 그래프 이론에서 시작되었다. 네트워크는 전산학, 생물학, 경제학, 사회학 분야에서 널리 사용되고 있다. 생물학과 약학 분야에서, 각 객체 (유전자나 단백질, 분자 등)의 상호작용을 밝혀내는 것이 중요하다. 그러나, 객체의 개수와 그들의 상호작용 수가 많아지면 이를 표현하고 이해하는 것이 매우 어렵다. 또한 객체가 작용하는 메커니즘을 이해하기도 어려워진다. 따라서 네트워크를 적용하여 시각화 및 분석을 하면 작용 메커니즘을 쉽게 밝힐 수 있으며 생명현상을 효과적으로 설명할 수 있다.

Computational Drug Development

The exponential growth of genomic and phenotypic data related to drug response is facilitating our understanding of drug action. However, there are lack of promising and efficient tools that properly utilize these data for discovering new indications from existing drugs. Advanced computational strategies are critical to attain a basis of precision medicine as well as to take a shortcut to find new drug indications.

새로운 약물을 생산하기 위해서는 많은 시간과 비용이 발생한다. 이렇게 만들어진 약물의 대다수가 임상 실험 과정에서 효과 부족, 부작용 등의 이유로 판매할 수 없게 된다. 신약 재창출 (Drug repositioning)은 임상 실험 과정에서 불합격된 약물이나, 현재 시판되고 있는 약물이 치료하는 질병 이외의 다른 용도를 발견하는 방법을 의미한다. 신약 재창출의 대표적인 예로는 비아그라 (Viagra)가 있다. 비아그라는 본래 협심증 치료를 위해 개발된 약물이다. 그러나 임상 실험 과정 중 남성 참가자의 발기부전에 효과가 있다는 것을 확인하고, 발기부전을 치료하는 약물로 시장에 출시되었다. 많은 시간과 비용이 소요되고, 새로 개발된 약물의 안정성 또한 확실치 않은 상황에서, 컴퓨터를 이용한 신약 재창출은 알고리즘을 활용하여 시간과 비용을 대폭 줄일 수 있으며 이미 안정성이 검증된 약물을 이용하기 때문에 앞서 언급된 단점을 극복할 수 있는 방법으로 부각되고 있다.