數據科學組

數據科學組目前共有員工7人,其中副研究員(碩導)1人,高級工程師2人,工程師4人。目前共有學生13人,其中博士生3人,碩士生6人,客座實習生4人。

 

數據科學組目前的研究方向是機器學習在領域數據處理及分析中的應用。目前我們關注的數據主要包括生物醫學圖像、大氣污染及環境數據以及生物信息中的基因數據。未來我們會關注智能醫療及智能預報的研究方向。

 

生物醫學圖像主要來源于北京大學分子醫學研究所。我們參與了北大分子醫學所程和平院士負責的國家重大科研儀器設備研制專項“超高時空分辨微型化雙光子在體顯微成像系統”,負責其中生物醫學圖像處理及分析的任務。此外,我們和首都醫科大學也合作開展了阿爾茲海默病癥(AD)方面的研究。

 

大氣污染及環境數據主要來源于中國科學院大氣物理研究所。目前關注于基于機器學習的智能空氣質量預報技術。其中空氣質量指數Air Quality Index (AQI)就是我們平常天氣預報中遇到的污染指數,主要考慮的污染物包括:PM2.5, PM10, SO2, NO2, O3, CO等6種,我們的研究目標是使得AQI的預報更準確。

 

基因數據來源于國內知名三甲醫院、臨床醫學研究所和國際各類的基因組計劃。通過統計、機器學習等多種算法、和高性能計算技術挖掘各種隊列的模式信息,為生命科學和醫學提供基礎性數據分析平臺。