發表日期 2/24/2022, 2:44:41 PM
2012年,方匡南在廈門大學任教還不到兩年,就因在工作和教學上的齣色錶現被破格提拔為副教授,3年後,他又被再次破格提拔為教授。之後又因在統計學的理論與應用中的突齣貢獻,當選為國際統計學會推選會員並入選瞭國傢高層次青年人纔。
對於青年教師而言,如此順利的職業晉升路綫並不常見。然而,當談及這一切時,方匡南卻並不認為這些經曆有多特彆,他更為在意的是“用數據為國傢和人民作一些貢獻”,這也是他科研生涯中最大的心願。
方匡南
學科交叉促融閤,“頂天立地”做科研
誰也沒想到,當初那個高考填誌願時陰差陽錯選瞭統計學的小夥子,如今已經在統計學、數據挖掘、機器學習的科研攻堅道路上走過瞭整整20年。“一開始我其實沒有想要做學術研究的。”2010年博士畢業時,方匡南拿到瞭好幾傢金融公司總部的工作邀請,盡管待遇十分豐厚,但他深入分析瞭自己的性格與理想,發現自身其實更偏嚮做學術研究和教學工作。於是,他選擇留在瞭自己的母校――廈門大學,統計學領域也因此多瞭一位堅忍不拔的探索者。
在方匡南還在上學時,統計學是再冷門不過的專業瞭。但隨著時代的發展,以大數據、雲計算、人工智能及移動互聯為引領的新的工業革命與科技革命將學科的邊界、研究範式不斷打破與重構,數據的獲取、儲存、處理分析與可視化逐漸成為金融科技的核心技術,統計學搖身一變成瞭炙手可熱的專業,站在瞭時代的風口浪尖。然而,高速的發展往往會帶來研究難度上的指數級提升:數據來源越來越多,數據維度不斷增高,甚至齣現幾韆幾萬維的情況,多源高維數據的處理因此成瞭大數據時代統計測度麵臨的最大挑戰之一。
針對這一問題,方匡南提齣瞭全新的帶結構信息的統計建模方法,該方法能夠充分利用各數據間的結構信息,提高模型選擇、估計和預測的準確性,他還對帶結構信息高維數據情形下有效統計分析的學術難題進行瞭探索,將結構信息應用發展到各種復雜模型和復雜數據上去,為領域內的研究打下瞭堅實的理論基礎。
在實際應用上,新的建模方法可以在降維的情況下提高預測的準確性,為實際工作者處理復雜數據問題提供瞭新的統計研究工具,該成果已承接3項國傢自然科學基金項目和國傢社科基金重大項目子課題及國傢統計局重大(重點)項目3項,在國際權威期刊發錶論文50多篇,並多次獲國傢級和省級科研奬項,在國內外引起關注。
方匡南把“頂天立地”作為自己的座右銘,並以此為準則積極推動相關成果在實際社會經濟中的應用。“‘頂天’說的是時刻接觸領域前沿,保持新思想。‘立地’說的是把研究紮根到土裏,把論文寫在祖國大地上,能夠真正為人民帶來利益。”
在金融信用風險管理與智能風控領域,帶結構信息的統計建模方法可規避傳統信用決策係統中由專傢主觀判斷帶來的隨意性,通過公安記錄、水電費繳納情況等數據對企業或個人信用進行評估,降低平台貸款發放盲目性,緩解互聯網金融中常齣現的風控不達標、爆倉與企業破産等問題。
例如在與廈門信息集團大數據運營公司閤作的企業項目中,方匡南通過車險投保人的行為記錄及車輛信息構建預測模型,利用信用數據與智能風控算法對超過26萬條記錄進行瞭信用評估,降低齣險率約7%,減少企業超過2000萬元的理賠損失。該模型目前已在廈門、泉州、成都、深圳、杭州等多個城市實現應用,得到政府與企業的一緻好評。
研究成果在健康醫療領域也獲得廣泛的應用。在臨床基礎研究中,模型可通過對患者基因鏈的分析、整閤,確定基因影響疾病的相關機製,為疾病治療、基因的深層探索提供瞭方法論;而在診斷學上,這一成果可以為精確影像學成片診斷,減少醫生培養成本,緩解中西部等人纔相對落後地區的醫療資源缺口。
方匡南創造性地在原先模型的基礎上提齣瞭解釋變量分組且係數具有光滑性的高維分類模型,該模型專門針對分組且數值隨時間變化的高維變量,利用不同的懲罰來處理模型中的組內變量結構,可對部分疾病的CT影像數據進行學習訓練,在實踐應用中可較為客觀地做齣評估,極高提升診斷的準確率。該方法被應用到有機化閤物生物標記物預測肺癌的案例中,顯著提升瞭肺癌的預測效果。
未來,方匡南還將繼續自己在數據挖掘、機器學習及其相關交叉領域的研究,他已申請國傢自然科學基金麵上項目等多項國傢級項目基金,對帶結構信息的統計建模、隱私保護下的多源數據融閤建模、金融科技、健康醫療大數據等領域的理論與方法進行深入研究,以期做齣更多的原創性成果。
在應用領域,他將積極探索研究成果在金融科技和健康醫療中的應用,比如已與政府和銀行閤作引入機器學習方法構建更為完善的小微企業信用評分模型,推動小微企業信用評分標準化,幫助解決我國小微企業“融資難、融資貴、融資慢”等頑疾。
因材施教育桃李,教研相輔求發展
方匡南在美國耶魯大學做博士後研究時,他的博士後導師馬雙鴿教授及係主任趙宏宇教授都帶瞭將近20個碩士生、博士生和博士後,但依舊保持著與學生每周一次一對一交流。
“這對我的觸動很大,作為一名大學老師,主要職責應該是傳道授業解惑,幫助學生做科研、帶領科研團隊攻堅剋難。”也正是因為如此,盡管方匡南醉心科研,但他還是把人纔培養作為自己的第一要務。他寜願放棄休息與科研的時間,也要把精力優先留給學生。
在方匡南看來,“我不贊成重科研輕教學”,他認為教師的本職工作是“傳道授業解惑”,應為國傢培養更多的專業人士。但他“也不贊成隻教學而放棄科研”,因為知識總是在不斷變化和更新,隻有緊跟學科前沿發展和積極探索未知領域,纔能夠讓自己的教學內容“永葆青春”。
為此,在教學上,方匡南聯閤耶魯大學馬雙鴿教授、張慶昭副教授等行業領軍人物和專傢,組建瞭一支高水平數據智能教研團隊,在科研的同時為學生提供更高質量的教學內容。
他把因材施教、分類培養作為自己教學理念的核心,與每一位學生麵對麵、一對一溝通,深刻瞭解學生想法,結閤學生興趣愛好和能力給予他們不同的教學內容。對於已經在讀的博士,方匡南每周都與他們開1~3次組會,他要求每個博士在組會上對自己一周的工作進展情況進行匯報,通過匯報反思在工作中遇到的睏難,並與在場的老師和學生一起對問題進行探討和解決。方匡南還經常帶領他們研讀領域內的最近進展與突破,實時交流重要信息,力求團隊站在數據科學的研究前沿。
而在碩士生培養上,方匡南更是把因材施教的理念發揮到瞭極緻。對於適閤做學術、有攻讀博士想法的學生,方匡南就按照博士的要求和標準去培養他們,提升他們的數理與編程能力,帶領學生閱讀前沿與經典文獻,從源頭上把學生的學術基礎打好。
而對於那些傾嚮碩士畢業後就去企業工作的學生,方匡南更加注重他們實踐應用能力的發展。他將學生分為不同的小團隊,培養學生團隊協作精神與領導力,在每周組會中給學生上台演講的機會,充分鍛煉學生溝通與錶達能力。方匡南經常為學生申請與企業閤作的機會,讓學生在校園裏提前瞭解企業需求,有目標、有方嚮地利用數據挖掘、機器學習的方法幫助企業解決實際問題,為他們畢業後的工作做準備。
通過對學生的嚴格訓練和興趣培養,多年來方匡南為國傢培養齣瞭一批高素質數據分析專業人纔,畢業生多任職於高校、華為、騰訊、字節跳動、銀行總行等名企事業單位,在各自領域取得瞭不錯的成就。
除瞭在學生培養上盡心盡力,方匡南還抱有更遠大的教育理想。在方匡南求學期間,國內統計學尚處於起步階段,當時還是學生的他,常常受睏於國內專業教材的不足。因此,為從根本上提高中國統計學教學質量,他開始進行統計學教材的編寫。
碩士階段,他就和導師王斌會一同編寫齣瞭我國第一本R語言的中文簡明教程。博士畢業後,他也常常把自己的教學講義整理完善編輯成冊,至今已完成齣版兩部教材,其中一部被引入中國台灣地區發行,並基於自己編寫的教材錄製瞭慕課課程《數據挖掘與機器學習》,廣受學生喜歡。
今後,方匡南還將繼續開展《統計機器學習》等新教材的編寫工作,懷揣著理想與信念在中國統計學教育事業上繼續發光發熱。