為了發揮清華大學多學科優勢,搭建跨學科交叉融合平台,創新跨學科交叉培養模式,培養具有大數據思維和應用創新的「π」型人才,由清華大學研究生院、清華大學大數據研究中心及相關院系共同設計組織的「清華大學大數據能力提升項目」開始實施並深受校內師生的認可。項目通過整合建設課程模塊,形成了大數據思維與技能、跨界學習、實操應用相結合的大數據課程體系和線上線下混合式教學模式,顯著提升了學生大數據分析能力和創新應用能力。
至今,已有來自全校45個院系的3055名同學參加大數據能力提升項目,其中556位同學通過課程學習和實踐獲得由清華大學研究生院頒發的「清華大學大數據能力提升項目證書」。
談起最大的收穫,同學們表示無論是自身的數據思維還是本專業與大數據技術相結合的科研能力以及實踐經驗等方面均得到了很大的提升。清華的數據科學人才培養究竟有什麼特別之處?讓我們一起通過他們的故事,揭秘各院系清華學子的大數據提升之路吧!
李明軒 電機系
我是電機系二年級博士生李明軒,從本科期間便對人工智能技術感興趣,自學了很多人工智能相關知識,而研究生階段的大數據項目對我的知識儲備、編程技能、行業認知等方面都帶來了極為顯著的提升,也為了今後的科研及人生選擇打開了一扇新的大門。課程知識方面,除去實踐課以外,我選修了大數據分析(B)、數據可視化、深度學習等三門課程,這幾門課程相輔相成,為我的人工智能知識和編程技能帶來了質的飛越。大數據分析(B)是我上的第一門項目課,該課程內容廣泛,涵蓋了統計學知識、機器學習及深度學習算法、人工智能技術的前沿進展和落地等多方面內容。其中崔鵬老師講述的推薦系統、圖與網絡等知識更是引人入勝,讓我了解到深度學習算法在如今的社會中具有着巨大的價值,包括但不限於電商、搜索引擎、智慧城市、智慧醫療等領域,使我了解了許多大數據技術的前沿內容。此外,該課程的大作業是參與一次具有一定含金量的競賽,這次競賽顯著地提高了我的 debug 能力和對人工智能算法的實際認知。我有幸與軟院的同學組隊,並從他們的討論中收穫良多,這使得我不再僅僅是一名調包俠。在與他們的探討中,我意識到要仔細探索數據的分布,構造合適的數據集以保證模型的性能。最終,我所使用的採樣方法也顯著提高了預測效果,使得我們的排名成功殺入前 20,可以說是一次頗有價值的經歷。
我選修的第二門課是數據可視化,該課程直接讓我從 0到 1 了解了前端的內容。該課程手把手地交我們使用 D3.js 可視化庫,並且在實踐的過程中令我充分學習了javascript,css,html 的知識,並在大作業中掌握了 bootstrap,jquery 等庫,為我後面實踐課的前端開發打下了基礎。
我選修的第三門課是龍明盛老師的深度學習。難能可貴的是,龍老師用許多生動形象的方法詳細講解了各個深度學習方法的基本原理,這個方法為什麼要設計成這個樣子,其背後蘊含着怎樣的數學原理,這些對我的深度學習的認知以及今後的科研都帶來了顯著的收穫。
而大數據項目中最為我帶來收穫的是大數據實踐課。得益於項目導師的悉心指導,我們從零開始有效地掌握了以下內容:Hadoop、Spark 等大數據平台的基本原理及使用,網絡異常行為分析方法,基於 Javascript 的前端開發及基於 Flask 的後端開發,系統架構設計及產品研發、優化思路等,讓我們學到了如何從 0到 1 打磨出一款產品。令我印象深刻的就是其中的系統架構設計與產品優化部分,這些對我以後的思維和工作必然會產生重要影響。此外,我也有幸結識了許多優秀的同伴,他們從產品界面的設計、機器學習算法的思考、項目分工與合作等多方面給我帶來了巨大的啟發。而經由大家的共同努力,我們小組最終當選了優秀小組。
大數據實踐課成果展示

此外,在與項目導師的交流中也產生了一些對擇業的思考。本次項目我們是在賦樂科技完成的,這是一家初創企業。我們曾好奇為何項目導師選擇了這樣一家尚未上市的企業,他說在創業公司能夠更好地把握行業前沿,承擔更重要的工作,產生更開闊的視野。這些話都給我們帶來了一定的啟發。除去課內學習和實踐以外,大數據項目也給我的科研帶來了一定的幫助。我的本科畢業設計即為深度學習算法在電力系統中的應用。而在博士一年級期間,藉由導師的耐心指導和大數據課程知識的幫助,我成功地完成了第一篇學術論文。該論文將深度學習方法與混合整數規劃相結合,有效地提高了電力系統中機組組合問題的在線決策效率。該文目前已發表於 IEEE Transactions on Sustainable Energy 期刊。此外,我目前也基於深度學習方法完成了一些負荷缺失值填充、負荷預測等工作。我的博士課題也考慮圍繞人工智能方法在電力系統優化決策問題中的應用而展開。而在今後的科研工作中,我也會經常翻出來大數據項目的課程資料,鞏固自己的相關知識。整體而言,大數據項目對我的知識儲備、編程技能、學術研究、行業認知、就業方向等各方面都帶來了顯著的幫助。非常感謝大數據項目能為我帶來如此顯著的收穫,也希望大數據項目能夠越辦越好。