前言:想要寫出一篇引人入勝的文章?我們特意為您整理了談數據科學與大數據技術專業課程體系范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:該文闡述了數據科學與大數據專業的設置必要性、專業的培養目標和知識能力結構,最后探索了數據科學與大數據專業的技術性課程體系設置方法。希望該文內容對數據科學與大數據技術專業的培養方案制訂和課程體系構造具有一定的指導意義和參考價值。
關鍵詞:數據科學;大數據技術;課程體系
1本專業的背景
數據科學隨著人工智能學科發展而產生。自1956年提出人工智能研究以來,人工智能經歷過推理研究期、知識表達研究期和機器學習期[1]。機器學習中歸納學習主要從數據歸納出規律,在20世紀80年代末期提出知識發現(Knowl-edgeDiscover,KDD),而20世紀90年代初產生了數據挖掘(DataMining)研究方向,數據挖掘成為20世紀90年代至21世紀初非常熱門的研究方向,各種數據挖掘研究問題和成果,形成了數據科學的主要內容。21世紀初,網絡技術的廣泛運用推動了信息領域的大規模數據產生與積累。從大量數據的統計分析中發現一些規律,成為業界亟須解決的一個技術問題,推動了大規模并行計算以及分布式計算技術的發展,產生了以Hadoop平臺為代表的大數據分析計算技術。國家在“十三五”規劃綱要中提出:“實施國家大數據戰略,推進數據資源開放共享”。黨的十八屆五中全會公報提出要實施“國家大數據戰略”,標志著大數據戰略正式上升為國家戰略。2015年9月,國務院印發的《促進大數據發展行動綱要》提出,加強專業人才培養,鼓勵高校設立數據科學和數據工程相關專業,重點培養專業化數據工程師等大數據專業人才。正是在這種背景下,2016年,我國設立了數據科學與大數據技術本科專業,第一批由北京大學、中南大學和中央財經大學等三所高校設立,第二批為2017年由32所高校設立。
2本專業的培養目標
在國外,數據科學與大數據技術(DataScience)專業是以數據分析學(DataAnalytics)專業為基礎發展而來的,在北美大學首先設立數據分析碩士學位,主要是抽象出底層的數據問題,連接計算機基礎學科與數據科學之間的空白。2013年,紐約大學等幾所美國高校設立了數據科學碩士學位,出現了數據科學專業概念[2]。該專業以數據科學與大數據分析開發為核心內容,并強調學生理解掌握數據領域的知識,具備為數據分析運用服務的技術能力。數據科學與大數據技術專業培養具有多學科交叉能力的大數據人才,其中,重點培養三方面的素質人才:理論型人才,主要應具備對數據科學中模型進行理解和運用的能力;實踐型人才,主要應具備處理實際數據的能力;應用型人才,主要應具備利用大數據的方法解決具體行業應用問題的能力。學生畢業后主要從事大數據產品開發或大數據分析,未來職業發展為企事業單位的數據信息高級管理員和分析師,或成為信息技術領域的涉及數據分析方向軟件開發工程師或算法分析師。具體目標為:掌握面向數據應用的統計學、數學、計算機科學以及應用領域學科的基礎理論和方法、熟練運用各種數據分析技術和手段;掌握數據尤其是大數據的采集、存儲、處理、分析與應用等技術,具備數據和大數據應用項目的設計和開發能力;能夠利用探索性數據分析技術對數據進行初步建模,并能利用統計推斷的基本理論、方法對數據進行分析和產品化開發;在系統的專業技術訓練基礎上,具備廣泛的數據應用視野、能夠勝任大數據分析挖掘、大數據系統開發等技術領域以及大數據商務與金融等各類相關應用領域的多層次工作。
3數據科學與大數據技術專業知識能力結構
數據科學與大數據技術專業主要以計算機科學與技術專業為基本知識能力支撐、將人工智能的數據挖掘為拓展性能力,因此其涉及計算機科學與技術、人工智能、統計學等專業知識與能力,即掌握應用先進的計算技術并從大數據當中獲取知識與智慧的技術[3]。數據科學與大數據專業要求的知識與能力是計算機傳統知識能力、經典數據分析與新型數據分析手段;計算機的信息管理技術提供應用基礎技術,數學理論基礎和數理統計方法支持,新興技術平臺提供技術支持,通過多支持并以數據為核心所得出的技術。數據科學與大數據技術能力需求可以分為理論性能力和實踐性能力[4]。學生要有較強的數理統計基礎、數學建模能力、扎實的數據結構和算法基本功,能夠很好地理解和掌握各種機器學習和數據挖掘算法,還要掌握處理“大數據”的先進技術,即掌握云計算相關的大數據處理平臺及其生態系統。實踐性能力指處理實際數據的實踐能力,能夠掌握基本算法和系統開發能力,并且具備一定實際應用性能力,即利用大數據解決具體行業應用問題的能力。專業技術性能力要求為:具備數學能力,在基本數據技術及其在軟件開發中應用數學的能力。具備大數據應用程序開發實踐能力,能夠根據軟件需要設計簡單的解決方案,能根據給出的設計方案實現軟件開發;具備應用大數據知識將大數據和云計算知識用于分析解決復雜性工程問題的能力;具備能夠基于科學原理并采用科學方法對復雜工程問題進行研究的能力,包括設計實驗、分析與解釋數據,并能通過信息綜合得到合理有效的結論[5-6]。
4數據科學與大數據技術專業課程設計原則
專業技術性能力課程體系分為:數學基礎課、計算機相關課程、數據科學相關課程、大數據技術相關課程、領域相關課程。各高校可根據各自的專業定位選擇設置。數學基礎課:傳統計算機學科基礎數學主要有微積分、線性代數、概論統計學。專業數學基礎課可擴展為優化與運籌學課程:時間序列導論、隨機過程分析、最優化方法、多元統計分析、運籌學。計算機相關課程:遵照中國工程教育認證的計算機類的通用標準主要有計算機科學導論、高級語言程序設計、算法與數據結構、操作系統、計算機組成原理、操作系統導論、軟件工程、數據庫原理與應用、計算機網絡等相關課程,根據本專業特點,建議增設算法分析與設計。數據科學相關課程:主要是圍繞數據挖掘與分析展開課程。根據需要掌握數據采集、數據存儲與管理、數據分析方法、數據展示等能力,可開設的課程有數據科學導論、數據挖掘與分析、機器學習、數據可視化、數據采集與爬蟲技術、數據的人文與倫理等課程。大數據技術相關課程:須掌握利用相關大數據技術平臺和開發方法,實現數據科學理論的分析方法。面向大數據實際應用能力培養,比較典型大數據平臺開發課程主要有Spark開發技術、Hadoop編程平臺、HBase大數據快速讀寫、大數據系統應用實驗、云計算。領域相關課程:這方面課程主要面向專業方向選修課,其包括兩類,一類是通用領域的相關課程,例如自然語言處理、圖像分析與處理、語音分析或相關領域的數據分析、大數據案例分析與實驗、文本挖掘分析、智能系統推薦等;另一類是與行業相關的領域課程,例如農業大數據分析、電子商務大數據分析、電力數據分析等,可根據各高校的專業特色定位而開設。
參考文獻
[1]顧險峰.人工智能的歷史回顧和發展現狀[J].自然雜志,2016,38(3):157-166.
[2]孫書韜,朱立谷,李春芳.北美知名大學數據科學專業課程體系分析[J].中國教育信息化,2019(24):48-50.
[3]賀文武,劉國買.數據科學與大數據技術專業核心課程建設的探索與研究[J].教育評論,2017(11):31-35.
[4]楊洪,李知遙,張志強.數據科學與大數據技術專業實踐能力培養體系的探索與實踐[J].成都大學學報(社會科學版),2018(3):106-112.
[5]劉穎,王愛蓮,宣齊娜,等.新工科背景下數據科學與大數據技術專業建設探析:以地方財經類高校為例[J].吉林工商學院學報,2019,35(6):106-109.
[6]周四軍,熊偉強.如何構建數據科學與大數據技術本科專業課程體系[J].才智,2017(25):60.
作者:劉建華 胡文瑜 唐鄭熠 林芳 單位:福建工程學院信息科學與工程學院