科研范式數(shù)字化轉(zhuǎn)型,“數(shù)都上?!比绾伟l(fā)力
■薛菁華 陳廣玉
(資料圖片)
【編者按】隨著新一代信息技術(shù)的飛速發(fā)展,海量的大數(shù)據(jù)已經(jīng)成為國(guó)家重要的基礎(chǔ)性戰(zhàn)略資源,引領(lǐng)著新一輪的科技創(chuàng)新。日前發(fā)布的《數(shù)字中國(guó)建設(shè)整體布局規(guī)劃》高度重視公共數(shù)據(jù)的作用,提出推動(dòng)公共數(shù)據(jù)匯聚利用,建設(shè)公共衛(wèi)生、科技、教育等重要領(lǐng)域國(guó)家數(shù)據(jù)資源庫(kù)。《上海市全面推進(jìn)城市數(shù)字化轉(zhuǎn)型“十四五”規(guī)劃》強(qiáng)調(diào)“數(shù)字化將不斷催生科技創(chuàng)新新范式”是正在發(fā)生的重要趨勢(shì)之一。
傳統(tǒng)的科研范式面臨數(shù)字化轉(zhuǎn)型的需要。厘清科研范式發(fā)展及數(shù)字化轉(zhuǎn)型的過(guò)程,摸清上海家底,有助于幫助上海在關(guān)鍵科研領(lǐng)域?qū)崿F(xiàn)突破,進(jìn)而在全球的科技博弈中贏得戰(zhàn)略主動(dòng)。《文匯智庫(kù)》特刊發(fā)入選2022年《上海智庫(kù)報(bào)告》的市科委軟科學(xué)研究項(xiàng)目“科研范式數(shù)字化轉(zhuǎn)型國(guó)內(nèi)外對(duì)標(biāo)與實(shí)施路徑研究”部分研究成果,以饗讀者。
科學(xué)發(fā)展的本質(zhì)就是科研范式的變革過(guò)程
范式(paradigm)的概念最早由美國(guó)科學(xué)史學(xué)家托馬斯·塞繆爾·庫(kù)恩(Thomas Samuel Kuhn)提出,是指科學(xué)共同體成員共同接受的理論體系,是把握研究對(duì)象的一種思維方法。范式一旦轉(zhuǎn)變,科學(xué)家思考問(wèn)題和觀察世界的方法亦會(huì)隨之改變。而科研范式是指科學(xué)共同體為了使日常科研工作高效有序運(yùn)轉(zhuǎn)所普遍采用的一套規(guī)則體系的集合,涉及建制環(huán)境、研究路徑、評(píng)價(jià)體系、研究方法、研究工具、技術(shù)路線與研究模式等要素,它會(huì)受到社會(huì)、經(jīng)濟(jì)、文化、國(guó)際環(huán)境以及個(gè)體偏好等因素的影響。簡(jiǎn)單來(lái)講,范式影響科研范式的選擇,當(dāng)兩者相匹配時(shí),科技創(chuàng)新活動(dòng)會(huì)呈現(xiàn)出活躍而高產(chǎn)的狀態(tài),反之亦然。
科學(xué)發(fā)展的本質(zhì)就是“科學(xué)革命”的過(guò)程,也是科研范式形成、確定、危機(jī)、變革和更新的過(guò)程。新范式的產(chǎn)生,一方面是因?yàn)榉妒奖旧淼陌l(fā)展,另一方面是由于外部環(huán)境的推動(dòng)。隨著信息技術(shù)日新月異、顛覆性技術(shù)層出不窮、社會(huì)環(huán)境快速變化,傳統(tǒng)的科研范式受到大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈、云計(jì)算等新一代信息技術(shù)的影響,科學(xué)研究的思維、方法和過(guò)程也面臨著巨大的挑戰(zhàn)。因此,科研范式的數(shù)字化轉(zhuǎn)型是科學(xué)技術(shù)發(fā)展的結(jié)果,而把握科研范式數(shù)字化轉(zhuǎn)型則將大大推動(dòng)多學(xué)科融合發(fā)展,提高科學(xué)新發(fā)現(xiàn)的機(jī)會(huì),提升上??萍紕?chuàng)新的活力,為上海參與世界前沿科技攻關(guān),解決科技創(chuàng)新“卡脖子”問(wèn)題做好準(zhǔn)備。
科研范式的數(shù)字化轉(zhuǎn)型主要集中在數(shù)據(jù)密集型科學(xué)和開(kāi)放科學(xué)兩個(gè)階段。2007年,在美國(guó)國(guó)家科學(xué)研究委員會(huì)計(jì)算機(jī)科學(xué)與電信委員會(huì)(NRC-CSTB)組織召開(kāi)的會(huì)議上,圖靈獎(jiǎng)得主、關(guān)系型數(shù)據(jù)庫(kù)鼻祖吉姆·格雷(Jim Gray)發(fā)表了題為“第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)”的主題演講,在經(jīng)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)三大范式之后,提出了基于數(shù)據(jù)密集型計(jì)算的科學(xué)研究第四范式。第四范式實(shí)現(xiàn)了由傳統(tǒng)的假設(shè)驅(qū)動(dòng)向數(shù)據(jù)驅(qū)動(dòng)的轉(zhuǎn)變,完成了科研范式的數(shù)字化轉(zhuǎn)型。
步入大數(shù)據(jù)時(shí)代,數(shù)據(jù)密集型科學(xué)迎來(lái)再發(fā)展階段,其研究對(duì)象、研究?jī)?nèi)容進(jìn)一步延伸,在數(shù)字技術(shù)的基礎(chǔ)上,研發(fā)活動(dòng)向網(wǎng)絡(luò)化、生態(tài)化方向發(fā)展,開(kāi)源開(kāi)放、知識(shí)共享成為新趨勢(shì),進(jìn)而催生出一種更強(qiáng)調(diào)包容與合作的新范式——開(kāi)放科學(xué)。2019年和2021年,經(jīng)濟(jì)合作與發(fā)展組織(OECD)以及聯(lián)合國(guó)教科文組織(UNESCO)相繼在各自的政策文本中表達(dá)了“開(kāi)放科學(xué)是科學(xué)研究新范式”的類似觀點(diǎn)。開(kāi)放科學(xué)是科學(xué)研究受到數(shù)字化轉(zhuǎn)型影響而產(chǎn)生的一種新范式,旨在實(shí)現(xiàn)人人皆可公開(kāi)使用、獲取和重復(fù)使用科學(xué)知識(shí),增進(jìn)科學(xué)合作和信息共享,并向科學(xué)界以外的社會(huì)行為者開(kāi)放科學(xué)知識(shí)的創(chuàng)造、評(píng)估和傳播進(jìn)程。開(kāi)放獲取、開(kāi)放數(shù)據(jù)和開(kāi)放協(xié)作是開(kāi)放科學(xué)的三大關(guān)鍵要素。
推動(dòng)科研范式數(shù)字化轉(zhuǎn)型,關(guān)鍵在科學(xué)數(shù)據(jù)管理
隨著信息技術(shù)的快速發(fā)展和信息獲取能力的不斷提升,全球科技創(chuàng)新已進(jìn)入以大數(shù)據(jù)為驅(qū)動(dòng)的數(shù)據(jù)密集型科研范式以及追求科學(xué)過(guò)程高透明、高品質(zhì)和高參與性的開(kāi)放科學(xué)范式。無(wú)論是數(shù)據(jù)密集型科學(xué)還是開(kāi)放科學(xué),科學(xué)數(shù)據(jù)都是核心要素。數(shù)據(jù)密集型科學(xué)最典型的特點(diǎn)便是對(duì)海量數(shù)據(jù)進(jìn)行挖掘和分析,可以說(shuō),數(shù)據(jù)密集型科學(xué)因數(shù)據(jù)而起源,由數(shù)據(jù)計(jì)算而產(chǎn)生,并依托各項(xiàng)數(shù)據(jù)的分析與應(yīng)用而不斷發(fā)展。開(kāi)放科學(xué)的關(guān)鍵要素中同樣涉及科學(xué)數(shù)據(jù),即開(kāi)放數(shù)據(jù)。海量科學(xué)數(shù)據(jù)對(duì)生命科學(xué)、天文學(xué)、空間科學(xué)、地球科學(xué)、物理學(xué)等多個(gè)學(xué)科領(lǐng)域的科研活動(dòng)帶來(lái)了沖擊性的影響,科技創(chuàng)新越來(lái)越依賴于科學(xué)數(shù)據(jù)的綜合分析。因此,要用好科學(xué)數(shù)據(jù),進(jìn)一步推動(dòng)科研范式的數(shù)字化轉(zhuǎn)型,關(guān)鍵在于科學(xué)數(shù)據(jù)管理。
當(dāng)前,科學(xué)數(shù)據(jù)已成為全球科學(xué)系統(tǒng)基礎(chǔ)設(shè)施的重要組成部分。由于科學(xué)數(shù)據(jù)具有學(xué)科領(lǐng)域分布廣泛、數(shù)據(jù)結(jié)構(gòu)多樣、數(shù)據(jù)共享困難等特點(diǎn),科學(xué)數(shù)據(jù)管理的研究和實(shí)踐活動(dòng)對(duì)整個(gè)社會(huì)、科研機(jī)構(gòu)或者科研人員來(lái)說(shuō)都具有重要意義。近年來(lái),發(fā)達(dá)國(guó)家不斷加大科學(xué)數(shù)據(jù)開(kāi)放共享的步伐。例如,美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)在2022年9月宣布,計(jì)劃建立國(guó)家級(jí)的數(shù)據(jù)基礎(chǔ)設(shè)施“開(kāi)放知識(shí)網(wǎng)絡(luò)”(OKN),進(jìn)一步擴(kuò)大科學(xué)數(shù)據(jù)的開(kāi)放共享及參與研究的機(jī)會(huì),支持21世紀(jì)科學(xué)數(shù)據(jù)和下一代人工智能的發(fā)展,以應(yīng)對(duì)美國(guó)面臨的復(fù)雜的國(guó)家挑戰(zhàn)。
科學(xué)數(shù)據(jù)資源的妥善使用和管理,既關(guān)乎我國(guó)科研力量和進(jìn)步,也關(guān)乎國(guó)家安全。我國(guó)在科學(xué)數(shù)據(jù)管理方面長(zhǎng)期以來(lái)都是實(shí)踐先于政策。2018年出臺(tái)的《科學(xué)數(shù)據(jù)管理方法》是首次在國(guó)家層面釋放出開(kāi)放為主的科學(xué)數(shù)據(jù)管理信號(hào)。在科研范式數(shù)字化轉(zhuǎn)型過(guò)程中,我們特別要對(duì)可能面臨的問(wèn)題加以警惕,如科學(xué)數(shù)據(jù)大量流入國(guó)外數(shù)據(jù)庫(kù),科研人員過(guò)度依賴國(guó)外數(shù)據(jù)庫(kù)等。《數(shù)字中國(guó)建設(shè)整體布局規(guī)劃》高度重視公共數(shù)據(jù)的作用,提出“構(gòu)建國(guó)家數(shù)據(jù)管理體制機(jī)制,健全各級(jí)數(shù)據(jù)統(tǒng)籌管理機(jī)構(gòu)”,并強(qiáng)調(diào)“增強(qiáng)數(shù)據(jù)安全保障能力”。
上海推動(dòng)科研范式數(shù)字化轉(zhuǎn)型的優(yōu)勢(shì)與路徑
全面推進(jìn)城市數(shù)字化轉(zhuǎn)型,加快建設(shè)具有世界影響力的國(guó)際數(shù)字之都,是上海的堅(jiān)定目標(biāo)。在此背景下,上海推動(dòng)科研范式數(shù)字化轉(zhuǎn)型勢(shì)在必行。作為我國(guó)經(jīng)濟(jì)發(fā)展最活躍、開(kāi)放程度最高、創(chuàng)新能力最強(qiáng)的城市之一,上海一直致力于建設(shè)具有全球影響力的科創(chuàng)中心,這為上海推動(dòng)科研范式實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型奠定了基石。
第一,創(chuàng)新主體不斷向科學(xué)最前沿和技術(shù)最前端發(fā)起挑戰(zhàn),成為推動(dòng)上??蒲蟹妒綌?shù)字化轉(zhuǎn)型的有力引擎。在滬高校創(chuàng)新策源能力全國(guó)領(lǐng)先;國(guó)家實(shí)驗(yàn)室、中科院在滬院所、新型研發(fā)機(jī)構(gòu)及各類平臺(tái)不斷發(fā)揮自身特色,加速推進(jìn)科技創(chuàng)新;企業(yè)主體圍繞科技創(chuàng)新不斷發(fā)力,民營(yíng)企業(yè)迸發(fā)出前所未有的科技創(chuàng)新活力。這些具有研發(fā)實(shí)力和能力的創(chuàng)新主體,對(duì)科研范式數(shù)字化轉(zhuǎn)型都有非常迫切的需求,將成為上??蒲蟹妒綌?shù)字化轉(zhuǎn)型的有力推動(dòng)者。
第二,創(chuàng)新能力穩(wěn)步提升在國(guó)內(nèi)外取得重要影響力,成為推動(dòng)上??蒲蟹妒綌?shù)字化轉(zhuǎn)型的重要實(shí)力保障。上海已初步形成世界級(jí)大科學(xué)設(shè)施集群,集聚了以國(guó)家實(shí)驗(yàn)室為引領(lǐng)的330余家國(guó)家級(jí)研發(fā)機(jī)構(gòu),在用在建同步輻射光源、硬X射線裝置等14個(gè)國(guó)家重大科技基礎(chǔ)設(shè)施,設(shè)施數(shù)量、投資額和建設(shè)進(jìn)度均全國(guó)領(lǐng)先。與此同時(shí),上??蒲腥藛T在腦科學(xué)、量子科技、納米材料、基因與蛋白等領(lǐng)域取得一批具有國(guó)際影響力的原創(chuàng)成果。這些都是上海創(chuàng)新能力在硬件和軟件方面獲得顯著提升的有力證明,也成為上海科研范式數(shù)字化轉(zhuǎn)型能得以實(shí)現(xiàn)的重要實(shí)力保障。
第三,創(chuàng)新環(huán)境不斷優(yōu)化加速創(chuàng)新要素不斷集聚,成為推動(dòng)上??蒲蟹妒綌?shù)字化轉(zhuǎn)型的堅(jiān)實(shí)后盾。上海在科創(chuàng)人才引育、金融支持科創(chuàng)、知識(shí)產(chǎn)權(quán)保護(hù)、開(kāi)放協(xié)同創(chuàng)新、創(chuàng)新創(chuàng)業(yè)扶持、科技體制改革等重點(diǎn)領(lǐng)域,持續(xù)加大政策支持力度,吸引聚集科技創(chuàng)新要素,不斷優(yōu)化創(chuàng)新生態(tài)環(huán)境。這些舉措極大地優(yōu)化了上??萍紕?chuàng)新的整體環(huán)境,為上??蒲蟹妒綄?shí)現(xiàn)數(shù)字化轉(zhuǎn)型,并不斷催生新的科研范式提供肥沃的土壤。
科學(xué)數(shù)據(jù)管理是上海科研范式數(shù)字化轉(zhuǎn)型的地基。為了打好這一地基,上海亟待在以下方面加以突破:
在頂層設(shè)計(jì)方面,抓緊出臺(tái)地方政策。上??勺プ∪袛?shù)字化轉(zhuǎn)型的契機(jī),從開(kāi)放性、規(guī)范性、安全性等角度出發(fā),適時(shí)研究各地、各領(lǐng)域的科學(xué)數(shù)據(jù)管理規(guī)則、標(biāo)準(zhǔn)與共享規(guī)范,盡快出臺(tái)上??茖W(xué)數(shù)據(jù)管理的地方細(xì)則。
在支持方向方面,注意優(yōu)勢(shì)領(lǐng)域齊抓并舉。上??捎密浻布R抓并舉的思路,加快推進(jìn)科研范式數(shù)字化轉(zhuǎn)型。一是建設(shè)一支由高校、科研機(jī)構(gòu)、企業(yè)研發(fā)部門、出版機(jī)構(gòu)、大科學(xué)裝置、研發(fā)基地、數(shù)據(jù)中心、科技情報(bào)機(jī)構(gòu)等不同領(lǐng)域的專家組成的高級(jí)專家團(tuán)隊(duì),為上海實(shí)現(xiàn)科研范式數(shù)字化轉(zhuǎn)型出謀劃策。二是了解上??蒲袃?yōu)勢(shì)領(lǐng)域相關(guān)機(jī)構(gòu)對(duì)于數(shù)字化轉(zhuǎn)型的需求,加速推進(jìn)領(lǐng)域內(nèi)科研范式數(shù)字化轉(zhuǎn)型的進(jìn)程。三是重視上海研發(fā)基地、研發(fā)平臺(tái)和大科學(xué)裝置的數(shù)據(jù)存算能力設(shè)施建設(shè)。
在基礎(chǔ)設(shè)施方面,加緊落實(shí)存算一體平臺(tái)??蒲谢顒?dòng)專業(yè)性極強(qiáng),科研數(shù)據(jù)對(duì)于保存、分析和利用的要求也相對(duì)較高,一般商業(yè)云無(wú)法滿足對(duì)科研活動(dòng)的支撐,因此有必要為科研工作者打造一朵具有存算一體和海量資源開(kāi)放共享功能的科研“云”。
在人才培養(yǎng)方面,加快建立人才培養(yǎng)體系。數(shù)字化轉(zhuǎn)型帶來(lái)的最大挑戰(zhàn)是數(shù)字化人才的短缺。應(yīng)不斷提高上海科技工作者的數(shù)字素養(yǎng),為上海的科技創(chuàng)新提供有力的數(shù)字技術(shù)支撐。可借鑒歐美等發(fā)達(dá)國(guó)家和地區(qū)的經(jīng)驗(yàn),一是在高校開(kāi)設(shè)“科學(xué)數(shù)據(jù)管理課程”,引入數(shù)據(jù)教育長(zhǎng)期計(jì)劃,系統(tǒng)化培養(yǎng)數(shù)據(jù)管理人才。二是為科研工作者開(kāi)設(shè)短期的數(shù)據(jù)管理培訓(xùn)課程,提升科研人員的數(shù)字素養(yǎng)。
在機(jī)制保障方面,敢于突破相關(guān)體制機(jī)制?,F(xiàn)階段可以從科研經(jīng)費(fèi)預(yù)算設(shè)置和專業(yè)人員配備兩個(gè)方面進(jìn)行突破,打破傳統(tǒng)的固有做法,為上??萍紕?chuàng)新?tīng)I(yíng)造積極向上、健康有序的科研環(huán)境。第一,進(jìn)一步明確科研經(jīng)費(fèi)預(yù)算編制科目中有關(guān)科研云的租賃費(fèi)用以及相關(guān)科學(xué)數(shù)據(jù)處理費(fèi)用的支出依據(jù)。第二,解決高校及科研機(jī)構(gòu)缺乏數(shù)字設(shè)備運(yùn)維及數(shù)字技術(shù)支持的專業(yè)人員的問(wèn)題。
[作者分別為上海圖書(shū)館(上海科學(xué)技術(shù)情報(bào)研究所)副研究員;正高級(jí)工程師]
相關(guān)鏈接
科學(xué)研究四個(gè)范式
經(jīng)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)和數(shù)據(jù)密集型科學(xué)是科學(xué)研究的四個(gè)范式。
2007年,圖靈獎(jiǎng)得主、關(guān)系型數(shù)據(jù)庫(kù)鼻祖吉姆·格雷(Jim Gray)在美國(guó)國(guó)家科學(xué)研究委員會(huì)計(jì)算機(jī)科學(xué)與電信委員會(huì)(NRC-CSTB)組織召開(kāi)的會(huì)議上發(fā)表的題為“第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)”的主題演講中指出:經(jīng)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)和數(shù)據(jù)密集型科學(xué)是科學(xué)研究的四個(gè)范式。
經(jīng)驗(yàn)科學(xué)即第一范式,也稱為實(shí)驗(yàn)科學(xué),指以實(shí)驗(yàn)方法為基礎(chǔ)的科學(xué)研究模式,在研究方法上以歸納為主,主要模型是科學(xué)實(shí)驗(yàn)。典型范例包括伽利略的動(dòng)力學(xué)、牛頓的經(jīng)典力學(xué)、哈維的血液循環(huán)學(xué)等。
理論科學(xué)即第二范式,偏重于對(duì)理論的總結(jié)和概括,用模型、數(shù)學(xué)公式、算法等表示形式,在研究方法上以演繹法為主。理論科學(xué)的主要研究模型是數(shù)學(xué)模型,典型范例包括數(shù)學(xué)中的圖論、集合論、概率論、數(shù)論;物理學(xué)中的相對(duì)論、圈量子引力理論、弦理論等等。
計(jì)算科學(xué)即第三范式,是一個(gè)與數(shù)據(jù)模型構(gòu)建、定量分析方法以及利用計(jì)算機(jī)來(lái)分析和解決科學(xué)問(wèn)題相關(guān)的研究領(lǐng)域,主要用于對(duì)各個(gè)學(xué)科中的問(wèn)題進(jìn)行計(jì)算機(jī)模擬和其他形式的計(jì)算。計(jì)算科學(xué)的主要研究模型是計(jì)算機(jī)仿真和模擬,其典型范例包括:熱力學(xué)、分子問(wèn)題、人工智能和信號(hào)系統(tǒng)等。
數(shù)據(jù)密集型科學(xué)即第四范式,由傳統(tǒng)的假設(shè)驅(qū)動(dòng)向基于科學(xué)數(shù)據(jù)進(jìn)行探索的科學(xué)方法的轉(zhuǎn)變。數(shù)據(jù)密集型科學(xué)的主要研究模型包括機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘。其典型范例包括所有的大數(shù)據(jù)實(shí)踐場(chǎng)景,以及基于大數(shù)據(jù)的人工智能。
當(dāng)前,全球科技創(chuàng)新已進(jìn)入以大數(shù)據(jù)為驅(qū)動(dòng)的數(shù)據(jù)密集型科研范式以及追求科學(xué)過(guò)程高透明、高品質(zhì)和高參與性的開(kāi)放科學(xué)范式。
關(guān)鍵詞: 數(shù)據(jù)管理 科技創(chuàng)新 第四范式