首頁>人物·生活>集·言論集·言論
王曉光 陳 靜:數(shù)字人文打開文化新視野
作者:王曉光 陳 靜
計算機可以幫助學者在紛繁龐雜的信息中快速發(fā)現(xiàn)和定位議題,在宏觀的學科脈絡(luò)中把握關(guān)鍵問題;學者又可以發(fā)揮個人學養(yǎng)所長,深刻探究問題所在,解釋背后的義理與規(guī)律
新興數(shù)字技術(shù)正在加速數(shù)字中國的構(gòu)建進程,以數(shù)字媒介和人工智能為基礎(chǔ)的新興文化形態(tài)和知識生產(chǎn)體系正日見雛形,數(shù)字人文正在積極引領(lǐng)文化時空的數(shù)字化轉(zhuǎn)換,并展現(xiàn)出廣闊的發(fā)展前景
數(shù)字人文是一種將計算機方法與技術(shù)融入人文研究,進而提出并回答人文問題的新范式。在傳統(tǒng)人文研究中,研究過程多表現(xiàn)為一種書齋式的、針對典籍文獻的細讀和考據(jù)。隨著計算機和電子文本的發(fā)展,研究者開始利用數(shù)據(jù)庫查找資料,并借助地理信息系統(tǒng)、機器學習、信息可視化等多種計算分析工具,開展認知計算、文本挖掘、情感分析、圖像識別、視覺分析、社會網(wǎng)絡(luò)分析、數(shù)字記憶構(gòu)建等研究。在此過程中,一些新型研究方法,如遠讀、文本計量、文化分析等陸續(xù)浮現(xiàn),并在文學、史學、文化研究等領(lǐng)域得到創(chuàng)新性應用。
為人文研究提供顯微鏡和望遠鏡
數(shù)字人文為人文研究開啟三種新維度,分別是快讀、遠讀、共讀。
快讀,指的是借助計算機技術(shù),大大加快閱讀和利用文獻資料的速度。隨著圖書文獻的數(shù)字化轉(zhuǎn)換,高校、科研院所、圖書館等機構(gòu)建設(shè)了大量數(shù)字資源。如果用傳統(tǒng)研究方式,以個人之力“窮盡”所有文獻資源,根本不可能。如何從海量數(shù)字資源中發(fā)現(xiàn)并獲取所需文獻,完成研究任務,這就需要元數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)、知識圖譜等數(shù)字技術(shù)支撐研究者實現(xiàn)“快讀”的需求。比如《紅樓夢》中姓名稱謂有730多個,想要從70多萬字的文本中找到這些人名,需要花費大量時間。清華大學統(tǒng)計學研究中心團隊利用數(shù)據(jù)科學方法,在不到1分鐘的時間內(nèi),得到按照詞頻排列的各類詞,其中出現(xiàn)兩次以上的人名抓取準確率達93%以上。這極大縮短了研究者的搜索查詢時間,同時還減少了手工篩選過程中的失誤。再比如中國歷代人物傳記資料庫,共收錄超過42萬條人物傳記資料,記錄了各方面的詳細數(shù)據(jù),這些數(shù)據(jù)可以為各領(lǐng)域的人物關(guān)系和歷史事件研究提供基礎(chǔ)數(shù)據(jù)支撐,檢索技術(shù)可以幫助研究者快速獲取所需數(shù)據(jù)。
遠讀具有兩重含義,第一重含義是指傳統(tǒng)的細讀方法導致大量文學作品從未被研究者閱讀,如果要理解整個世界文學體系,就必須采取遠讀方法,聚焦“比文本小很多或大很多的單位:手法、主題、修辭或文類和體系”。在該理論影響下,研究者開始運用計算方法研究文學作品。也有學者將社會網(wǎng)絡(luò)分析方法和信息可視化技術(shù)相結(jié)合,描繪小說的敘事結(jié)構(gòu)、情節(jié)發(fā)展和人物關(guān)系。這些嘗試都為文學文本提供了一種新的解讀視角與研究路徑,凸顯了一種更為“宏大”的敘事邏輯。
遠讀的第二重含義是指時間跨度上較大或素材數(shù)量較多的研究,這在近年來數(shù)字文化遺產(chǎn)和數(shù)字博物館建設(shè)中體現(xiàn)得較為充分。在我國,敦煌研究院和上海博物館率先引入數(shù)字人文理念,并借助“數(shù)字敦煌”和“董其昌數(shù)字人文”書畫專題展覽,為文化遺產(chǎn)知識與數(shù)字資源的關(guān)聯(lián)性可視化呈現(xiàn)提供了示范。以“數(shù)字敦煌”為例,敦煌研究院在已經(jīng)完成的敦煌石窟數(shù)字化基礎(chǔ)上進行敦煌知識圖譜建設(shè),借助更細粒度的敦煌壁畫圖像語義標注,可以實現(xiàn)圖像片段的全球發(fā)布和鏈接,研究者和大眾在看到特定主題圖像的同時,也能看到全球其他博物館中相同主題的圖像片段。這為圖像學、考古學以及文化研究學者提供了巨大的“閱讀”便利,也為公眾親近人類豐富的歷史文化遺產(chǎn)提供了更多可能。
共讀則強調(diào)合作。盡管我們強調(diào)數(shù)字人文在人文研究方面的“快”與“遠”,但并不意味著數(shù)字人文就以機器閱讀代替了人工閱讀。數(shù)字人文強調(diào)人與機器的合作,遠讀與細讀的結(jié)合。計算機可以幫助學者在紛繁龐雜的信息中快速發(fā)現(xiàn)和定位議題,在宏觀的學科脈絡(luò)中把握關(guān)鍵問題;學者又可以發(fā)揮個人學養(yǎng)所長,深刻探究問題所在,解釋背后的義理與規(guī)律。比如有研究者在對中國近代“美”的觀念進行概念史研究時,借助大規(guī)模數(shù)據(jù)庫的文本資料,以一億兩千萬字的文本為研究范圍,對中國近代“美”觀念的發(fā)展軌跡進行遠讀式描繪,為傳統(tǒng)細讀研究提供了頗為有效的實證支撐。
除了人與機器的合作,共讀還意味著將多種閱讀模式結(jié)合,獲得全新知識圖景。其中值得關(guān)注的是電子文本與數(shù)字地圖相結(jié)合形成的時空交互閱讀框架。比如中南民族大學研究團隊就“唐宋詩人行旅路線”建立“唐宋文學編年地圖”,以地理信息系統(tǒng)為基礎(chǔ)架構(gòu),在數(shù)字地圖上呈現(xiàn)唐宋著名詩人詞人的行旅蹤跡,為讀者理解唐宋詩詞打開新視角。時空交互閱讀框架不僅以時空架構(gòu)直觀展示時間、地點、人物、事件、作品間的網(wǎng)絡(luò)關(guān)系,還為深入解讀文本內(nèi)涵提供可能。
此外,共讀還強調(diào)眾包協(xié)同。借助開放眾包技術(shù),上海圖書館開發(fā)“中國家譜知識服務平臺”,允許用戶上傳和編輯自己家族的家譜。中華書局建立的古籍整理平臺,也采取眾包模式,組織高校學生、出版社編輯、圖書館館員等社會力量進行底本校對,日均工作量達100萬字,大大提升了古籍電子文本的審校速度。
引領(lǐng)文化時空數(shù)字化轉(zhuǎn)換
進入新世紀以來,以大數(shù)據(jù)、人工智能等為代表的新興數(shù)字技術(shù)正在加速數(shù)字中國的構(gòu)建進程,以數(shù)字媒介和人工智能為基礎(chǔ)的新興文化形態(tài)和知識生產(chǎn)體系正日見雛形。作為新一代人文學者認知世界和傳播文化的路徑,數(shù)字人文正在積極引領(lǐng)文化時空的數(shù)字化轉(zhuǎn)換,并展現(xiàn)出廣闊的發(fā)展前景。
數(shù)字人文可成為推動人文學術(shù)創(chuàng)新的重要力量。與自然科學和社會科學相比,人文學者對數(shù)字技術(shù)的采納相對滯后,甚至有一定誤解。比如有人認為,“將文學當作數(shù)據(jù)會失去文學本身豐富的意蘊”,這種觀點是對數(shù)據(jù)功能與意義的誤讀。事實上,凡是計算機可以處理的電子文本都可稱為數(shù)據(jù)。隨著數(shù)字社會的發(fā)展,文本的主體形態(tài)早已轉(zhuǎn)換成計算思維下的數(shù)據(jù),文學對“人本”和“文本”意義的追求并不會因其形態(tài)而改變,所以說文學與數(shù)據(jù)的關(guān)系是“道”與“器”的統(tǒng)一,而非對立。在利用新技術(shù)解決傳統(tǒng)人文問題的同時,數(shù)字人文也應更加關(guān)注新興人文議題,比如新聞推薦算法和人工智能模型的倫理約束等。數(shù)字人文在強調(diào)知識生產(chǎn)、表現(xiàn)、教學、傳播數(shù)字化轉(zhuǎn)型的同時,應更加積極對接開放科學行動框架,支持科研領(lǐng)域的開放獲取、開放數(shù)據(jù)、開放創(chuàng)新,并在學術(shù)活動中推動協(xié)同、眾包、互聯(lián)、交互、跨學科、跨國界、跨專業(yè)合作等學術(shù)理念的普及與范式創(chuàng)新。
數(shù)字人文可為優(yōu)秀傳統(tǒng)文化傳承發(fā)揮積極作用。目前,數(shù)字人文正在引領(lǐng)文化生產(chǎn)體系的數(shù)字轉(zhuǎn)向,已經(jīng)成為一個語言學、文學、史學、哲學、藝術(shù)學等傳統(tǒng)人文學科與圖書情報學、計算機科學、人工智能等信息科學共同關(guān)注的新興跨學科領(lǐng)域。數(shù)字人文不僅推動了大學與其傳統(tǒng)科研學科體系加速適應社會的數(shù)字化轉(zhuǎn)型,還在公共文化機構(gòu)中推動了人文知識向更大范圍的公眾開放,使得普通人能夠更加便捷有效地學習傳承中華優(yōu)秀傳統(tǒng)文化。敦煌研究院、上海圖書館、中華書局等單位推出的一系列數(shù)字人文項目和成果,在推動優(yōu)秀傳統(tǒng)文化傳承和傳播方面具有很強的示范意義。
數(shù)字人文應致力促進科技與人文的互動與融合。過去幾年里,人工智能不僅是科技界熱點,同時也是人文研究及藝術(shù)界熱點。對人文學者來說,人工智能不僅是一種工具技術(shù),也是一種人類文明活動的參與主體,由此帶來的文本生產(chǎn)問題、情感經(jīng)驗問題以及審美問題等都是難以回避的新興人文學術(shù)課題。對于人工智能專家來說,人文思考和倫理關(guān)懷也是研究過程必須引入的維度。在此背景下,數(shù)字人文研究應以更加積極的姿態(tài)為科技與人文、機器與文藝互動融合提供試驗場和方向標,面向未來打開文化新視野。
(作者分別為武漢大學教授、南京大學副教授)
編輯:董雨吉
關(guān)鍵詞:人文 數(shù)字 研究 文化