邁向引文分析4.0時代 ——胡志剛著全文引文分析一書序 劉則淵 科學(xué)文本,其形式包括論文、報告和專著,與非科學(xué)文本的突出區(qū)別,就在于帶有引文,即引用參考文獻?茖W(xué)文本及其引文,是科學(xué)交流與傳播的方式和痕跡,也是科學(xué)情報獲取與文獻檢索的手段和方法。由于科學(xué)情報及其引文數(shù)據(jù)庫的建立,導(dǎo)致科學(xué)計量學(xué)從科學(xué)數(shù)據(jù)的統(tǒng)計分析,轉(zhuǎn)向引文分析為主的方法,并不斷升級,深化拓展。如今隨著全文本引文數(shù)據(jù)庫的產(chǎn)生,開始進入全文引文分析的新階段,邁向引文分析4.0的時代。 呈現(xiàn)在讀者面前的全文引文分析:理論、方法與實踐一書,就是在這一背景下作者胡志剛所做出的一項創(chuàng)造性成果。 然而,由科學(xué)引文帶來的引文分析、科學(xué)評價及相關(guān)的被引次數(shù)與影響因子等指標,或因使用不當,或因人們誤解,而一直頗遭詬病。有的學(xué)者甚至試圖撇開引文,以“Altmetrics”(被誤譯為“替代計量學(xué)”)來取代引文分析。這是對引文分析的嚴峻挑戰(zhàn),我們必須回應(yīng)和回答。因此,這里想借為本書作序之機,對上述疑惑和問題做必要的歷史追溯和理論說明。事實上,科學(xué)文本的引文現(xiàn)象,以及由此發(fā)生的引文分析,有著久遠的歷史淵源和廣泛的理論基礎(chǔ)。 科學(xué)文本的引文存在,是近代科學(xué)產(chǎn)生以來的一種特有現(xiàn)象?茖W(xué)引文是科學(xué)共同體在逐漸達成的兩個基本共識——科學(xué)的無償饋贈性和發(fā)現(xiàn)優(yōu)先權(quán)的基礎(chǔ)上,實現(xiàn)科學(xué)文本規(guī)范化、制度化的產(chǎn)物。從科學(xué)學(xué)的一般學(xué)習(xí)范式看,一方面,科學(xué)作為一種認識現(xiàn)象,離不開前人獲得的知識、方法與工具,并據(jù)以對自然的觀察實驗獲取新的知識,前人的科學(xué)知識是不費分文而可以自由引用的;另一方面,科學(xué)作為一種社會現(xiàn)象,又必需尊重和承認前人科學(xué)發(fā)現(xiàn)的優(yōu)先權(quán),無論引用的目的和動機如何,都要注明被引文獻及其作者,承認被引文獻的署名權(quán)或著作權(quán),否則被視為學(xué)術(shù)不端行為。因此,引文既是科學(xué)文本的知識基礎(chǔ)和依據(jù),又是對被引作者權(quán)利的承認和尊重,從而成為科學(xué)文本的組成局部,使科學(xué)文本取得合理又合法的地位,由此形成規(guī)范化的引文制度。這可以稱為引文發(fā)生的知識饋贈-知識產(chǎn)權(quán)二重性理論。 引文發(fā)生和引文分析的另一個理論基礎(chǔ),是科學(xué)交流與知識流動理論?茖W(xué)文本是科學(xué)傳播與交流的基本單元,而引文就是科學(xué)傳播與交流的痕跡。隨著科學(xué)論文數(shù)量的急劇增長,科學(xué)期刊發(fā)文的周期較長,效率低下,科學(xué)情報處理的手工作業(yè)方式,嚴重妨礙了科學(xué)傳播和交流,各門學(xué)科最新進展無法得到及時迅速傳遞而影響到科研活動。科學(xué)學(xué)奠基人J.D.貝爾納(J. D. Bernal)最早敏銳地覺察到這種科學(xué)情報危機,在多種場合提出各種舉措來加以解決。從1939年的科學(xué)的社會功能[1],1958年的科學(xué)情報傳播:用戶分析[2],到1964年的科學(xué)的科學(xué)[3],貝爾納反復(fù)強調(diào)以多種科學(xué)服務(wù)方式來取代科學(xué)期刊,實現(xiàn)科學(xué)成果的直接交流,同時主張借助自動化機器進行科學(xué)情報的處理、編目與歸檔,以加快科學(xué)情報的傳播與交流。眾所周知,在20世紀60年代以前,科學(xué)界一直憑借科學(xué)交流留下的引文蹤跡,作為人工獲取科學(xué)情報,查找與檢索科學(xué)文獻的一種途徑與線索。E.加菲爾德(Eugene Garfield) 據(jù)此提出了科學(xué)文獻檢索的新方法。1955年,他發(fā)表了科學(xué)引文索引:文獻學(xué)中貫穿觀念聯(lián)系的一個新維度[4]一文,提出借助科學(xué)論文之間的引用文獻所構(gòu)成的觀念聯(lián)系,作為檢索科學(xué)情報的新手段。這就使科學(xué)交流從文本單元深化到知識單元。同時,加菲爾德受貝爾納關(guān)于機器處理科學(xué)情報的意見啟發(fā),嘗試建立起科學(xué)引文索引(SCI)系統(tǒng),這不僅創(chuàng)造了一種新的情報檢索工具,而且由此意外地誕生了一個副產(chǎn)品——科學(xué)引文分析,引起科學(xué)計量學(xué)方法的深刻變革。這樣,加菲爾德將貝爾納基于文本單元的科學(xué)交流思想,發(fā)展為基于知識單元的知識流動理論[5],從而成為引文分析的核心理論。引文分析的知識流動理論,闡明引文分析的本質(zhì)是知識流動的過程,展現(xiàn)了知識單元的離散和重組、繼承和創(chuàng)新、演進和升華的復(fù)雜過程。另外,由于一個知識領(lǐng)域的科學(xué)共同體,其最活躍的主要成員往往會敏銳地把握學(xué)科發(fā)展態(tài)勢,產(chǎn)生新觀念的知識共鳴,成為知識流動的共同來源,卻又各自獨立平行地獲得類似的科研成果。這樣,知識流動理論也為非引文關(guān)系的科學(xué)文獻進行基于知識單元的共詞分析,提供了理論依據(jù)。 值得關(guān)注的是,引文分析還有一個更為厚實的理論基礎(chǔ)——科學(xué)網(wǎng)絡(luò)模型,包括貝爾納關(guān)于科學(xué)發(fā)展的網(wǎng)絡(luò)模型和科學(xué)計量學(xué)之父D.普賴斯(Derek John de Solla Price)關(guān)于科學(xué)引文的網(wǎng)絡(luò)模型。早在1955年貝爾納就認為,“科學(xué)中的總的發(fā)展模式還是相當清楚的:這種模式與其說像樹,不如說像網(wǎng)。與課題或應(yīng)用直接相關(guān)的科學(xué)工作的內(nèi)容,可以比做網(wǎng)的網(wǎng)眼。各條線的交叉點是經(jīng)驗和思想集合的地方,是中心點,是一些新發(fā)現(xiàn),從這里產(chǎn)生各種各樣的應(yīng)用技術(shù)和科學(xué)學(xué)科!W(wǎng)不斷在編制,網(wǎng)上尚有未連接起來的線頭,可用不同的方法把它們連接起來!盵6]對此,普賴斯與貝爾納氣息相通,他透過加菲爾德發(fā)明的科學(xué)引文索引(SCI)看到更加激動人心的引文網(wǎng)絡(luò)模型。他說:“出人意料的是,作為一項處理科學(xué)文獻的引文索引法的副產(chǎn)品,把它用于進一步擴大上述各種模型的應(yīng)用,是很完備的。而這一點主要應(yīng)歸功于貝爾納為解決后來人們才認識到的情報危機而提出的那些頗具革命性和建設(shè)性的意見。因為引證許多論文,也就形成了一個以某種復(fù)雜的方式,把它們?nèi)歼B接在一起的網(wǎng)絡(luò)。借助這種網(wǎng)絡(luò)模型,人們就可以用圖論和矩陣的方法來加以學(xué)習(xí)。它似乎還向人們暗示,論文一定會聚集成團,而形成幾乎繪制成地圖的(顯示出擁有高地和不可逾越的沼澤地)‘陸地’和‘國家’”[7]。緊接著在著名的科學(xué)論文的網(wǎng)絡(luò)(1965)[8]一文中,普賴斯把上述構(gòu)想變成了現(xiàn)實:“每篇已發(fā)表論文和與之有直接關(guān)聯(lián)的其他論文鏈接起來,從而展現(xiàn)出當代世界科學(xué)論文網(wǎng)絡(luò)的總體特征!贝宋拈_啟了以引文分析和網(wǎng)絡(luò)分析為基礎(chǔ)的科學(xué)計量學(xué)新方向,闡發(fā)了繪制科學(xué)引文網(wǎng)絡(luò)圖譜來探測科學(xué)前沿的可能性。該文開頭,普賴斯有一句箴言:“參考文獻的模式標志科學(xué)學(xué)習(xí)前沿的本質(zhì)!边@句話是貝爾納的創(chuàng)意、加菲爾德的發(fā)明和他自己的破解三者的結(jié)晶。它表達的引文網(wǎng)絡(luò)模型,連著你、我、他,連著昨天、今天和明天,連通全球知識世界,從現(xiàn)有知識基礎(chǔ)走向科學(xué)學(xué)習(xí)前沿。普賴斯特別強調(diào)指出,正是學(xué)習(xí)前沿將科學(xué)從其他學(xué)問中區(qū)別開來,并確認引文使科學(xué)比非科學(xué)更快速累積的機制。 綜上所述,關(guān)于科學(xué)文本引文現(xiàn)象與引文分析的三個基礎(chǔ)理論:知識饋贈-知識產(chǎn)權(quán)理論、科學(xué)交流與知識流動理論、科學(xué)網(wǎng)絡(luò)與引文網(wǎng)絡(luò)理論,揭示了科學(xué)文本引文現(xiàn)象的內(nèi)在基本特征,解開了科學(xué)引文分析持續(xù)發(fā)展、長盛不衰的奧秘。 如前所述,科學(xué)文本不可分離的參考文獻,是區(qū)別于非科學(xué)文本的顯著特征?茖W(xué)文本的引文,所引注的參考文獻,無論是夾注、腳注和尾注,都是科學(xué)文本的組成局部。人們從引文可以追索論題、領(lǐng)域或?qū)W科的來龍去脈,一直追到概念和思想的源頭,由此引發(fā)科學(xué)文本內(nèi)容的更新?lián)Q代,日新月異,突飛猛進。而非科學(xué)文本卻并非如此,其引注雖然也有多種方式,如朱熹的四書集注采用夾注方式,對論語等四書的每一句話都引經(jīng)據(jù)典做了批注,但這只是后人對先賢的解讀,反映了儒家思想從孔子(公元前551-公元前479)到朱子(1130-1200)長達1700年的緩慢變化;而文學(xué)作品則幾乎沒有引文。正是科學(xué)文本引證不同理論、不同領(lǐng)域、不同學(xué)科的參考文獻,形成復(fù)雜的科學(xué)引文網(wǎng)絡(luò),直接間接反映了不同理論之間、理論與實驗之間的矛盾關(guān)系,科學(xué)引文之間多學(xué)科、跨學(xué)科的結(jié)構(gòu)關(guān)系,引文代際之間繼承與創(chuàng)新、基礎(chǔ)與前沿的關(guān)系,表征了科學(xué)文化相對于非科學(xué)文化的優(yōu)勢與特征,從而構(gòu)成科學(xué)生生不息、加速累積的內(nèi)在機制與發(fā)展動力。 同時,科學(xué)學(xué)視野下的三個科學(xué)引文理論,反映了科學(xué)引文分析的內(nèi)生動力與神奇魅力,展現(xiàn)了引文分析方法的發(fā)展?jié)摿εc廣闊前景。自1964年科學(xué)引文索引(SCI)數(shù)據(jù)庫誕生以來,引文分析方法應(yīng)運而生,迅速起步,不斷深化與拓展,大致可以分為如下幾個階段:普賴斯、加菲爾德首創(chuàng)基于SCI的引文分析,可謂引文分析1.0,以普賴斯的科學(xué)論文的網(wǎng)絡(luò)為代表,雖然這個階段僅10多年時間,卻預(yù)見到基于引文分析的科學(xué)圖譜革命必將到來;繼之,著名科學(xué)計量學(xué)家斯莫爾(Henry Small)的科學(xué)文獻共被引分析[9]、兩位著名科學(xué)計量學(xué)家懷特(Howard D. White)和麥肯(K.W.McCain)的作者共被引分析[10],先后突起,上升為引文分析2.0,以斯莫爾的科學(xué)文獻的共被引為代表,這個階段持續(xù)長達四分之一世紀,艱難探索引文分析的知識圖譜;之后,20世紀末信息可視化技術(shù)產(chǎn)生并引入科學(xué)引文領(lǐng)域,導(dǎo)致基于引文網(wǎng)絡(luò)分析的科學(xué)知識圖譜悄然興起、迅速發(fā)展,堪稱引文分析3.0,以著名信息可視化專家、引文網(wǎng)絡(luò)分析可視化軟件CiteSpace發(fā)明人、美籍華人學(xué)者陳超美(Chaomei Chen)的科學(xué)前沿圖譜:知識可視化探索[11]為代表。這樣,自上世紀60年代至本世紀初葉,科學(xué)計量學(xué)進入引文分析主導(dǎo)的黃金時代。現(xiàn)在伴隨全文本科學(xué)引文數(shù)據(jù)庫的推出,新一代的引文分析——全文引文分析問世了,我們開始邁向引文分析4.0的時代。 全文引文分析,作為引文分析4.0相對于與引文分析3.0,有些什么變化呢?任何引文分析的學(xué)習(xí)對象都涉及施引文獻(科學(xué)文本)與被引文獻(參考文獻)之間的交集,而作為高端的引文分析3.0,CiteSpace知識圖譜體現(xiàn)了知識流動的引文時空分布,它巧妙地設(shè)置表示時序的色調(diào)實現(xiàn)其引文時間分布;它從施引文獻提取基于知識單元的標識詞,以表征共被引聚類顯示的學(xué)習(xí)前沿;它凝聚了被離散的知識單元,從而發(fā)現(xiàn)了科學(xué)文本與其參考文獻之間交集的共性知識內(nèi)容。然而,由于依托非全文科學(xué)引文數(shù)據(jù),缺失科學(xué)文本本身的空間信息,CiteSpace圖譜的“引文空間”只是籠統(tǒng)的抽象空間,無法展現(xiàn)知識流動在現(xiàn)實科學(xué)文本中的空間分布。與引文分析3.0不同,全文引文分析最突出特征在于依托全文科學(xué)文本中的引文空間信息,反映施引文獻全文與其被引文獻之間交集內(nèi)容的知識流動理論,拓展為完整的引文時空結(jié)構(gòu)與分布理論。全文科學(xué)文本蘊藏的豐富引文空間信息,是一片尚待開墾的處女地,為拓荒者提供了大展宏圖的機遇與場所。令人欣慰的是,一批意氣風(fēng)發(fā),腦洞大開的中外學(xué)者,包括大連理工大學(xué)WISE實驗室的年輕博士,幾乎同時開展全文引文分析的探索,引領(lǐng)引文分析4.0的新潮流。 全文引文分析:理論、方法與實踐,就是作者站在這個引文分析4.0潮頭大膽弄潮的一部力作。我快樂地看到,該書在原來博士論文的基礎(chǔ)上,經(jīng)過修改、調(diào)整和補充,展示出結(jié)構(gòu)更加嚴謹、創(chuàng)新更加突出的全新面貌。其獨到創(chuàng)新之處主要是: 首先,設(shè)計和開發(fā)了一種基于XML格式全文數(shù)據(jù)的引文分析系統(tǒng),進而通過對施引文獻與被引文獻之間交集內(nèi)容進行辨識,構(gòu)建了一個由引文空間要素的位置、強度和語境所組成的全文引文分析框架,并推演出全文引文分析方法的基本功能,從而搭建了可供引文空間分析及其應(yīng)用學(xué)習(xí)的全文數(shù)據(jù)分析平臺。 其次,以國際期刊信息計量學(xué)學(xué)報(Journal of Informetrics)全部論文(2007-2013)的全文數(shù)據(jù)為案例,借助XML格式全文數(shù)據(jù)分析平臺,實現(xiàn)了全文引文空間的位置、強度和語境及其特征的分析,其中獨創(chuàng)了一種直觀展現(xiàn)全文引文位置空間分布的可視化圖譜,顯示出被引經(jīng)典文獻在施引論文中的空間分布規(guī)律性。 最后,從全文引文的位置、強度和語境三個方面,分別應(yīng)用于科學(xué)知識圖譜、科學(xué)論文評價和科學(xué)文獻檢索等領(lǐng)域進行了探索性的學(xué)習(xí),取得了全文引文分析所特有的優(yōu)越效果。例如,基于全文不同章節(jié)高被引文獻的共被引網(wǎng)絡(luò)知識圖譜,展示了不同章節(jié)引文圖譜的不同內(nèi)涵,從而更加微觀地反映了科學(xué)學(xué)習(xí)前沿及其知識基礎(chǔ)。 誠然,這部著作畢竟是對全文引文分析的初探,難免存在一些不盡如意之處。在我看來,某些術(shù)語、概念存在糾結(jié),值得深入推敲;對全文引文分析的理論基礎(chǔ)學(xué)習(xí)尤為單薄。該書所利用的全文引文信息遠不及全文遮蔽的引文信息,它所學(xué)習(xí)處理的全文引文幾個方面的問題遠少于它所引出的未予關(guān)注的問題。對此,我相信作者當會在全文引文分析領(lǐng)域繼續(xù)學(xué)習(xí)中給予關(guān)注和探討。 作為該書基礎(chǔ)的博士論文階段,我作為指導(dǎo)教師之一,提出的許多意見和建議得以接受和吸收;該書仍有個別方面與我的見解不盡一致,在學(xué)術(shù)上是正常的,我們師生之間相互尊重、彼此相長。我尤其欣賞志剛的創(chuàng)意,細致而堅韌的精神與學(xué)風(fēng),他不輕易放棄個人觀點和獨立的人格,顯得更為難能可貴。這是這部著作成功之所在。 現(xiàn)在,針對一些人對于引文分析領(lǐng)域產(chǎn)生的一些疑慮和責(zé)難,我們可以從全文引文分的視角和前述三個基礎(chǔ)理論的高度做出回應(yīng)了:我認為這些質(zhì)疑和責(zé)難的緣由,在很大程度上在于人們對引文作為科學(xué)文本不可分割的基本特征認識缺乏;對引文作為科學(xué)與非科學(xué)的區(qū)別并使科學(xué)比非科學(xué)更快累積的機制不甚了解;對科學(xué)文本的引文特征作為科學(xué)評價的內(nèi)生指標及其不可替代性不足理解;對引文分析作為科學(xué)文本的內(nèi)生方法及其潛力估計缺乏。 因此,蔑視科學(xué)文本內(nèi)生的引文分析,企圖用“Altmetrics”(被誤譯為“替代計量學(xué)”)取而代之,是不可能的。但是科學(xué)文本的傳播與影響涉及諸多方式與方面,在科學(xué)評價中補充一些指標是完全應(yīng)當?shù),或許把全文科學(xué)論文的內(nèi)生指標與外生指標結(jié)合起來進行科學(xué)評價更為合理。基于此,我建議將“Altmetrics”直接譯為“補充計量學(xué)”[12],或者改用“Suppmetrics”(“補充計量學(xué)”, Supplementary metrics)的術(shù)語來取代“替代計量學(xué)”的譯法。 至于科學(xué)界反對用期刊影響因子進行科研評價的呼吁和行動,我認為是完全正義的。期刊影響因子與引文分析本身不同,倒是成為科學(xué)期刊阻礙科學(xué)交流的新例證,因此與其抨擊影響因子,不如響應(yīng)偉大科學(xué)家和科學(xué)學(xué)奠基人貝爾納的一貫倡導(dǎo),取消科學(xué)期刊,實現(xiàn)直接交流,F(xiàn)在一系列全文科學(xué)論文預(yù)印本發(fā)布數(shù)據(jù)庫網(wǎng)站的涌現(xiàn),為科學(xué)直接交流、廢止科學(xué)期刊創(chuàng)造了條件。 末了,似應(yīng)對全文引文分析的前沿問題與未來方向做一個概括,但我以為不必如此,細心的讀者或許已從前面的討論中了解到我的基本看法,如果再發(fā)表幾條,不僅有畫蛇添足之嫌,而且會誤導(dǎo)或限制剛剛興起的全文引文分析學(xué)習(xí)與發(fā)展。 所以,還是回到為該書作序的本意上來,向我們的科學(xué)學(xué)及科學(xué)計量學(xué)界、科學(xué)情報學(xué)界、科研管理界和對引文分析領(lǐng)域感興趣的廣大讀者,推薦全文引文分析這本值得一讀的書。同時,也期待作者胡志剛博士,繼續(xù)奮發(fā)努力,永不停息,向著引文分析4.0的不盡前沿邁進,做出無愧于這個偉大時代的貢獻。 參考文獻: [1]J. D.貝爾納..科學(xué)的社會功能[M].陳體芳譯.北京:商務(wù)印書館,1982:292-409. [2]Bernal J. D. The Transmission of Scientific Information: A User's Analysis. Contribution to International Conference on scientific information.Washington,1958,Published in Report on Proceedings. [3]J. D.貝爾納.二十五年以后[A].載M.戈德史密斯,A.I.馬凱主編.科學(xué)的科學(xué)[C].趙紅州,蔣國華譯.北京:科學(xué)出版社,1985:245-267. [4]Garfield,E. Citation Indexes for Science: A New Dimension in Documentation through the Association of Ideas[J]. Science,1955 , (122):l08-111. [5]梁永霞,劉則淵,楊中楷.引文分析學(xué)的知識流動理論探析[J].科學(xué)學(xué)學(xué)習(xí),2010, 28 (5), 668-674. [6]J.D.貝爾納.科學(xué)學(xué)習(xí)的戰(zhàn)略(1955)[A].載科學(xué)學(xué)譯文集[C].北京:科學(xué)出版社,1981:25-33. [7]D.普賴斯.科學(xué)的科學(xué)[A].載M.戈德史密斯,A.L.馬凱主編.科學(xué)的科學(xué)[C].趙紅州,蔣國華譯.北京:科學(xué)出版社,1985:227-245. [8]D.普賴斯.科學(xué)論文的網(wǎng)絡(luò)[A].張崴譯,梁立明校.載劉則淵,王續(xù)琨主編.科學(xué)•技術(shù)•發(fā)展——中國科學(xué)學(xué)與與科技管理學(xué)習(xí)年鑒2008/2009 年卷[C].張崴譯,梁立明校.大連:大連理工大學(xué)出版社,2010::29-39. [9]Small H.Co-citation in Scientific Literature: A new measure of the relationship between publications[J].Journal of the America Society of Information Science,1973,24(4):265-269. [10]White H.D., McCain K.W., Visualizing a discipline:An author co-citation analysis of information science, 1972-1995[J]. Journal of the American Society for Information Science,1998, 49(4):327-356. [11]陳超美.科學(xué)前沿圖譜:知識可視化的探索(第二版)[M].陳悅,等譯.北京:科學(xué)出版社,2014. [12] 翟自洋科學(xué)網(wǎng)博客.由信息計量學(xué)新詞altmetrics的翻譯想到的. 發(fā)表2013-4-12/引用2016-10-30.博文中介紹著名科學(xué)計量學(xué)家魯索(Ronald Rousseau)學(xué)術(shù)報告,魯索不贊成這個提法,提出用Influmetrics術(shù)語取代;而武夷山建議譯為“補充型指標計量學(xué)”,博文將Influmetrics譯為“社媒影響計量學(xué)”。引者注:altmetrics一詞不知何時被誰誤譯為“替代計量學(xué)”,因此,這里參考武夷山的建議,本序?qū)ltmetrics直接譯為“補充計量學(xué)”,或者改用Suppmetrics (“補充計量學(xué)”, Supplementary metrics)的術(shù)語。 劉則淵:邁向引文分析4.0時代 | 責(zé)任編輯:曉木蟲