前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇文獻計量學論文范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
愛因斯坦通過著名的電梯假想實驗,明確提出了萬有引力定律中的引力質量和牛頓第二定律中的慣性質量的等效性,也就是著名的等效原理,而這是廣義相對論的基石。牛頓的引力理論建立在平直的歐幾里得空間,而愛因斯坦在利用等效原理找到了局部慣性系之后,使用相對論原理并且加上當時已經成功發展的描述彎曲時空的非歐幾何(黎曼幾何),建立了廣義相對論理論。使用廣義相對論能夠精確地解釋水星近日點的進動,所以廣義相對論的第一次驗證就是通過天文觀測進行的。廣義相對論的一個重要預言就是引力場中的光線偏折,而這個預言第一次得到驗證就是通過日全食的觀測,這個觀測確立了廣義相對論的正確性。
1666年,牛頓把通過玻璃棱鏡的太陽光分解成了從紅光到紫光的各種顏色的光譜,而這就是物理光學的基礎。在1814年~1815年之間,天文學家夫瑯和費在太陽光譜中發現了很多譜線。1885年,天文學家巴耳末發現了符合已知氫原子譜線位置的經驗公式。隨后對原子光譜的進一步觀測又發現了更多的譜線序列和經驗公式。1913年,為了解釋氫原子譜線位置的經驗公式,玻爾建立了原子光譜的量子模型,成功解釋了原子譜線的經驗公式,奠定了原子物理的基礎,量子力學也從此誕生。波爾作為量子力學的奠基人,于1922年獲得了諾貝爾物理學獎。
因此天文學的觀測研究對于建立牛頓力學、驗證廣義相對論和奠基量子力學的實驗基礎都功不可沒,也可以說天文學研究奠基了包含牛頓力學的廣義相對論和量子力學這兩個現代自然科學的最重要的理論體系。
〔關鍵詞〕信息技術;文獻計量學;科學計量學;信息計量學;網絡計量學;替代計量學
DOI:10.3969/j.issn.1008-0821.2016.02.006
〔中圖分類號〕G250.252 〔文獻標識碼〕A 〔文章編號〕1008-0821(2016)02-0032-06
〔Abstract〕Bibliometrics is finding wider and wider application and development because of information technology progress.This article explained the impacts of information technology on methods and contents of bibliometrics.The conclusions were that as being outcomes of modern information technology advances,scientometrics,informetrics,webometrics and altmetrics inherit theoretical foundations and methods and enrich the subject system of bibliometrics,and form their own unique branch characteristics.Bibliometrics in China was also deeply influenced by information technology,especially in measuring methods,studying objects,research contents and applications which have followed the international trend.However,theoretical studying was still needed to be improved and quantitative analysis in the network environment remains to be strengthened.
〔Key words〕information technology;bibliometrics;scientometrics;informetrics;webometrics;altmetrics
由于人為因素,很多文獻難以定量化,特別是文獻系統高度的復雜性和不穩定性,使得有效信息難以得到足夠獲取,也就無法揭示文獻的宏觀規律。信息技術的發展與進步,推動了數學計算工具和統計學的應用與發展,依賴數學工具和統計學技術的文獻計量學順勢得到更快的發展與應用。因此,信息技術進步是文獻計量學發展的保障。本研究以信息技術發展脈絡為序,對文獻計量學在不同時期和技術條件下的發展進行文獻梳理和觀點總結,以期理清兩者的關系,并為相關研究者提供參考。
1 文獻計量學的提出
1911年,俄國化學家、院士瓦爾金使用引文分析研究化學家對化學的貢獻[1],被認為是文獻計量學的開端。1917年文獻學家科爾(Cole F.T.)和伊爾斯(Eales N.B.)使用“比較解剖學的歷史――對文獻的統計分析”,介紹了目前仍在沿用的書目計量技術――對出版物按出版國家和學科進行計量與分類[2]。1923年英國圖書館學家霍姆(Hulme E.W.)在科爾等人的研究基礎上提出“書目統計學”[3]。1926年美國洛特卡(Lotka A.J.)論述了科學生產率的經驗規律,旨在通過對發表論著的統計來探明科技工作者的生產能力及對科技進步和社會發展的貢獻[4],稱為“洛特卡定律”。1934年英國著名文獻學家布拉德福(Bradford B.C.)率先提出描述文獻分散規律的經驗定律[5]。1949年,美國哈佛大學教授齊普夫(Zipf G.K.)提出詞頻分布定律[6];1955年,加菲爾德(Gaifield E.)系統提出引文索引和引文技術的概念,以及檢索科技文獻的方法,打破分類法和主題法在檢索中的壟斷地位[7]。
直到1969年,英國情報學家阿倫?普里查德(Alan Britchard)才正式提出“文獻計量學”(Bibliometrics)這一術語[8],標志著文獻計量學的正式誕生,開始從學科角度來研究文獻計量問題,并將其定義為“把數學和統計學用于圖書和其他文字通訊載體的科學”[9]。隨著信息技術在文獻檢索中的應用,以及1963年《科學引文索引》(Science Citation Index,SCI)創刊,以及《社會科學引文索引》(SSCI)和《藝術和人文科學引文索引》(A&HCI)相繼在1973年和1978年出版,為文獻計量研究在圖書館和情報界奠定了堅實的基礎。
在此階段,由于技術條件的限制,文獻計量學的大部分工作為人工統計,研究者無法同時處理過多的數據,文獻計量學的應用不太普遍。文獻計量學的發展基本圍繞以上幾個著名的定律展開,一方面是檢驗、修正這些經驗規律并使之完善和更加具有普遍性(即理論發展方向);另一方面是將這些規律應用于圖書館、情報機構文獻管理的具體工作(即實踐發展方向)。為了加速文獻計量學的普及進程,1980年,國際文獻聯合會(FID)設立情報計量學委員會并制定近期計劃,1982年,在捷克斯洛伐克召開會議研究文獻計量學的課程設置。
2 現代信息技術是文獻計量學賴以存在和發展的基礎 文獻計量學是用數學和統計學方法來定量分析一切知識載體的交叉學科。計算機的發展促進了統計方法的普遍有效應用,也使數學計算方法和手段取得突破性進展。實踐證明,信息技術的飛速發展直接推動了文獻計量學的發展,許多有用的技術手段和方法成為文獻計量學創新的核心動力。信息技術進步對文獻計量學的影響主要表現在文獻計量學研究基礎支撐的變化、研究方法的改進,以及文獻計量學科體系的完善上。
2.1 現代信息技術的應用促進文獻計量研究基礎支撐的變化 隨著信息技術的不斷發展,文獻計量學已經突破對篇、冊、本為單位的文獻計量,深入到文獻內部知識單元和相關信息上,基礎數據和技術支撐越來越豐富和多樣:
2.1.1 文獻資源建設
信息技術的應用,促進文獻載體和傳播渠道的多樣化。文獻資源建設促進了文獻信息的收集整理以及文獻數據的開發利用。在現代信息技術面前,文獻資源的地域分布和院校機構的館藏多少不是問題的關鍵,文獻數據資源的存取利用與服務能力才是至關重要的。
2.1.2 檢索語言與檢索系統
文獻計量的檢索語言從文獻分類發展到主題法、引文索引、內容分析等,檢索效率和效果的提高得益于計算機技術在機器語言上的應用。從信息技術出發,網絡搜索引擎提高了檢索的時效性;人工語言與機器語言的結合,提高了查全率和查準率[10]。
2.1.3 軟件工具與技術實現
隨著計算機性能的不斷改進,從數據的收集、整理到統計分析,計算機輔助文獻計量分析軟件與工具的出現,包括MATLAB、SAS、SPSS、EViews、Incites、JCR、DA等,使得文獻計量分析的內容越來越廣泛。
2.2 現代信息技術促進文獻計量研究方法的改進
從最初的資料收集到數據的分析處理,現代信息技術為文獻計量研究的每一階段都提供了研究方法上完善改進的機會:從最初的文獻統計擴展到數學模型分析、鏈接分析、系統分析、矩陣分析、網絡分析等?,F代信息技術使得文獻計量學與計算機科學、系統學、廣義信息科學等緊密聯系,使得文獻計量學向個性化、集成化、模型化和智能化方向發展。其應用也從原來的核心期刊評價、信息收藏管理與利用,擴大到研究科學發展特點、評價學科競爭力、預測學科發展等方面,從而迅速發展成為一門重要的應用學科。
2.3 現代信息技術促進文獻計量學科體系的完善
在現代信息技術影響下,文獻信息呈現多種狀態與存在形式,其計量分析的研究領域和途徑也發生了巨大的變化,文獻計量學的傳統研究領域發生重心的轉移,一些新領域、新分支開始出現:科學文獻評價的出現,催生了科學計量學;依托信息測度和信息論,信息計量學應時而生;網絡信息資源的即時利用,產生了網絡計量學;在線科研環境的出現,促進了替代計量學的出現??茖W計量學、信息計量學、網絡計量學和替代計量學等分支學科的出現,豐富和完善了文獻計量學的學科體系(如圖1所示)。
3 信息技術催生文獻計量學出現眾多新分支
由于文獻計量學家來自情報學、圖書館學、科學學、社會學、化學、心理學、物理學、經濟學等學科,信息技術進步促使“文獻”概念不斷擴展,國際文獻計量分析迅速發展并成為圖書情報領域最活躍的分支學科?!耙年P系”既是文獻、科學,又是情報,對引文關系的計量分析,使得利用相似信息技術的文獻計量學、科學計量學和情報計量學等成為具有“相同血緣關系”的近親,在許多方面具有相似、相近甚至完全重合的地方。作為文獻計量學的新發展,它們在研究對象、研究目的等方面各有特色[11]。為此,本研究對信息技術發展催生的文獻計量學各分支進行了闡釋。
3.1 科學計量學
科學文獻的迅速增長,使得研究者對科學進行定量研究,開創了科學計量學。1968年,蘇聯學者納利莫夫和穆利欽科首次提出科學計量學(Scientometrics)術語。1978年匈牙利學者布勞溫(Braun T.)創辦《科學計量學》雜志,主要發表有關科學學、科學交流和科學政策的定量研究成果,探討科學計量學的各種方法,并為科學計量學研究者提供學術交流平臺。2001年溫克勒(Vinkler P.)給出基礎的科學計量及其學術領域的專業術語[12]。
科學計量學主要用于學術期刊影響研究、學科或機構的論文與引文分析、國家和地區研究與發展狀況計量及科技政策研究、各種定律與分布的揭示等,以及對新數據庫建構和數據處理方法的創新、新描述性和解釋性模型建立、科研績效評估等方面[13]。一般來說,它與文獻計量學的方法非常相似,有時完全一致,但在研究對象和目的上仍有所區別。文獻計量學把圖書、期刊等視為正規的有形文獻,主要目的是定量分析圖書館等藏書和文獻服務活動,增進科學文獻、科學情報和科學交流的影響力;科學計量學則分析科學情報(信息)產生、傳播和利用的量的規律性,以更好地理解科學研究(作為一項社會活動)的機制[14]??茖W計量學不僅可用于學科評價,也可用于經濟和社會等方面的評價研究[15]。
隨著信息技術的迅速發展,Internet和Intranet上的超文本鏈接和應用鏈接產生了知識地圖,突破了以往只是對地理分布的知識地圖界限的描述,逐漸演化為知識圖譜。知識圖譜理論與方法是近年來科學計量學最前沿,將應用數學、圖形學、信息可視化技術及計算機科學等學科理論方法與傳統科學計量學引文分析方法結合起來,用可視化圖譜形象展示科學學科的結構與發展。因此,科學知識圖譜是在信息技術推動下,新近發展出來的科學計量學新領域。主要用途是學術共同體及其網絡研究,學科領域發展研究,研究課題的衍生、滲透與擴散,作者、機構、出版物與期刊等之間的關系等[16]。
3.2 信息計量學
隨著信息技術的快速發展和信息領域研究的不斷深入,信息論研究出現了回歸為信息的量和質、語法和語義、傳輸和使用相統一的變化趨勢,不僅克服了申農信息論(即狹義信息論)的局限,而且推動廣義信息論的形成與發展,這為信息計量學發展提供了重要的理論支持和詳盡的計量方法。信息計量學最早由德國學者昂托?納克(Otto Nacke)在1979年提出,他呼吁將數學方法用于測度信息現象,提出信息計量學是與信息科學有關的信息測度科學,并不斷宣傳術語Informetrics。同時,信息科學家說服國際文獻聯合會設立“信息計量學委員會”,擬定一個長期的信息計量學教學與研究工作計劃。1988年布魯克斯提出用信息計量學(Informetrics)代替文獻計量學(Bibliometrics),原因是文獻計量學僅拘泥于“數目的計量”,已不適用于現代電子化載體文獻的計量。我國最初在1981年將Informetrics譯為情報計量學,1992年才將其改譯為“信息計量學”。
信息計量學有廣義和狹義之分,“廣義信息計量學”主要探討以廣義信息論為基礎的廣義信息的計量問題,“狹義信息計量學”主要研究情報信息或文獻情報的計量問題,即應用數學、統計學等定量方法來分析和處理信息過程中的矛盾,從定量角度分析和研究信息的動態特性并找出內在規模[17]。但目前對信息計量學的研究主要側重于“狹義信息計量學”,還帶有較濃厚的基于文獻情報的文獻計量學色彩。在未來的發展中,信息計量學將更加依賴現代計算技術和更深層次的數學分析,探索信息的本質以及信息計量的基本模式、方法技術、模擬驗證等方面[18]。
3.3 網絡計量學
隨著計算機與信息科學技術如數據挖掘、信息可視化、Web2.0、云計算等發展,網絡學術信息傳播體系得到快速發展與完善,國內外學術期刊和專著以網絡為媒介的信息傳遞已經成為信息交流的重要形式,使得文獻計量學的測度方法、研究對象和研究內容又發生了巨大變化。1997年阿爾明(Almind T.C.)和英沃森(Ingwersen P.)描述了一系列進行Web信息分析的方法和參數,以丹麥和其他北歐國家為案例,提出信息計量方法完全可用于萬維網,只不過將萬維網看作引文網絡,傳統引文由Web頁面取代,首次使用“Webometrics”并將其定義為包括所有使用信息計量和其他計量方法對網絡通信有關問題的研究[19]。1998年英沃森(Ingwersen P.)提出將期刊影響因子用于網頁評價,為文獻計量學的經典概念和研究方法成功用于網絡信息分析開創了新的研究思路[20]。2004年本杰伯恩(Bjrneborn L.)和英沃森(Ingwersen P.)構建了一個較為全面的網絡計量學概念體系,標志著網絡計量學開始進入發展的成熟階段[21]。2004年,《美國信息科學技術學會學報》專門出版網絡計量學???,2005年,《信息科學技術年評》出版了“Webometrics”專題。英國、比利時、加拿大、新西蘭、荷蘭等國的學者分別從不同的角度和方面推動了網絡計量學的發展[22]。
從某種意義上說,網絡計量學是信息計量學在網絡上應用的一門學科,信息計量學構成了網絡計量學的學科基礎。網絡計量學研究的理論問題主要是網絡信息分布的集中與離散規律、著者規律、詞頻規律、增長和老化規律、引證規律、多媒體信息規律,以及這些規律的理論解釋和數學模型研究等。其研究對象不僅包括網上信息本身,還包括網上文獻、文獻信息及其相關特征信息,以及網絡結構單元的信息計量問題,應用范圍越來越廣泛。網絡計量學已經引起了足夠重視,且與文獻計量學傳統領域的聯系很強,未來具有巨大的發展空間[23]。
3.4 替代計量學
隨著學術出版數量和方式的增加,發現和選擇最相關資源的難度越來越大。基于文獻計量學的傳統同行評議和引文檢索,已經無法滿足現代研究者的需要。利用社會媒體、追蹤學術產出的在線科研環境,促進替代計量學的產生。2010年,北卡羅來納州大學教堂山分校圖書情報博士生普里姆(Priem J.)首次在Twitter上使用Altmetrics,隨后在網站上發表宣言[24],正式提出“Altmetrics”術語。2011年起不僅召開研討會,而且在社交網站上建立討論組和發表博文,充分討論替代計量學的理論與實踐意義,以及論文層面計量、科研成果計量、科研發現計量等相關研究內容。2013年,皮沃瓦(Piwowar H.)認為替代計量學會給科研影響力帶來全新的變化[25],Elsevier等機構也對替代計量學表示公開支持。到目前為止,不僅理論上對眾多指標進行了有效性及關系分析,而且對Mendeley、PLOS、Peer Evaluation、CiteULike、Twitter等網站數據進行實證檢驗,同時,開發了ImpactFactory、TotalImpact、Altmetrics等應用平臺用于搜集和分析網上各大社交網站和開放存取平臺的數據,提供替代計量學指標。
替代計量學研究處在良好的開放存取和開放科學的大環境中,通過建立“研究對象”、“科學發現”等新的計量單元,采用復用率、解答問題程度、使用頻率、CoRank-LinkCount、基于點擊流數據知識圖譜等新型計量指標,充分利用Twitter等在線科研交流網站來收集數據和分析,為替代計量提供堅實的數據源和基礎,因此,替代計量的數據并不缺乏。但是,要從政策、過程、技術整體來控制數據質量仍有很大的難度。同時,盡管替代計量學有著很好的前景,仍然會受到學者遵循小數定律和注意力空間限制規律的影響,增加同行評議的復雜性[26]。替代計量的研究和發展框架已初步形成,隨著新一代學者在網絡環境下的成長,在線科研交流將超越線下科研交流成為主體,替代計量學的地位將日益凸顯,在圖書館文獻服務中的作用也會越來越強大[27]。
4 信息技術進步與中國文獻計量學的發展
中國文獻計量學發展相對較晚,20世紀60年代開始出現介紹國外文獻計量學的論文。1964年,《綜合科技動態?第二分冊?"情報工作》的兩篇文章翻譯介紹了美國的“科學引文索引”[28-29],這是國內最早介紹文獻計量學研究[30]。1979年,沈中和再次介紹了“科學引文索引”,大力提倡使用的種種好處[31];趙紅州提出科學家最佳年齡定律和科學勞動智力常數,其著作《科學能力學引論》為我國科學計量學的杰出代表作品[32]。
20世紀80年代出現了介紹性和應用性論文,如劉植惠1980年撰文向國人介紹了文獻計量學的研究對象(即社會實踐中不斷產生和利用的各種文獻)和具體應用(即估測某一學科或知識領域的發展動向及其前景;探索文獻資料的增長率;確定核心期刊等)[33];王崇德將文獻計量與情報預測結合起來進行研究[34]。1983年胡昌平和邱均平對科技文獻的分析和研究方法進行了探討[35],并以化學文獻為例進行了分析與推斷[36]。邱均平對文獻計量學的理論方法及應用、發展過程及術語界定[37]給出了自己的認識,并編輯了武漢大學圖書情報學院教材《文獻計量學》。
同時,為推動學科建設發展,《情報科學》和《情報學刊》在1980年創刊,1982年《情報學報》問世,1983年以專門介紹國外情報科學動態的《國外情報科學》編輯出版,帶動了國內文獻計量學的發展??傊@一時期主要是相關專家學者向國內介紹文獻計量學的相關知識和學科內容,論文數量比較少(1979-1989年有關文獻計量學研究的文章僅有547篇),研究基礎相當薄弱,缺乏自主性系統研究和綜合性研究。
20世紀90年代以來,國內學者緊跟國外研究前沿與發展趨勢,開始了相關基礎理論的研究。王崇德等人在《情報理論與實踐》上連續發文,對文獻計量學的演變和發展進行了深入的探討。邱均平等人對文獻計量學、科學計量學、情報計量學的發展進行了介紹[38]。1995年梁立明的《科學計量學――指標?模型?應用》,1999年龐景安的《科學計量研究方法論》、羅式勝的《科學技術指標與評價方法――科學計量學應用》和婁策群的《社會科學評價的文獻計量理論與方法》,以及2000年蔣國華的《科研指標與指標》是科學計量學的重要理論研究成果。1999年,徐久齡等最早向國內介紹網絡計量學[39],2000年邱均平對網絡計量學進行了系統、全面的研究。同時,對分析方法和應用領域的研究越來越側重,邱均平等2008年對文獻計量內容分析法進行了探討[40],2013年蔣穎對人文社科領域的文獻計量學發展進行了解讀[41]。
隨著信息技術主要是計算機利用及其廣泛普及,我國自主開發的計算機應用系統及軟硬件產品的商品化程度不斷提高,計算機輔助的文獻計量分析發展加速,文獻計量學處于快速發展階段。計算機輔助文獻計量學研究在理論分析的基礎上,著重進行計算機輔助文獻計量軟件的設計與開發,特別是大批數據庫數字化的研究與出版,也為文獻信息的自動化統計和分析提供了必要的工具和條件。目前在國內的應用與發展,主要是期刊評價、數據庫的建設等。北京大學圖書館第一版《中文核心期刊要目總覽》在1992年啟動編制,是期刊定量評價在國內全面推進的重要標志,全面拉開國內大規模期刊定量統計與評價工作的序幕。此后,中國科學院文獻情報中心推出“中國科學引文數據庫(CSCD)來源期刊”,中國科學技術信息研究所出版“中國科技論文統計源期刊”,南京大學中國社會科學研究評價中心“中文社會科學引文索引(CSSCI)來源期刊”,中國社會科學院文獻信息中心推出“中國人文社會科學核心期刊”,清華大學圖書館和中國學術期刊(光盤版)電子雜志社出版“中國引文數據庫”等等。期刊評價是信息“膨脹”的結果和必然,隨著文獻計量學的發展,期刊評價更加具有國際化、信息化、網絡化和自動化等特點[42]。另一重要方向是將文獻計量學指標用于評價科學生產率,評價科技人才、成果質量、科研機構乃至整個國家的科技水平與影響力等,使得決策者能夠進行有效的定量管理和分析[43]。
伴隨著數據挖掘、可視化等信息技術的快速發展,國內文獻計量學學者更加重視可視化研究與應用。陳定權、李運景等人對可視化技術與工具進行介紹[44-45],周萍等人利用國外軟件和國內數據進行深入分析,使用可視化方法揭示深層內容[46]??茖W知識圖譜是顯示科學知識的發展過程與結構關系的圖形,大連理工大學對知識圖譜與可視化方法進行系統研究,并出版《科學計量學知識圖譜》、《科學學知識圖譜》、《管理學知識圖譜》、《隱性知識計量與管理》和《專利計量與專利制度》等專著。CiteSpace、Pajek等免費開放的可視化軟件的廣泛應用,使得文獻計量分析應用越來越普遍。在高校,為了定量衡量學校教師、學生和科研人員的學術成果影響,機構知識庫也在不斷改進計量方法,借助替代計量學等指標進行更廣范圍的影響力評價。
從對1991-2000年我國文獻計量學的研究論文(共2 069篇)分析來看,研究論文主要是文獻或引文的統計與分析等應用領域,對于基礎理論、經典定律的討論相對較少。盡管文獻計量學研究出現了新領域,如網絡計量學、科學計量學等,但大量研究是對已有理論、方法的檢驗或簡單套用,創新較少[47]。從2001-2014年的期刊論文來看,使用“篇名”或“關鍵詞”檢索出含有“文獻計量”或“計量分析”的論文共1 713篇,發文量較上世紀90年代有所減少。但其新的研究領域,如科學計量學、網絡計量學、信息計量學、替代計量學的文章則呈現大幅增長的趨勢。
5 結 語
隨著計算機與網絡等信息技術水平的提高,文獻統計逐漸摒棄枯燥、繁瑣、低效的人工統計方法,開始實現自動化和智能化,文獻計量學得以快速發展,并在信息服務中發揮越來越重要的作用??茖W計量學、信息計量學、網絡計量學和替代計量學是在特定信息環境和技術條件下,由文獻計量學逐步演進而來,它們繼承了文獻計量學的理論基礎和基本方法,豐富了文獻計量學的學科體系,又形成了自己獨特的分支學科特征。
在網絡信息技術環境下,我國的文獻計量學發展在短短50年時間里取得了突飛猛進的發展,文獻計量學的測度方法、研究對象、研究內容以及應用范圍已經發生了重大變化,但理論研究仍有待深化,對網絡環境下的計量分析有待加強??梢灶A見,信息化和網絡化是文獻計量學未來發展的新趨勢。隨著網絡信息技術的發展與進步,全球視野下的學術合作與資源共享,必將推動我國文獻計量學的新發展。
參考文獻
[1]王崇德.文獻計量學教程[M].天津:南開大學出版社,1990:8.
[2]Cole F.J.and Eales N.B..The history of comparative anatomy.Part I-A statistical analysis of the literature[J].Science Progress,1917,11(44):578-596.
[3]Glenn R.Wittig.Statistical bibliography――A historical footnote[J].Journal of Documentation,1978,24(3):240-241.
[4]Lotka A.J..The frequency distribution of scientific productivity[J].Journal of the Washington Academy of Science,1926,16(12):317-323.
[5]Bradford S.C..Sources of information on specific subjects[J].Journal of Information Science,1985,10(4):176-180.
[6]Zipf G.K..Human behavior and the principal of least effort――An introduction to Human Ecology[M].Cambridge,Mass:Addisson Wesley,1949.
[7]Garfield E..Citation indexes for science:A new dimension in documentation through association of ideas[J].Science,1955,122(3159):108-111.
[8]Pritchard A.Statistical bibliography or bibliometrics?[J].Documentation,1969,25(4):348-349.
[9]羅式勝.文獻計量學概論[M].廣州:中山大學出版社,1994.
[10]李偉超.信息技術對情報學的影響與推動[J].情報科學,2007,25(2):208-232.
[11]劉廷元.文獻計量學、科學計量學和信息計量學的聯系與區別[J].圖書與情報,1994,(1):19-24.
[12]Vinkler P..An attempt for defining some basic categories of scientometrics and classifying the indicators of evaluative scientometrics[J].Scientometrics,2001,50(3):539-544.
[13]劉國棟,羅長坤,吳培紅.科學計量學的研究現狀及發展趨勢[J].中華醫學科研管理雜志,2005,18(3):137-140.
[14]Braun T.et al.Scientometric Indicators[M].Singapore:World Scientific Publishing Co.,1985:4-6.
[15]Jochen Glser,Grit Laudel.Integrating scientometric indicators into sociological studies:methodical and methodological problems[J].Scientometrics,2001,52(3):411-434.
[16]侯海燕.基于知識圖譜的科學計量學進展研究[D].大連:大連理工大學.
[17]邱均平.信息計量學(一)[J].情報理論與實踐,2000,23(1):75-80.
[18]郭強,劉俊友.信息計量學導論[M].合肥:合肥工業大學出版社,2007:5-7.
[19]Almind T.C.,Ingwersen P..Informetrics analyses on the world wide web:Methodological approaches to webometrics[J].Journal of Documentation,1997,53(4):404-426.
[20]Ingwersen P..The calculation of web impact[J].Journal of Documentation,1998,54(2):236-243.
[21]Bjrneborn L.,Ingwersen P..Toward a basic framework for webometrics[J].Journal of the American Society for Information Science and Technology,2004,55(14):1216-1227.
[22]邱均平.網絡計量學[M].北京:科學出版社,2010:4-13.
[23]蔣穎.1995-2004年文獻計量學研究的共詞分析[J].情報學報,2006,25(4):504-512.
[24]Priem J.,Taraborelli D.,Groth P.,Neylon C..Altmetrics:A manifesto[EB/OL].http:∥/manifesto,2010-10-26.
[25]Piwowar H..Altmetrics: Value all research products[J].Nature,2013,493(1):159.
[26]邱均平,余厚強.替代計量學的提出過程與研究進展[J].圖書情報工作,2013,57(19):5-12.
[27]余厚強,邱均平.論替代計量學在圖書館文獻服務中的應用[J].情報雜志,2014,33(9):163-167.
[28]Garfield E.科學引文索引[J].王恩光,譯.綜合科技動態?情報工作,1964,(5):8-13.
[29]Kpbijioba H.B..美國出版的《科學引文索引》[J].張琪玉,譯.綜合科技動態?情報工作,1964,(5):14-15.
[30]梁國強.國內文獻計量學綜述[J].科學文獻信息管理,2013,(4):58-60.
[31]沈中和.新穎的《科學引文索引》[J].自然雜志,1979,2(5):322-323.
[32]趙紅州.科學能力學引論[M].北京:科學出版社,1984.
[33]劉植惠.文獻的定量分析研究[J].情報科學,1980,(4):7-13.
[34]王崇德.計量文獻與預測情報[J].情報科學,1980,(3):43-45.
[35]胡昌平,邱均平.科技文獻分析研究初探[J].情報學刊,1983,(4):104.
[36]邱均平,胡昌平.化學文獻的歷史發展及其趨勢[J].圖書情報知識,1983,(4):28-32.
[37]邱均平.關于“文獻計量學”術語及其定義[J].圖書情報知識,1985,(3):22-25.
[38]邱均平.文獻計量學科學計量學情報計量學的發展[J].情報理論與實踐,1999,22(3):217-219.
[39]徐久齡,劉春茂,劉亞軒.網絡計量學的研究:情報學進展(第三卷)[M].北京:航空工業出版社,1999:78-107.
[40]邱均平,王曰芬,等.文獻計量內容分析法[M].北京:國家圖書館出版社,2008:1-69.
[41]蔣穎.人文社會科學領域的文獻計量學研究[M].北京:社會科學文獻出版社,2013:1-20.
[42]林樹文,曾潤平.期刊評價的產生與我國期刊評價的發展[J].情報探索,2013,(5):43-47.
[43]曹學艷,胡文靜.我國文獻計量學的發展[J].圖書情報工作,2004,48(2):106-111.
[44]陳定權.同引分析與可視化技術[J].情報科學,2005,23(4):532-537.
[45]李運景,侯漢清.引文分析可視化研究[J].情報學報,2007,26(2):301-308.
〔關鍵詞〕文獻管理軟件NoteExpress;文獻計量學;研究工具
〔中圖分類號〕G250.252〔文獻標識碼〕A〔文章編號〕1008-0821(2013)02-0101-04
文獻計量學研究源自1969年,是美國目錄學家Alan Pritchard提出的將數學和統計學的方法運用于圖書及其他交流介質的研究的一門學科[1]。它是以文獻體系和文獻計量特征為研究對象,采用數學、統計學等的計量方法,研究文獻情報的分布結構、數量關系、變化規律和定量管理的一門新興的邊緣學科[2]。通過文獻計量學分析可定量地、深入地揭示學科動態發展變化規律,是科研人員和信息服務人員深入研究學科或專題的好方法。
進行文獻計量學研究過程中,為保證統計文獻全面系統[3],需要對源于不同數據庫文獻進行檢索、匯總,因而會產生大量的文獻數據,以往國內由于缺乏文獻數據歸總和統計的簡便工具,導致文獻計量學研究工作中存在著文獻匯總困難、統計的文獻數據不全面、統計方法繁瑣等問題?;谏鲜隼щy,目前我國公開發表的文獻計量學研究文章所研究數據來源僅是單種期刊[4-6]或少量期刊或單個數據庫[7-16],少量源于多個數據庫。文獻收集齊全的文獻計量學分析研究所用的數據歸總后還要借助其它軟件[17-20]才能進行文獻計量學分析,操作過程比較繁瑣。
本文介紹了在文獻計量學研究中,如何巧妙利用文獻管理軟件NoteExpress[21](簡稱NE,下同)對源于多個數據庫的大量文獻進行歸總、統計和分析,解決了以往文獻計量學中存在的文獻匯總困難、統計的文獻數據不全、統計方法繁瑣等問題,為文獻計量學研究探索了一種簡便、有效的新工具。
1文獻管理軟件NE及其文獻計量學分析功能的介紹NE是北京愛琴海軟件公司開發的文獻檢索與管理系統,其核心功能涵蓋“知識采集、管理、應用、挖掘分析”等知識管理的環節。利用NE平臺可把源于不同數據庫的信息集中起來進行管理,保證了統計信息的全面性、系統性。在對文獻信息進行全面匯總的基礎上,再利用NE提供的信息統計功能對所采集的大量文獻信息進行分析統計。
2如何利用NE進行文獻計量學分析
2.1建立專題數據庫
本文以“基于NE的文獻計量學研究”為例闡述專題數據庫的建立過程。在新建NE數據庫前,先在電腦磁盤中建立一個文件夾,用于保存所有關于文獻計量研究文獻信息資料。然后利用NE的“新建數據庫”功能建立了一個名為“基于NE的文獻計量學分析”專題數據庫,將其保存至磁盤中的“基于NE的文獻計量學研究”文件夾中。為了防止操作過程中的數據丟失,研究者既可利用NE的“數據庫備份”功能備份自己建立的專題數據庫到目標文件夾中,也可選擇“打開數據庫時備份”或者“關閉數據庫時備份”進行備份。
NE題錄信息的采集有3種方式:一是過濾器導入方式;二是聯機檢索方式;三是手工建立方式?!斑^濾器導入方式”是指將數據庫中檢索出來的題錄信息通過NE“導入題錄”功能進行批量采集,該方式信息采集速度快、內容全面,適合大批量的文獻題錄信息采集?!奥摍C檢索方式” 指利用NE內置的常用數據庫檢索連接文件直接在線檢索數據庫,批量生成題錄信息,該方式簡單、省事,但受網絡環境影響較大,適合在網速較快的情況下進行大批量題錄信息采集?!笆止そ⒎绞健笔侵赣檬止ぽ斎氲姆绞浇㈩}錄信息,該方式效率低、繁瑣,不推薦使用。
由于從各大數據庫導出的文獻信息格式不盡相同,使用“過濾器導入方式”采集題錄信息時,不僅要選擇適當的題錄保存格式,還要選擇與題錄保存格式相匹配的過濾器。筆者實踐經驗表明:維普中文科技期刊全文庫(簡稱維普,下同)可選擇全紀錄格式保存;CNKI在總庫中信息保存時選擇“自定義”字段全選格式,在信息導入時選擇“CNKI-Export(custom)"過濾器;萬方學術期刊庫(簡稱萬方,下同)以NE格式保存較好,導入題錄時用NE-萬方過濾器;SciFinder(CA)在信息保存時選擇“Tagged Format.txt”格式,導入時選擇“SciFinder”過濾器;三大農業數據庫(Agris,Agricola,CABI)、EI、SCI在保存時選擇RIS格式,在信息導入時選擇RIS過濾器。研究者若熟悉過濾器的編寫規范,最好在數據庫中選擇最全的數據保存格式,并根據需要利用NE中的過濾器管理功能編輯出與全紀錄格式相匹配的過濾器,這樣導入NE后的信息內容比較全,不用在題錄信息導入后還考慮缺失字段補全等問題,簡化數據處理過程。
2.3文獻的除重
文獻的惟一性是正確進行計量學分析的基礎。由于不同數據庫收錄的文獻范圍既有交叉又有不同,因而源于不同數據庫的NE中的信息也會有重復的內容。在NE中可直接利用“查找重復題錄”功能對所有的信息進行除重,保證單一信息的惟一性。在的過程中,待的字段可根據用戶需要而個性設定,NE默認的字段有題錄類型、作者、年份、標題4個字段。選擇好目標文件夾、字段及選項內容后,直接點擊“查找”即可對目標文件夾內容進行查找,見圖1,而后直接一次性刪除重復內容即可。
11圖1NE中文獻的除重11
2.4文獻題錄信息的適當修正、補全
主題統計和分析是文獻計量學研究的重要指標之一。導入NE中的所有文獻題錄均無主題字段,進行文獻計量學分析時,可通過關鍵詞詞頻統計,或者通過閱覽全文自行對研究內容做人工判定,對主題字段進行補全后才能進行主題分析。建議研究者先用NE對關鍵詞進行詞頻統計,觀察統計結果中同義詞情況,再用NE的批量替換功能把所有同義詞均替換成其中的一個同義詞,而后利用NE統計功能進行統計,在整個統計過程中,盡量減少人工逐條修正工作,多利用計算機及NE各種功能對信息進行處理,既減少了操作的繁瑣度,提高了工作效率,也減少了信息信息處理的失誤率。為了便利研究者對全文進行閱覽以便準確把握文獻主題,也為了以后更方便管理和查找文獻,NE中的每條文獻最好都有鏈接有PDF或CAJ等格式的全文。全文可通過數據庫下載后保存在“課題文件夾”中,最后利用NE“批量鏈接附件“功能來批量鏈接,但這個工作量比較大,耗時較長,過程繁瑣。在實際應用過程中,本文作者通過實踐摸索出了一個省事、省時的全文鏈接辦法,下面以CNKI為例來闡明全文直接下載、鏈接過程:全選NE中的所有需要下載全文的文獻檢索(工具欄)下載全文選擇全文數據庫CNKI點擊下載之后,NE會自動從數據庫中批量下載、鏈接全文,而后研究者只要保證網絡暢通即可,不用再理會下載過程,等下載完全后關閉下載平臺即可,見圖2。研究者可酌情決定具體從哪些數據庫下載全文。
2.5對文獻進行文獻計量學分析
NE提供了一個“文件夾信息統計”功能,利用此功能可對文獻進行計量學統計、分析。NE中設置的可統計字段包括文獻類型、作者、年份、期刊、作者機構、主題、基金類型等共有55項,研究者在實際統計過程中可以根據分析需要選擇合適的需要的字段,也可以根據需要自行增添統計字段。在NE操作界面,選中需要進行統計分析的專題數據庫,在工具欄打開文件夾,選擇文件夾信息統計,系統會彈出一個文件夾統計信息界面,研究者在界面“字段”欄內可根據需要,選擇題錄類型、作者、年份、期刊等字段,點擊統計,NE會自動對所選的專題數據庫中的所有內容按需要分析,見圖3,利用word或EXCEL對統計結果進行表、圖表示。
文獻計量學分析通常會以圖或者表的形式把信息內容表達出來,以方便研究者或讀者進行直觀的理解和分析。在NE中,統計后的數據可以以“另存為”(見圖3)的方式保存在課題文件夾中,而后再直接導入EXCEL或word中根據研究者的需要以圖或者表的形式表示出來,示例見圖4。圖4是本研究者通過NE對源于三大中文期刊數據庫:維普、CNKI及萬方中研究文獻計量學的4 296篇期刊論文的年份統計。由圖4可以看出:我國自1981-2011年30年期間,有關文獻計量學分析的文獻發文量基本上呈逐年增長的趨勢,發文量在2010年達到歷史最高,共有488篇,說明我國研究者越來越認識到利用文獻計量學深入研究學科或專題的重要性。同理,研究者還可以通過NE對作者、期刊來源、基金類型、作者機構、主題等內容作系統而方便的統計分析,為科研工作者深入地認識和研究課題提供更高質量、更有深度的文獻信息服務。
圖4我國有關文獻計量學研究的年度發文趨勢
3展望
利用文獻管理軟件NE對海量信息進行有效歸總和統計分析是一種進行文獻計量學研究的方便的、行之有效的新工具。它的使用讓文獻計量學的研究不再是繁瑣的、屬于少數人的專利,任何研究者都可以利用它來對自己感興趣的學科、課題或專題進行高質量的文獻計量學研究。高校信息服務人員更應該充分利用NE這一功能來有效提高科技查新、專題服務、讀者培訓等信息服務,拓展信息服務深度,并借助NE便利的文獻歸總和數據統計功能撰寫出更多的有關專題或學科的文獻計量學研究的文章,在提高信息服務質量的同時為我國文獻計量學研究的發展貢獻自己一份力量。
參考文獻
[1]A P.STATISTICAL BIBLIOGRAPHY OR BIBLIOMETRICS[J].Journal of Documentation.1969,25(4):348-349.
[2]邱均平.文獻計量學[M].北京:科學技術文獻出版社,1988.
[3]董琳.學科評價之文獻計量數據準備[J].情報理論與實踐,2010,(6):49-52.
[4]唐紀元,尹衍玲,李娜.《中華實驗和臨床感染病雜志(電子版)》2007至2009年文獻計量學分析[J].中華實驗和臨床感染病雜志(電子版),2011,(1):108-111.
[5]趙瑩,張家琦,郭向飛.2008~2009年《中國健康心理學雜志》文獻計量學分析[J].農業圖書情報學刊,2011,(2):81-83.
[6]高丹.2009年《圖書館理論與實踐》的文獻計量學分析[J].科技情報開發與經濟,2011,(2):70-73.
[7]朱巧玲,李瀟捷,指導,等.1999-2009年國內神經性皮炎文獻計量學研究[J].河南中醫,2011,(3):302-303.
[8]趙慶齡,路文如.中美土壤重金屬污染超富集植物文獻計量分析——以印度芥菜為例[J].中國農學通報,2011,(4):370-375.
[9]張稚鯤,李文林.古籍數字化建設的文獻計量學研究[J].圖書館理論與實踐,2011,(2):45-51.
[10]張燕,王婷,孫成權,等.國際青藏高原及其周邊地區研究文獻計量分析報告(2003-2008年)[J].地理科學進展,2011,(3):369-378.
[11]管永昌.基于CNKI的我國圖書館信息服務平臺研究文獻的文獻計量分析[J].科技情報開發與經濟,2011,(8):25-28.
[12]孫涵雪,劉旭峰,許昌泰.PubMed數據庫中(1979~2008)飛行員與心理療法文獻計量學分析[J].醫學綜述,2011,(2):297-300.
[13]李紅閣,呂建新,倪崖.1989-2009年國內白癜風研究文獻計量學分析[J].溫州醫學院學報,2011,(1):90-92.
[14]查先進,曹晨.近20年我國信息資源配置研究文獻計量分析[J].圖書情報工作,2010,(20):6-10.
[15]周宇梅,王麗琳.2001-2005年我國保險學文獻計量分析[J].圖書情報工作,2007,(3):137-139.
[16]唐勇.我國圖書館虛擬咨詢相關研究的文獻計量分析[J].現代情報,2011,(1):97-99.
[17]馬秀文,和艷會.采用文獻計量法分析我國蝴蝶蘭研究現狀與發展趨勢[J].安徽農業科學,2011,(6):3761-3762.
[18]張曉鵬,朱曉宇,劉則淵.國際公共危機管理研究的文獻計量學分析[J].科學學與科學技術管理,2011,(3):117-121.
[19]鄭巧玲,黃漢林,黃永順,等.從文獻計量學角度評析國內三氯乙烯職業病危害防治研究狀況[J].中國職業醫學,2011,(1):17-20.
[關鍵詞]網絡信息時代 書評文獻計量學科學計量學信息計量學
[分類號]G257
20世紀90年代以來,由于信息高速公路與Internet的建設和飛速發展,信息化、數字化、網絡化已成為當前科技、經濟和社會發展的重要因素和顯著特征。信息成為人們使用最頻繁的概念之一,也成為情報學和信息管理等學科領域的重要研究對象。從定量的角度分析和研究信息的動態特征,并找出其中的內在規律,是文獻計量學、科學計量學和信息計量學(簡稱“三計學”)研究的重要課題,引起了國內外學術界的廣泛關注。隨著信息技術和信息科學的迅速發展,從文獻單元深入到信息單元,從文獻計量向信息計量轉變成為發展的必然趨勢。
武漢大學信息管理學院的邱均平教授是我國率先開展“三計學”教學與研究的著名計量學家,取得了豐碩的研究成果。在文獻計量學教學和研究的基礎上,1988年,邱均平教授編著的《文獻計量學》在科學技術文獻出版社正式出版,該書首次從理論、方法和應用相結合的角度構建了文獻計量學的內容體系,是我國出版最早的、為數不多的文獻計量學經典著作之一,受到學術界同行的熱烈歡迎和好評。它不僅被多所高校采用作為圖書館學、情報學和信息管理學等學科領域的核心教材,而且被引率至今一直名列前茅。之后,邱均平先生又開展了大量有關“三計學”方面的研究,在國內外形成了重大影響。隨著信息技術和信息科學的迅速發展,信息資源電子化、數字化和網絡化日益普及,給人類社會、經濟、科技和文化等各個領域的發展都帶來了巨大的影響和深刻的變革。在這種新的社會環境和技術條件下,文獻計量學研究出現了許多新的發展方向和趨勢。面對這一新形勢、新趨勢和新課題,邱均平教授又在國內率先開展了信息計量學和網絡信息計量學研究。2000年~2001年,邱均平教授以“信息計量學”和“網絡信息計量學”為題在《情報理論與實踐》上發表了系列研究論文,在國內外學術界造成了巨大反響,被引率一直居高不下,成為開展信息計量學和網絡信息計量學研究必看的經典系列文章。2007年1月,武漢大學出版社又出版了邱均平教授的《信息計量學》一書。這是邱均平教授長期從事“三計學”教學與研究的結晶,是反映網絡信息時代“三計學”發展特征,面向圖書館學、情報學和信息管理學及相關學科領域教學與研究現實需要的產物。該書是作者敏銳地站在時代和學科發展前沿,把握國內外信息計量學發展動向,精心研究而成的最新成果。也是作者20余年來從事“三計學”問題研究的系統總結和綜合集成之作,同時又是“教育部面向21世紀課程教材”和“高等學校信息管理類核心教材”之一,具有重要的科學理論價值和現實指導意義。
1 《信息計量學》是時展和現實需要的產物
文獻計量研究始于20世紀初,經過半個世紀的發展,逐步形成了較為完善的理論、方法和內容體系。20世紀60年代以來,隨著電子計算機的逐漸普及與廣泛應用,文獻計量學研究進入了新的,理論、方法與應用研究成果迭出。1969年,英國計算中心的普里查德(A.Pritchard)開創性地提出了“文獻計量學”這一名詞,文獻計量學逐漸發展成為一門獨立的科學學科。伴隨信息技術的快速發展及其在文獻計量學中的廣泛應用,文獻計量學的研究范圍和深度不斷擴展,于是出現了以信息單元、情報單元和知識單元為計量對象的“信息計量學”或稱“情報計量學”。20世紀90年代以來,由于網絡技術迅速普及,信息資源數字化、網絡化和數字信息資源日益豐富,并出現了以網絡信息和數據為計量對象的“網絡信息計量學”或稱“網絡計量學”(Webmetrics)。
雖然一個多世紀過去了,文獻計量學研究取得了豐碩的成果,但是文獻計量學理論、方法和內容體系尚未得到有效更新,反映信息計量研究的、系統的、新的教材還沒有,現有的幾本文獻計量學教材的內容體系已經陳舊過時,大都是20世紀80年代末、90年代初的研究成果。特別是在當前信息化、電子化、數字化、網絡化的新形勢下,文獻計量正在向信息計量方向發展,信息管理領域出現了許多新情況、新問題、新特點和新規律。迫切需要以新的視角去研究、去解決、去尋求新的正確答案。信息計量學正是在網絡信息時代大背景下,隨著信息資源電子化、數字化和網絡化的發展,適應社會經濟信息化和信息產業化發展的迫切需要而逐步形成和發展起來的,具有鮮明的時代特征、重要的科學理論價值和實際指導意義。《信息計量學》一書的及時出版正是網絡信息時代滿足“三計學”研究、發展和現實需要的應時之作,同時也是情報學和信息管理學等學科領域發展需要的必然產物。其深厚的研究基礎,全新的研究視角,科學的研究方法,系統的研究內容,廣泛的應用實例,反映和集成了國內外信息計量學研究中的最新進展,必將成為信息計量學發展中的新標志和新里程碑。該書重點突出了“信息、網絡和應用”三大主題,反映了網絡信息時代“三計學”的主旋律。
2 《信息計量學》反映了“三計學”研究的交叉與融合
20世紀60年代以來,在圖書館學、文獻學、情報學、信息管理學和科學學領域相繼出現了三個類似的術語:Bibliomet―tics、Scientometrics和Informetrics,分別代表著3個十分相似的定量性的分支學科,即“三計學”。經過幾十年的努力研究和推動,“三計學”都不同程度地取得了一定進展,得到了學術界的廣泛承認。文獻計量學、科學計量學和信息計量學(情報計量學)之間的關系十分密切。盡管它們的研究對象和目的有所不同,但三者的起源相同,并且享有共同的原理、方法和工具,因此學術界習慣于將它們統稱為“三計學”,而且隨著科學技術的發展和三門計量學的不斷拓展,它們之間出現了合流的趨勢,還產生了共同的國際學術組織――科學計量學和信息計量學國際學會(Intemational Society forSeientometries and Informetrics,ISSI)。但由于“三計學”分別屬于不同的學科領域,長期以來一直處于事實上的相互獨立的研究狀態,很少有學者出于共同的研究目的,將三者融合在一起展開研究?!缎畔⒂嬃繉W》首次從“三計學”的共同研究基礎出發,在信息計量學的研究框架下,將三者有機地融合在一起展開研究,反映了“三計學”交叉融合的發展趨勢,是一次有益的嘗試。在書中,作者從起源、發展、研究對象和目的等方面對“三計學”的關系進行了系統梳理,并在詳細論述其共同原理、方法和工具的基礎上,展示了“三計學”
在各個學科領域中的廣泛應用,這無疑是“三計學”研究中的一場精彩的演繹,展現了“三計學”的無窮魅力。
信息計量學跨越了學科的邊界,成為圖書館學、情報學、信息管理學、科學學等學科的一個分支學科或一種研究方法。印度情報學家雷堅(Rajan)把信息計量學(情報計量學)的目的系統闡述為:為研究和發展;為決策和規劃;為組織機構,科研項目、計劃和各種活動的管理提供可靠的數據。英國著名情報學家布魯克斯也認為:信息計量學(情報計量學)是迄今計量學科中語義最廣泛最深奧的一個術語,將作為包羅文獻計量學和科學計量學的一個全稱術語??梢?,在“信息計量學”這一統稱術語和共同框架下整合“三計學”研究是國際發展的重要趨勢。《信息計量學》一書的出版正是這一趨勢的真實反映,不僅在國內是首例,而且走在世界前列。
3 《信息計量學》是文獻計量學研究的繼承與創新
信息計量學是在文獻計量學的基礎上發展起來的,兩者有著密不可分的關系。信息計量學發展的邏輯過程經歷以下幾個階段:書目計量學一文獻計量學一科學計量學一信息計量學。文獻計量學是信息計量學研究的基礎,信息計量學是文獻計量學研究的繼承、拓展與延伸。《信息計量學》也是在《文獻計量學》的基礎上修改、補充、更新和擴展而成的,討論的重點也主要是文獻信息的計量問題。書中的文獻信息增長規律、文獻信息老化規律、文獻信息集中與離散分布規律――布拉德福定律、文獻信息詞頻分布規律――齊普夫定律、文獻信息作者分布規律――洛特卡定律、引文分析法和文獻信息統計分析法等基礎上保留了文獻計量學經典定律和方法的原貌。但信息計量學不限于文獻計量學、科學計量學,其研究對象、范圍、方法和應用遠遠大于兩者?!缎畔⒂嬃繉W》將文獻、信息、計算機、網絡和應用五個重要特征有機結合在一起,反映了網絡信息時代文獻計量學的新發展。信息計量學是文獻計量學與科學計量學研究的重要發展與創新。從信息的計量單元來看,信息計量學已不僅僅停留在以篇、冊、卷、本等為單位的文獻單元的計量上,而是開始深入到文獻的內部,對知識單元和文獻的相關信息特征進行計量研究,如題名、著者、機構、主題詞、關鍵詞、詞頻、知識項、引文信息、出版者、日期、語言、格式、基金等信息單元。正因為如此,信息計量方法和復雜程度遠遠大于文獻計量和科學計量方法。
20世紀90年代以來,文獻計量學在飛速發展,包括理論、方法和應用三個方面的研究范圍都在不斷拓寬,并且出現了4個值得關注的趨勢:①從文獻計量向信息計量發展;②文獻計量學、科學計量學和信息計量學的合流趨勢;③文獻計量研究手段的現代化趨勢,計算機輔助文獻計量研究成為重要發展方向;④日益重視文獻計量學在圖書館管理、信息管理、信息服務、科學研究、科學評價、科技管理和決策等中的應用。特別值得一提的是,隨著因特網這一新生事物的產生,文獻計量學又出現了一個全新的研究領域,即網上信息計量學(Cybermetrics),或稱網絡信息計量學。網絡信息計量學的出現表明文獻計量學又有了一個富有生命力的新的研究領域?!缎畔⒂嬃繉W》反映和吸收了國內外“三計學”研究的最新進展,尤其對以上4個方面的發展趨勢給予了高度關注,并進行了重點論述和討論。如該書的11、12、13、14章集中論述了計算機輔助信息計量分析法、信息計量學在各學科領域的應用和網絡信息計量學等新方法、新領域。這也正是該書對“三計學”研究的發展和創新之處,同時也是《信息計量學》一書的亮點之一,令人耳目一新。
4 《信息計量學》是理論研究與教學實踐的高度結晶
《信息計量學》一書的出版經歷了長期的研究和積累過程,是作者長期從事信息計量學理論研究和教學實踐的高度結晶。從20世紀80年代初開始,作者就一直在武漢大學從事“三計學”的教學與科研工作,并于1983年在全國高校中率先開設了“文獻計量學”本科課程,同時編著了同名教材《文獻計量學》,于1988年在科學技術文獻出版社正式出版。20年來該書一直成為國內各高校圖書館學、情報學和信息管理等學科專業爭相采用的重要核心教材,被引率也一直高居前列,受到了學術界同行的高度評價。著名情報學家楊沛霆如此評價該書,認為《文獻計量學》一書“無疑是對我國情報學研究和情報學教育的積極貢獻,具有開創性意義”。20世紀90年代以來,在開設“文獻計量學”本科課程的基礎上,作者又先后指導和培養了多名信息計量學方面的碩士研究生,后來又增設了“信息資源計量研究”碩士生方向和“信息計量與科學評價”博士生專業方向,并先后以“文獻計量學”、“信息計量學”、“情報計量學研究”、“科學計量學研究”、“網絡計量學研究”和“網絡信息資源計量研究”等為題主講了多年的研究生和本科生課程。在20多年的學習、教學和科研工作中,作者積累了大量的心得體會和信息資料以及豐富的研究成果和教學經驗,為《信息計量學》的研究和出版打下了堅實的基礎。《信息計量學》一書的出版既是作者在文獻計量學教學與科研方面的延續與擴展,也是發展與創新。沒有多年來深厚的研究基礎和豐富的教學經驗,也不會有《信息計量學》一書的誕生。從1999年《信息計量學》被列入“教育部面向21世紀課程教材”到今天《信息計量學》一書的面世,可以說是水到渠成。
5 《信息計量學》體現了理論、方法與應用的有機結合
【摘要題】理論縱橫
【正文】
20世紀90年代以后,以數字化技術、多媒體技術、網絡通訊技術綜合而成的現代信息技術,引發了人類社會的第二次信息革命,人類業已邁入知識經濟時代。新的社會環境使包括情報學在內的學科研究發展面臨著新的挑戰,我們需要新的理論和方法來加以研究和利用,情報學的傳統方法在面對新的問題時,就要進行自身的轉化。如面對浩瀚的網絡信息資源,傳統的文獻計量學方法就顯得力不從心,相應地網絡信息計量學(WebmetricsorCybermetrics)就應運而生,用新的研究方法如鏈接分析法來描述和組織網絡信息世界。
1網絡信息計量學
網絡信息計量學是在網絡信息環境下迅速形成和發展起來的,作為信息計量學的一個新的發展和重要的研究領域,它的出現使傳統的基于文獻和信息的文獻計量學、信息計量學面臨著新的變革。關于其定義主要有:網絡計量學是一門計算機科學,是一門研究互聯網上數據相互引用的科學,是一門對網絡文獻規律進行統計分析的科學,基于Web和軟件計量分析工具,集計算機技術、網絡技術、計量學方法、統計學方法于一體,其應用范圍覆蓋了所有基于網絡通信技術的信息測度。網絡計量學是綜合采用文獻計量、信息計量、統計學方法、計算機技術和網絡技術對網絡文獻規律進行統計分析的一門科學。網絡信息計量學是采用數學、統計學的各種定量方法,對網絡信息的組織、存儲、分布、傳遞、相互引證和開發利用進行定量描述和統計分析,借以揭示網絡信息的數量特征和內在規律的一門新興學科。它主要是由網絡技術、網絡管理、信息資源管理與信息計量學等相互結合、交叉滲透而形成的一門交叉性邊緣學科。
2鏈接分析法研究現狀
2.1鏈接分析法的內容
鏈接分析法是網絡信息計量學中一個重要方法,它可以看成是文獻計量學中引文分析法在網絡環境中的應用。網絡超文本通過鏈可以將結點鏈接起來,一般使用兩種方法——索引鏈和結構鏈進行鏈接,它既可以表示信息之間的關系,又是構成網絡的手段。在將網絡相關信息資源內容鏈接起來形成新的信息鏈或信息集合的基礎上,融合了參考文獻鏈接功能,并通過引文關系來分析鏈接網絡信息資源的方法。可以按照引用程度和引用權威信息源來分析,在網絡信息組織、檢索、評價、服務等方面起著重要作用。
2.1.1鏈接分析法在網絡信息組織方面的作用
網絡信息資源生產者如網頁創作者使用鏈接分析,創建一些對訪問者有用的鏈接,可以鏈接到不同主題或相同主題質量更優秀的網頁。一般來說鏈接類型大致有:合作鏈接(被鏈接網站和鏈接網站之間存在合作關系)、友情鏈接(網站之間可能由于在資源或其它相關方面有關系,相當于影視術語中的友情客串)、推薦鏈接(被推薦網站由于質量好、人氣旺、訪問用戶多或是熱門網站等原因鏈接)、內容鏈接(被鏈接網站和鏈接網站在內容上存在著互補或相通關系等),可以起到網絡導航的作用,大大方便用戶在網上沖浪。Google還通過鏈接分析來確定網絡上的權威信息源來進行相關的排名。Google認為網頁制作者僅創建他們認為重要的網頁的鏈接,鏈接到另外的網頁就像一本書的引文,網頁之間的這種引文關系“像是對網頁進行評論的過程”。例如,網頁的制作者們創造了幾千個Yahoo的鏈接,困此Yahoo被當作一個重要程度點;如果許多重要的網頁都指向Yahoo,則其重要程度會更高。這種方法的好處是網頁制作者不可能誤導網站的排序,并且擴展性極好——當網絡增長時,產生更多的重要網頁的鏈接,自然更能確定該網頁是否是權威的信息源。
2.1.2鏈接分析法在網絡信息檢索方面的作用
鏈接分析主要應用于網絡信息檢索方面,如搜索引擎收集信息、檢索結果的排序等。網絡信息檢索為用戶提供海量信息多媒體數據庫,采用超文本技術使檢索空間比傳統的信息檢索范圍更廣泛,以結點為單位組織,以超鏈接的方式鏈接相關內容,更加符合人們的思維方式,打破了線性存儲的限制,真正實現多維檢索。Web信息檢索系統可以利用鏈接信息來優化對相關文獻的查詢,能夠極大地提高檢索結果的相關性。在搜索引擎收集信息的過程中,J.Kleinberg認為搜索引擎的Robots直接訪問Web提取出權威頁(AuthorityPage)。但是如何提取出權威頁,這需要一個原始積累和評價過程。先給出一批起始網頁,Robot從這些源網頁開始收集,可以按照深度優先或廣度優先的算法進行。當網頁提取回來后,采用鏈接分析技術(具體用遞歸算法)來計算出權威頁。有了權威網頁,Robot在收集Web信息時,就有針對性地、高效率地訪問Web網頁。搜索引擎檢索結果排序方面也運用了鏈接分析技術,由于索引數據庫容量大,若用戶輸入一個關鍵詞,有可能會有成千上萬條記錄相匹配,搜索引擎對如此龐大的結果如何排序,如何把最相關的幾十條記錄顯示出來?搜索引擎按記錄號的順序提取結果集中的前幾十條記錄,再按鄰近圖(NeighborGraph)算法對這幾十條記錄排序,最先顯示給用戶。這種檢索結果排序就是利用鏈接分析技術,大大減輕了搜索引擎的負擔,Yahoo、Google等搜索引擎就采用了超鏈接分析技術來對檢索結果排序。2.1.3鏈接分析法在網絡信息資源評價方面的作用
傳統的引文分析法在學術方面衡量學術期刊重要性的指標之一是“影響因子”(IF),哪家期刊和論文被引用次數多,影響因子就高,誰就被認為是權威,論文也就是優秀論文。在互聯網上IF對應于統計指向某一網頁的鏈接數目后對該網頁作出的排序,網站引用分析對應的是某個站點網頁被其它站點引用的情況的統計分析,也就是網頁可能被其它網站搜索提問命中的結果數的多少,采用計分法和線性代數方法對中心網頁和權威網頁分數進行迭代求和,以確定權威網頁和中心網頁。這與百度搜索引擎的創始人李彥宏1996年提出的搜索引擎的第二定律:“人氣質量定律”相一致。根據這一定律,用鏈接分析法進行統計網站被鏈接和訪問次數,可以作為評價網站和網絡信息資源質量的一個指標。再加上相應的鏈接文字分析,就可以用在搜索結果的排序上了,對搜索結果進行的按相關性排序,不完全依賴于詞頻統計,而是更多地依賴于超鏈分析。在Internet上鏈接關系反映的是網頁在全世界范圍內、同一學科類屬的影響力,評價范圍是很廣的、甚至全球性的。目前主要利用搜索引擎工具在網絡上檢索網站和網頁的鏈接情況,并按相關性對檢索結果進行排序,大大方便了用戶在浩
翰的信息海洋中迅速準確地獲得有用的信息,易于操作、實用且可以節省用戶的時間,在一定程度上可以彌補同行評議等定性方法的缺陷。
2.2鏈接分析法對情報學研究方法的意義
蘇聯科學家巴甫洛夫說過:“科學是隨著研究方法所取得的成就向前的。研究方法每前進一步,隨之我們面前也就開拓了一個充滿種種新鮮事物的更遼闊的遠景。”情報學是一門新興的綜合性邊緣學科,是一個開放的綜合性知識體系,它善于吸收其它相關學科的知識和研究方法。上世紀60年代后,隨著科學的日益發展,科學研究中應用研究、實用研究和開發研究比重逐漸增大,情報學研究方法體系取得了長足進步,表現在:一是情報研究的領域、對象、內容等的擴大和深化;二是現代科學學科與方法的創立和發展。情報學研究方法體系是動態的、發展的。情報學科要想在原有的基礎上實現學科研究模式的更新、學科結構的變革和學科體系的拓展,就必須研究和采用新的思維方式和新的研究方法,及時反映最新的學科學術動態和最新的理論學說,移植、借鑒其它學科的研究方法,如哲學方法、數學方法、社會學方法、經濟學方法、信息技術方法等來豐富自己的研究方法,并加以創造和大膽創新,不僅引起自身學科結構的變革和深化學科前沿的研究,而且不斷發展新的分支學科,促使學科研究充滿時代氣息。
鏈接分析法大大拓展了信息計量學在網絡環境下的應用,充實了網絡信息計量學的內容,是情報學研究的新領域,完善了情報學方法論體系。它是情報學逐漸成熟的一個重要歷程碑,標志著情報學理論方法的一個新的飛躍。
2.3鏈接分析法目前存在的問題
在文獻計量學中,傳統的引文分析法只要統計參考文獻數據就可完成引文分析的任務,但是在互聯網上,鏈接分析法的研究對象是網絡信息資源,網絡信息資源覆蓋范圍廣、動態性強,具的信息量巨大、不確定性、缺乏合理組織、難以預測等特點,且信息過載(InformationOverload)和信息污染(InformationPollution)現象嚴重;引用與被引用關系也變得十分復雜;鏈接分析法的適用范圍也是有限的;Internet是在一個商業化的環境中發展起來的,一個網站的被鏈接數量還與它的商業推廣有著密切的聯系,因此這種評價體制在某種程度上缺乏客觀性。因此,在使用鏈接分析法時要充分考慮以上問題,盡大可能保證其結果的可靠性。
3結束語
由于鏈接分析法借鑒了引文分析法的方法和思路,是情報學研究方法在網絡環境下新應用,目前鏈接分析法主要實驗工具是搜索引擎,但隨著網絡信息技術如人工智能、網絡信息檢索、計算機網絡、知識挖掘、自然語言處理等的發展,必將為鏈接分析法的研究和開發應用提供更為有力的支持。情報學也必將充分利用網絡信息技術,吸收其它學科的先進方法來深化、完善自己的方法論體系,建立起更為完善的體系結構,從而改變情報學學科的面貌。
【參考文獻】
1徐久齡等.網絡計量學的研究.情報學進展1998-1999年度評論,第三卷.北京:航空工業出版社,1999:78-105
2夏旭等.網絡計量學研究:現狀、問題與發展.圖書館論壇,2001,(12):44-47
3鄒志仁.論情報研究方法體系.江蘇圖書館學報,1990,(2):18-23
4楊濤.鏈接分析法存在的問題及改進方法.圖書情報知識,2002,(3):62-63
5劉雁書,方平.Web網站站外鏈接類型與特征調查-鏈接分析法可行性研究.大學圖書館學報,2001,(5):65-68
6鄒菲.試論網絡信息計量學在數字圖書館中的應用.圖書情報知識,2001,(1):16-17,20
7邱均平.信息計量學(一).情報理論與實踐,2000,(1)