2005年10月29日 星期六

引文分析的未來


半個世紀以來,ISI 和 Eugene Garfield幾乎已經成為引文分析(citation analysis)的代名詞。Garfield是1925出生的,今年已經80歲了,1958年因為美國科學基金會不幫他出版SCI,借了500美金自己成立ISI公司,開創了引文研究的版圖。想想看50年前剛開始有SCI的時候的資訊科技和儲存媒體,會是什麼樣子?據說這個答案只要看一眼在美國費城的ISI總部就知道了,因為建築的外牆看起來就像打孔卡片(至於什麼是打孔卡片,請翻計概課本或Googling,我這麼年輕怎麼會知道呢!)。
1964年的SCI資料庫有1百40萬筆的書目紀錄(1.4 million),到2005年的今天已經成長到了5億5千萬筆(550 million),所收錄的期刊也由613種增加到15,721種。而Garfield做夢也想不到的是,他以方便研究者為出發點的產品,竟然讓全球無數的學子、學者過著I?I?的學術長工的日子。

WOS、Scopus、GS

ISI現在已經是Thomson Scientific的了,SCI、SSCI、A&HCI也以網路的Web of Science提供更顧客導向的服務,例如:查詢結果分析和Alert服務,資料下載也更容易。但是檢索介面還是受限於原本的資料結構,所以我只能以期刊的Subject category來分析,沒有辦法考慮到文章的個別差異,還有作者的名字都是簡寫,中文名字如果碰到張、陳等大姓的話,名字一縮寫後雷同程度高到就算加上服務單位都很難有效區分。
後起的Scopus在資料結構上當然就自由多了,光是可以自由KEY作者名字對部份讀者而言就少了犯錯的機會,對館員也是好事,不用一再提醒讀者查檢時要注意作者的名字要用縮寫,再來就是可以真正發揮Internet的優勢,重要的結果分析直接show在查詢結果網頁,讀者不用知道書目計量或引文分析那一大堆知識,只要有足夠的好奇心,願意在網頁上點來點去,就可以達到滾雪球的效果。當然,資料庫絕對是講究規模效益的,WOS可以回溯到1965年,這麼龐大的資料量,對某些學域或學者的研究是很重要的。再者收錄的期刊(peer-review)和對品質的堅持,更是讀者關心的。。
然引文資料庫幾乎都強調所收錄的期刊都是有peer-review的,但是除了期刊文章之外,有很多的會議論文也是得要經過同僚審查的,博士論文也得要經過五或七位以上的學者專家的嚴格檢驗,不也是研究人員做研究時很重要或者是很好的參考來源嗎?Google認為是,所以在2004年秋天推出Google Scholar(GS),可以免費搜尋peer-review的學術期刊文章、會議論文、學位論文和會議/研討論上發送的論文(pr- and post-print)等的引文資訊。耶魯大學的館員以 JASIST 期刊2000年所刊登的文章為對象,比較WOS和GS的被引用情況,結果發現平均每篇文章的引用次數,GS比WO多了4.5次以上(Bauer & Bakkalbasi, 2005)。但是值得一提的是,如果是要用來做嚴格的指標應用,GS的品質是值得商榷;如果是做為資訊蒐集的工具,尤其是當研究主題非常新穎前端時,GS確實是值得推薦的引文查詢工具。


ArXiv.org

在國內,要找會議、研討會的論文是一件不太容易的事,通常都得動用個人關係才能順利取得,有時連主辦單位或論文發表人自己都沒有複本。這時,如果有一個網站是大家隨時隨地都可以把自己的論文上載或下載的話,應該對學術傳播很有幫助的。
成立於1991人的ArXiv.org,就是這樣的一個網站,讓物理學家可以快速分享研究成果。因為跳過的peer-review的過程,所以時效性高,每篇文章作者還提供PS、PDF等不同型式的全文,當然也有學者只願意提供摘要的。
從會議論文、研討會論文到期刊論文中間多了peer-review,增加了品質管控,但是更實際的情況時,有些會議論文或研討會論文最終並沒有發表為期刊論文。類似ArXiv.org 這樣的自動傳送系統就可以把這些人的理念和智慧典藏起來,讓同道可以分享。

致謝 vs. 引用

在學術論文的結尾,有時會看到作者感謝某些人在其論文寫作過程中給予的協助和啟發,這類的acknowledgements中所提及的個人對學術論文的貢獻可能遠大於引用文獻中的作者,而這種影響力也是在目前的引文分析中無法彰顯的。

何謂出版?

在Internet這麼普及的今日,我不禁要問:怎樣叫做出版(published)?這篇電子報publish了嗎?從學術的角度來看,這頂多小朋友或叛逆青少年的塗鴉。很多學有專精的人士會把他們的見解看法在網站上發表或建Blog,被廣泛下載或傳送,這算出版了嗎?如果算的話,引文分析是不是也應該考慮到網路出版?如果有系統地研究的話,傳統出版觀念的引文分析結果,和網路出版的引文分析結果,應該會有相當大的差異吧!

沒有留言: