跨海尋找歷史珍稀文獻──專訪漢珍總編輯黃智偉

Print Friendly
作者:李亞喬

在臺北市一棟老舊大樓裡,許多人勤奮地埋頭苦幹,努力將辛苦取得的文獻原件,一頁一頁地掃瞄、打字,編輯成數位化的檔案資料庫。這裡是漢珍圖書編輯部,也是臺灣第一家以數位資料庫的方式,保存絕版珍稀文獻的圖書公司。

臺灣資料庫先驅

成立已三十五年的漢珍數位圖書,最初負責西文圖書代理進口,之後發展微縮資料、光碟,又慢慢轉型成資料庫建置的公司。在 1998 年左右,漢珍首次代理了美國建置的「ERIC 教育資源資料庫」,透過該次代理經驗,漢珍成為臺灣最早接觸資料庫的公司。2001 年,漢珍決定開始自行研發技術、尋找素材,跨入了資料庫建置領域,目前最廣為人知的產品,如:「臺灣日日新報」、「總督府府報」、「臺灣百年寫真」等,皆為漢珍公司自行開發製作的資料庫。

讓「本來看不到的,現在看得到;本來找不到的,現在找得到」

漢珍總編輯黃智偉
漢珍文史資料庫的主要負責人──總編輯黃智偉先生。

因為研究臺灣史出身,總編輯黃智偉對歷史文獻的保存和流通,彷彿有一種與生俱來的使命感,他希望找出那些幾近絕跡、不為人知的珍稀孤本,予以保存和流通。讓「本來看不到的,現在看得到;本來找不到的,現在找得到」,這不但是文獻數位化的用意和本質,也同樣是製作資料庫的核心價值與意義。

舉例來說,全世界碩果僅存最完整的一份「臺灣日日新報」原件,靜悄悄地埋沒在國立臺灣圖書館的一隅,若沒有人尋覓、查找,並將之流通,也許就漸漸被人遺忘了。又如《臺灣民報》(日文撰寫版)來說,同樣是全世界僅存一份的文獻原件,卻遠在海外日本,漢珍為了獲得這份文獻資料,專程派人到日本簽約,獲得授權製作成「臺灣民報數位檔案」。

跨海尋找「臺灣人的喉舌」

臺灣民報(日文撰寫版)圖書封面
「臺灣民報」(日文撰寫版)圖書封面。

說起《臺灣民報》,現在大多數人熟悉的,是一份在 1920 年代發行的報刊,它以漢文撰寫,並從期刊逐步轉型為月刊、週刊,最後以日刊形式發行。這份報紙被稱為「臺灣人的喉舌」,有些人認為它帶有反政府的色彩,然而,相較於上述以日文撰寫的《臺灣民報》,前者頂多是不幫政府宣傳政策而已,還談不上反政府的程度。這兩份名字完全相同的《臺灣民報》,事實上卻是截然不同的兩份報紙。

後者以日文撰寫,並在 1900 年左右於臺北發行,它所有的派報地點都在臺灣島內,僅僅送了一兩份到海外,也就是東京。後來,因為它強烈的反政府立場,遭到當局取締,結果在臺灣全部絕跡,現在全世界僅存一份原件在東京,由日本的公司將其做成微捲。而漢珍為了取得這份文獻,專程派人到日本簽約,才有機會讓它在臺灣重現。

如果有一天,文獻消失了……

或許我們會問,即使這份文獻消失了,跟我們又有何切身相關呢?黃智偉總編輯的回答是:「歷史文獻的保存跟流通,不是因為它重不重要,而是因為,我們現在還不知道它重不重要」。

舉例來說,源於現今社會對二二八事件的高度關注,不斷有人呼籲政府找出該負責的對象,但卻一直苦無資料。因此有許多人質疑二二八檔案的缺漏,是被人刻意遺失和損毀的,這並非不可能,但,請不要忽略另一種可能性,那就是──這些文獻材料的遺漏,是因為人們沒有妥善保存的關係。這如同十年前,你沒有收好小學考卷;十年後,你突然發現它很重要,可惜考卷早就不見了。

二二八檔案是否存在,又是否被刻意銷毀,我們無從得知。但從這之中,我們應該有所學習和警惕,當我們懊悔一些東西遺失了,也許未必是被人刻意銷毀的,而是因為,當時我們不知道它們重要,於是輕忽了,進而遺失、損毀,最後消失。因此,無論如何,我們都要將歷史文獻做好保存跟流通,以備將來的不時之需。

文獻絕版書
編輯部收藏的文獻、絕版圖書等。

史料即生命

臺灣民報(日文撰寫版)數位檔案紙本
「臺灣民報」(日文撰寫版)數位檔案紙本。

另一方面,對於歷史研究者來說,史料即生命,因此,對於珍稀史料的取得和使用,意義顯得更加重大,以《臺灣民報》(日文撰寫版)舉例來說,當中記載了一則時人引為笑柄的新聞:「後藤新平騎自行車摔倒,被眾人取笑」的舊事。有別於一般對後藤新平的高度推崇,在這份報紙中,因其反政府的立場,刻意記錄下當時執政者的另一面,在這所看到的例子便是「一個滑稽可笑的後藤新平」。

在它的記載中,後藤新平作為自行車的推廣者,因此自己親身上陣,還在官邸外的大操場舉辦了一場自行車比賽,結果摔得四腳朝天,被時人引為笑談。不僅如此,後藤新平為了推廣女性騎自行車,因此逼迫妻子身先士卒,致使妻子極度厭惡自行車云云。姑且不論內容的可信度,但透過這份報紙,可以看見當時不同的立場和聲音,亦或是,一個不同面向的社會。

國家型數位典藏計畫

從二十世紀開始,絕大多數的文明國家,便想方設法地將各種文件做出副本,放在另一個行政中心備查,臺灣也不例外。在過去十年間,國科會(2002-2012)曾推行一項計畫,就是由國家提供完整經費補助各單位將珍藏的文獻或原件數位化,予於保存,稱為「國家型數位典藏計畫」,現已結案。過去計劃執行單位非常多,諸如中研院、臺大、故宮和國家圖書館等大型機構,皆為負責的相關單位,而負責執行的單位,手上必然有其文獻原件,因此國家補助大量的經費,讓負責單位完成後,提供民眾無償使用。現在網路上絕大多數的數位典藏資源,都是在這計劃期間透過公部門進行,有些在製作完成後不開放一般民眾使用;有些則在製作完成後,以無償的方式提供使用。

典藏資源數位化之難

漢珍文獻書籍
標上密密麻麻註解、備註的文獻書籍。

然而,黃總編輯指出,其實當前文獻在使用上的最大問題,仍是「流通」上的困境,更確切地說,應該是使用者「根本不知道有這個材料」,即使退一步來說,人們聽說過它的存在,但也不知道它在哪裡,該如何找到,以及要怎麼使用。

如前述,在臺北發行的《臺灣民報》(日文撰寫),在沒有流通的情況下,全世界僅存一份在東京,一般社會大眾只怕連它的存在都不知道,更遑論裡面提供的其他資訊。雖然公部門推行數位典藏計畫,將文獻進行數位化使用,以此達成保存和流通的用意。然而,在這之中,始終存在著一個不小的漏洞,那就是,「要是公部門沒有察覺民眾的需求,而沒有動手做呢?」

雖然由公部門主導的觀念和作法並未有錯,但也不應全面掌握在公部門手上,這是因為──「有時政府單位典藏的物品,未必是社會大眾有需求的」。舉例來說,故宮花費大筆經費在國寶級的翠玉白菜上,從無塵室建置、數位化影像檔,到 3D 環繞景觀等,但對於國人而言,上線觀看翠玉白菜 3D 影像仍遠不及前往故宮親眼鑑賞來得有需求。

而前述提過,全世界最完整的一份原件在國立臺灣圖書館的「臺灣日日新報」,雖然就文物本身價值而言,「臺灣日日新報」絕對遠低於翠玉白菜,但考量學術研究的需求強度,則全然相反。然而,在公部門的體制規範下,相較於故宮等機構來說,國立臺灣圖書館僅能算是一個小單位,未必能獲得足夠的經費進行文獻數位化。

這就突顯出諸項問題,對於普羅大眾而言,在數位典藏資源使用上的需求與政府單位認知的不同,以及公部門資源分布不均的先天條件差異,容易流於比重失衡,如翠玉白菜等國寶可以持續獲得經費,但「臺灣日日新報」等歷史文獻,卻可能永遠無法獲得資源,不見天日。

因此,若是全然由公部門主導文獻數位化,以及資料庫的建立,那在公部門力有未逮之處,又無法期待民間企業參與協助,眾多寶貴文獻也許就被埋沒在圖書館的某處角落,掩蓋在茫茫資料之中,不但社會大眾難以觸及,更遑論有機會使用了。

漢珍回歸圖書紙本與「個人版」資料庫

當我們回歸市場考量,由私人企業協助文獻的數位化與商品化,來促進更多的文獻被流通、使用時,卻又發現成本入不敷出的問題,以《臺灣民報》(日文撰寫版)來說,因為在頁數上,《臺灣民報》只有《臺灣日日新報》約百分之五的份量,因此以市場的邏輯來看,一般只願意以兩、三萬左右的價錢購入,但若稍稍估算一下,即便文獻原件的取得、掃描製作的過程都先忽略不計,光是製作檢索系統、雇用工程師、業務行銷費用等幾項花費,都難以回收,更遑論要從中獲得利潤。因此,雖然建置資料庫本身是一件很有意義,也非常令人愉快的事,但最終仍要回歸到大環境的限制。

因此在成本考量下,漢珍打算回歸圖書紙本,雖然無法提供檢索的使用,但仍然能達到資訊流通的目的。有趣的是,成本遠較資料庫低的圖書紙本,行情價卻比資料庫要高出七八倍。這樣的現象,恰好反映出「採購者與使用者的脫離」,就好比童書市場的情況一樣,雖然使用者是兒童,但因為是「媽媽買書,兒童看書」,所以媽媽買了她認可的書籍,卻未必是孩子們想要,或者有需求的。

同理,資料庫的採購者是學校圖書館,使用者卻是老師跟學生,如此一來,這中間容易產生採購與實際需求上的落差。因此,漢珍預計推出「個人版」資料庫,將已完成之數位文獻如「臺灣日日新報」等,放置在雲端,讓需求者可以透過網路找到使用的入口,並在平臺上提供「日期瀏覽」和「關鍵字搜尋」等功能,直接與使用者建立聯繫。

資料庫業者的嚴峻挑戰

漢珍編輯部
漢珍編輯部的每日生活工作。

事實上,臺灣現今的環境,對於數位化的文獻資料庫有一些預設的立場,例如許多學者專家們認為,文獻型資料庫應由公部門來主導,而非由民間和市場來進行。

也就是說,這是一個公部門應負責的項目,應屬於公共事業的範疇,排斥由民間企業來進行,讓有意從事的民間企業承擔一些社會壓力。例如漢珍曾製作過利用 GIS 地圖系統呈現臺灣老地圖的資料庫,並向經濟部申請相關補助,委員在審查時雖十分欣賞,但提案最終仍被否決,原因就在於,審查委員們傾向於公家單位來進行相關事宜,而非由民間企業為之。

因此,雖然建置文獻史料資料庫在技術上沒有太多困難,對於像漢珍這類資料庫業者而言,卻仍是一個嚴峻的挑戰,原因有三:首先,源於當前大環境的限制,社會大眾仍認為文獻資料庫屬於公部門的範疇,因此抱持觀望態度,期望將來有一天公部門會著手進行並無償提供使用,讓投入的高額研發經費往往無法回收成本,還需要面對社會大眾的不諒解;其次,資料庫中的文獻原件並非原來就在廠商手中,而是要外求不同來源,因此增加資料庫建立的難度;再者,目前建立的文獻資料庫,一旦將來公部門的數位典藏計畫項目與之重疊,就等同廠商先前投入的經費全部泡湯,因此,這也是一項高風險的極大賭注。

漢珍數位圖書的願景

既然如此,為什麼漢珍公司仍像龜兔賽跑裡的烏龜一樣,一直埋頭苦幹地投入資料庫建立呢?

事實上,正是因為漢珍發現了「數位典藏的邏輯跟資源利用的邏輯」並不完全吻合,也就是說,使用者想要的文獻或資料,公部門未必進行數位化流通,有時反而投入大量經費在一些使用者容易取得,或是平日就可以看見、聽見或使用的物品之上,這樣的一個矛盾,如上述提及的「臺灣日日新報」與「翠玉白菜」即是一例。

漢珍看到文獻保存與利用上的這一項缺口,衷心希望能為臺灣各種史料留下一個再被世人發掘的機會,而持續努力開發這一個知識礦場。在經過十多年的繁體中文數位資料庫製作冒險之旅後,漢珍由於成本的考量,打算先回歸紙本和書籍的部分,已完成的歷史文獻資料庫,則將推出個人版,提供一般使用者一個直接取得管道。

二十世紀以來,或過去兩三百年間,不論生產者是美國、日本,還是臺灣總督府,漢珍均嘗試將這些文獻資料做成副本放置市場上流通。問何時漢珍會停止這傻氣的事業項目?「問題只有我們找不找得到、做不做得到,以及最終能否維持收支」而已,黃總編輯表示,他有一個還在持續溝通、努力的想法,認為將來能嘗試「數位微捲」的發展。

微捲作為一項文獻副本的技術來說,製作、保存和使用方式都不是十分便利,而「數位微捲」則是藉由電腦數位化技術,更方便地提供文獻副本,讓民眾可以透過電腦從雲端一頁一頁翻找資料,再也不需要到圖書館實際操作微捲機,手動一捲一捲轉,雖然沒有像資料庫一樣的精緻索引,但是能直接從日期進行瀏覽,以此降低文獻副本製作成本來提高「數位微捲」存在價值與優勢,以在艱困的大環境下,為稀有文獻找到另一個出路。

不論是採行資料庫建置也好,或是回歸圖書紙本也罷,探究漢珍發展歷史文獻資料庫的初衷,都只是單純希望能達成更多臺灣珍稀文獻流通、保存的願景,並讓更多有需求的人們,能夠發現這些文獻資料,給予最大程度,以及最有效的流通與使用。

本文由《漢珍數位圖書股份有限公司》贊助製作,特此感謝


漢珍數位圖書股份有限公司於1981年在台灣,台北成立,早期以經營美、歐、日等國家之外文原版書籍、高等教育出版品、科技報告、微縮資料、光碟資料庫為主,近年來則以電子出版品、資料庫之建置、數位內容之整合與行銷為主要業務項目。
主要業務項目如下:數位內容業務、系統技術業務、微縮資料業務、論文網路書店,以及相關知識性商品。其中數位內容業務為主要,包括資料庫建製、出版與發行、電子出版品、 網際網路及光碟資料庫進口代理服務、網路系統規劃安裝、微縮影資料進口代理服務、博士論文進口代理服務、技術報告進口代理服務、軟體行銷。
贊助製作

贊助製作

本文由善心人士、企業、機關、團體、產、官、學、鄉、婉與宇宙存在之任何形式生命體,贊助製作有趣好讀的文章,以饗讀者。
相關合作,請洽:[email protected]
贊助製作