目前分類:討論會紀錄 (5)

瀏覽方式: 標題列表 簡短摘要

0521問題與討論:

 

張素玢老師:請問進億搜尋結果中詞頻,是觀察df(相關詞彙出現次數)還是tq(相關詞彙中關鍵字的相關性)? (關於dftq的介紹,請見THDL功能介紹:http://thdl.ntu.edu.tw/THDL/HelpDocs/

李進億:主要觀察df

THDL 發表在 痞客邦 留言(0) 人氣()

國立臺灣大學數位典藏中心研究生獎助計畫」發表月會

資料庫使用心得報告

國立臺灣師範大學歷史學系博士班 李進億

 

THDL 發表在 痞客邦 留言(0) 人氣()

      關於 THDL 分類的疑慮:

首先解釋THDL契書的來源:有一半是來自國中圖,裡面主要是總督府檔案抄錄契書;後來陸續倒入數量比較多的是「已出版古契書」。旻融所說「契書原本的脈絡因為 THDL 重新分類而被剔除了」指的應該是 THDL 中「已出版古契書」的部分,因為編著者/作者在蒐集契書時就已經替契書做了分類,但是倒入 THDL後這些分類卻都被抹去。THDL這樣做是因為古文書界對契書並無一致分類,我們當初決定做分類的標準化時,有參考王世慶教授與洪麗完教授的分類, 但因兩位看待契書的perspectives很不一樣,對契書的分類方式差異很大,因此後來我們用了一個比較偷吃步的方法——直接採用國中圖於民國92年第一批做了九千多件契書的分類方式,一方面因為他們的分類比較簡單,只有十幾類,比較不牽涉到對契書進行複雜的意義上的詮釋,而且這種分類跟洪麗完教授的分類非常相似。於是我們設計一套自動化的方法,將 THDL 的其它契書都按照這樣的分類原則進行統一分類。後來在做「已出版古契書」時,則因為每一本書的分類方法都不一樣, 而沒有考慮得夠周到,也將書中原有分類都保留下來。旻融提出的意見很好、很重要,現在應該可以回溯將「已出版古契書」原本的分類補上。並且,關於旻融提到,不同的書可能將同一件契書依據不同的分類法分類,這點在系統上可以用 multiple 的欄位來包容不同方式的分類,這也是數位化的好處之一:脈絡可以不只有一個,可以同時有多種脈絡,讓看的人自己詮釋。

      回應對日期書寫格式正規化的憂慮:

旻融認為將日期的書寫格式做正規化似乎抹去了某種脈絡,這可能是我在文章中沒有解釋清楚:正規化的結果其實不是要給人看的,是要給機器看的,日期的正規化並沒有去改動全文,只是增加了一個給機器看的註記,記錄日期正規化之後的格式,這是因為契書中的日期書寫有很多形式,數字部分可能就會寫成中文簡體或繁體,年份可能寫成干支年……等等,正規化的目的是讓機器可以看得懂這些不同書寫格式的日期,便可以在檢索或是後分類時,給使用者一些好處,避免檢索的缺漏等等。然而,THDL的正規化當中,「分類」的正規化的確是給人看的成分居多,因此當初沒有設計清楚就可能造成使用上的誤解。

THDL 發表在 痞客邦 留言(0) 人氣()

臺灣歷史數位圖書館在歷史研究應用上的侷限性與價值提升——以古文書為例*

鍾旻融**

 摘要

    本文旨在透過檢視臺灣歷史數位圖書館(THDL),在資料前置處理程序的「去標準化」與「再標準化」作業流程當中,由於牽涉到系統技術應用與人工作業處理,因而無法避免幾點在歷史研究應用上的侷限性。

THDL 發表在 痞客邦 留言(0) 人氣()

台大數位典藏研究發展中心於98年2月26日下午,舉行「古契書與台灣史」討論會,由中心主任項潔主持並主講。本次討論會,旨在介紹台大數位典藏中心之「台灣歷史數位圖書館」(Taiwan History Digital Library,THDL),此資料庫與台大圖書館、國立台中圖書館等單位合作,蒐羅約兩萬三千件古契書,並已開放外界申請使用。會議當天,數十位來自不同單位的歷史學者亦與會討論,提供多元的觀點和意見。

項潔教授於演講中指出,「台灣歷史數位圖書館」是針對臺灣史研究所設計之全文資料庫,他期望以此資料庫為實驗對象,嘗試結合資訊科技與歷史研究,探索數位人文(digitalhumanities)的各種可能。這也是台大數典中心成立的目的。他指出,數典中心期許自己能從資料保存,走向學術研究的創新。但這個目標,有賴更多人文與資訊學者共同投入。數典中心所能做的,是提供平台與資源,促成跨領域合作。

 

項潔說,他對於人文與科技的結合能產生的火花,非常感興趣。而「古契書與台灣史」討論會,即是邁向此一目標的初步嘗試。他期待此討論會能藉由聚焦於特定議題,成為不同領域學者交流的園地。此討論會將以月會方式持續舉辦,邀請在古契書研究卓然有成的學者,分享心得,也歡迎新銳研究者提出具前瞻性的構想。

THDL 發表在 痞客邦 留言(1) 人氣()