close

0521問題與討論:

 

張素玢老師:請問進億搜尋結果中詞頻,是觀察df(相關詞彙出現次數)還是tq(相關詞彙中關鍵字的相關性)? (關於dftq的介紹,請見THDL功能介紹:http://thdl.ntu.edu.tw/THDL/HelpDocs/

李進億:主要觀察df

項潔老師:這必須看下的關鍵字特性,以永安埤為例,可能兩者都要交相看。

林竣達:請問系統如何抓人名、地名?如何篩選?是否有抓錯、漏抓的情形?

項老師:由電腦自動抓取,我們是用詞夾子,例如地契中的地名,可以東至..、西至,這樣的座標,用電腦去抓取這些字詞中夾的詞彙,因為是電腦自動抓取,所以難免會有抓錯的情形。

竣達:我覺得剛剛的討論都提到「關聯性」的問題,亦即如何用資訊技術去逼近物件與物件之間的關係,如何達到資料之間「數量」上與「質量」上的逼近,我覺得現在的討論似乎偏向「數量」上的逼近,有點像是統計上的意義,至於研究中「質量」上的逼近,如何繼續下去,或許需要研究者思索。

項老師:關於竣達提到的問題,我們有做一個「上下手契」的東西,可以變得很複雜的一個graph,這類關係已經超出統計,而是能建立出一個土地關係的視野。不過電腦能做的有限,所以需要大家運用錯誤會報。我們希望能提供的是一個觀察環境,而不是幫研究者做出任何結論。

張老師:另外進億提到可增加古碑文的電子化,因為地契研究中碑文也很重要,碑文的地點如果加入的話,也會很有幫助。

項老師:臺大的碑文在另一個資料庫,為什麼沒有跟古契書放在一起,碑文的性質很複雜,性質不同,就像明清行政檔案,將其古契書分開,因為明清檔案代表中央地方的往來,古契書則是地方地權的交易,兩者幾乎沒有太大交集,當太多資料加在一起時,反而會形成噪音。古拓碑是很需要做的,臺大做的都有地理位置,做起來並不困難,問題在於干擾原有資料群,做好之後傾向做為一個獨立資料庫。

鍾旻融:GIS缺乏的是時間向度,THDL缺乏的是空間向度,進億的研究結合了時間與空間的向度,大的話可以形成一個世界的研究,小的話也可以是一個區域研究。另外,希望資料庫能結合,像是GIS加上檔案研究。

項老師:非常希望合作,重點在於我們必須知道歷史研究者如何做研究。我們傾向將問題抽象化,當研究者有個別需求,我們會抽象的設想如何設計一個general solution

arrow
arrow
    全站熱搜

    THDL 發表在 痞客邦 留言(0) 人氣()