電腦效能應用與安全研究室 Performance, Applications and Security Lab


我們的研究範圍很廣,從嵌入式系統、手機應用、一直到雲端計算、商務應用、資訊安全都有做。
我們的合作研究夥伴很多,包括聯發科、IBM、中研院、資策會,還有和台大、清大、交大的教授合組研發團隊
,包括高階應用處理器架構研究、虛擬化技術、異質計算、系統軟體等重要技術的研究與創新,我們很關切台灣人才與產業的未來。

2015年9月26日 星期六

大數據與社會人文

學電腦的人大概都聽過一句話:「垃圾進、垃圾出」(garbage in, garbage out)。如果輸入亂七八糟的資料,那麼根據這些資料所產出的結果,很可能也是亂七八糟的。所以一旦發現資料有異常,我們往往儘快停止電腦的運作,免得新產出的垃圾資料覆蓋了正確的資料。

威權時代中教化人心的資訊,有多少是真的呢?只要十句話中夾雜一句謊話,就可以顛倒黑白(參考:金庸的鹿鼎記)。所以我對於從小學校所教的歷史,只當成是欽定的小說。我對考古沒興趣,所以也沒想去找資料去驗證這些故事的真實性。

這不是說歷史不重要,而是說我在很不幸地沒有辦法和時間去確認歷史教材的前提下,不大想用歷史典故去論證些什麼。對我來說,短短數十年所目睹的環境變遷,乃至於金庸小說中的人物故事,可能都比歷史課本的意義豐富。這聽起來很奇怪,竟是一種無奈。

所謂「往事已矣,來者可追」,以前的歷史的真實性有待商榷的原因,一則是上述人為選材、加料所造成的偏頗、扭曲,一則是閱讀、分析歷史者無法蒐集完整資料,以及缺乏時間分析大量資料。

大數據時代的來臨,大幅改變了歷史的記錄和分析機制。現在,具備上網能力的每個人,都可以在互連網上公開記錄與分享他/她所認知的歷史,這些記錄有可能被永久記錄下來,隨時被有興趣的人或電腦所閱讀與分析。而閱讀和分析的結果可能再被公開分享在互連網上,不斷再造微細的歷史事件。

為了設計飛彈、原子彈、先進武器而精益求精的電腦科技,此時可用於整理與分析眾多微細的歷史事件,或許能夠較為客觀地提供我們歷史的全貌,單一事件不會被埋沒,統計可以更精確,事件與事件之間的關係可以被發掘出來。

當然,這樣的歷史,或許不容易被現在的史學家所接受。但誰知道未來會如何呢?或許再過個三五十年,互連網上所累積的大數據,將使得「近代史研究」的面貌大為改觀。而千年之後,或許將以大數據出現為分野,之前的歷史,被稱為古典歷史和黑暗歷史。

以上是我心血來潮所推測的,但我想這並非空穴來風,所以我停筆上網搜尋,發現有學術社群在這兩年開始研究計算歷史(computational history),還發明了一個新字Histoinformatics,有些社群所見跟我自己所想的類似。

除了歷史之外,不少學者也開始利用大數據研究各種社會人文現象。然而,由於目前尚在起步階段,大數據和分析大數據所需的運算資源並非容易取得,而且此類研究需要兼具社會人文的專業和運用電腦的能力,這樣的人才很少。

所以,或許要再過幾年,大家才會看到大數據對於人類文化深層的影響。現在對於社會人文感興趣的年輕人,或許可以及早思索一下如何開創出新道路、為學術研究和實用價值注入新氣象。

沒有留言:

張貼留言