電腦效能應用與安全研究室 Performance, Applications and Security Lab


我們的研究範圍很廣,從嵌入式系統、手機應用、一直到雲端計算、商務應用、資訊安全都有做。
我們的合作研究夥伴很多,包括聯發科、IBM、中研院、資策會,還有和台大、清大、交大的教授合組研發團隊
,包括高階應用處理器架構研究、虛擬化技術、異質計算、系統軟體等重要技術的研究與創新,我們很關切台灣人才與產業的未來。

2015年2月28日 星期六

與義大利國家研究委員會交流「智慧城市」議題

參加一個科技部的團隊,到義大利羅馬與國家研究委員會(CNR, http://www.cnr.it/sitocnr/home.html)進行為期兩天的雙向交流研討會。我負責撰寫第二天上午的行程的心得報告。

第二天早上的議程,主題是巨量資料與社群網路(Big Data and Social Network)。

第一場由台灣大學資訊工程系的洪士灝副教授演講「如何運用巨量資料開發無所不在、安全智慧的行動應用?」(Developing Smart, Pervasive and Secure Applications with Big Data in Mind),洪教授談到業界所蒐集的巨量資料中,絕大部份(75%)來自於個人的資料,但這些資料的運用,以及獲得的商業利益,只有極少部份嘉惠提供資料的個人,這是非常不公平的生態,因此主張要讓個人有辦法控制與運用其個人資料。洪教授的實驗室開發出支援可攜式行動應用(pervasive mobile applications)、維護個人隱私(privacy)、強化資訊安全(security)、即時資料分析(analytic)和增進效能(performance)的基礎建設雛形(framework)與開發工具(dev tools)。

由於歐洲當前普遍對於個資的保護,遠較其他地區更為重視,因此義大利的專家對洪教授的研究相當有興趣。事實上,緊接在洪教授的演講之後,Dino Predreshci教授即在他的演講中,多次談到對於個資保護有共同的觀點以及同樣希望以去中心化的方式去讓個人能夠進行資料分析。Predreshci教授的演講題目是Big Data and Privacy - It's Time for a New Deal on Personal Data。他認為巨量資料已經改變人類的社會行為,而且有史以來從來沒有像巨量資料這樣大規模的改變,但巨量資料的運用,應該要對人類的共同福祉有所貢獻才好。例如聯合國(UN)推動資料革命(Data Revolution),強調大家應該重新思考如何運用個人資料,這是需要長期持續的發展的議題。

舉例來說,Social Mining是新的「社會顯微鏡」,而巨量資料可說是新世代的石油般重要的資源,但是誰是這些技術和資源的受惠者呢?不恰當的資源蒐集和分析,反而會造成種種嚴重的問題。例如美國國安局的PRISM計畫,從網路上監控與蒐集許多資料,手法和目標都值得商榷,美國政府這樣的集中式管理和運用監控得來的個人資料,引發許多國家和個人的批判。
Predreshci教授認為,如何利用匿名化技術把敏感個人資料消除,同時還能讓data mining產生有用的結果,是很重要的研究議題(參考資料:Anna Monreale, “Privacy by design in data mining”, Ph.D. Thesis, 2011)。他提到一個稱為RaC的指標 (Risk and Coverage Curve),用來評估匿名化的成效與可能出現的問題。RaC可用以顯示有多少比率的使用者是無法被辨認出的,他認為不應該用最糟糕的狀況(worst case),因為總有一些行為特異的邊緣行為者(outliners),特別容易被辨認出,因此與其花時間去處理這類資料,不如將這類資料剔除反而會讓匿名化有比較好的結果。

第三場的演講者是中央研究院資訊所的楊得年教授,主題是Influence Diffusion and Optimization in Online Social Networks。楊教授談到,隨著社群網路應用的快速發展,有各式各樣之資料已被收集,可用來分析人與人之社群影響力,使得電腦科學家,相較於傳統社會學家,可更精準分析不同人的決策。決策判斷在商務應用上扮演重要角色,2012年的Nature期刊論文,已詳細研究線上社群網路中,社群影響力傳播十分重要。目前相關研究僅針對社群影響力廣播擴散,希望選擇少數種子節點,使得擴散範圍最大化。新興的社群廣告(Social Advertisement),已不再專注於傳統媒體明星,而是從社群網路中尋找有影響力的人出來,獲得廠商的好處,成為廣告的一部份。只要你能證明你的影響力,麥當勞給免費漢堡、 Sony給相機試用。

擴散範圍最大化的問題雖為NP-Hard,但乃屬於較好近似之NP-Hard問題。我們的貢獻在提出針對重要節點是影響力集中最大化問題,證明其亦為NP-Hard但無法在1-1/e內近似,但在簡化社群圖中找到最佳解。此外,我們亦同時研究傳統商品交易資料與新興社群圖資料,提出一個商品社群利潤最大化之問題,證明其為NP-Hard且在O(n)內不可近似(除非NP=P),並提出一個近似演算法有效解決之。

緊接在楊教授之後的第四場演講,主題「Big Data and Social Mining」也是高度相關。Giuseppe Manco博士也談論新興的社群行銷(Viral marketing)與行為影響的傳播性。他特別提出Topic-dependent影響性,意思是說權威與影響力與議題有高度相關性,因此美國歐巴馬總統在政治上有高度影響力,但某某歌星可能在時尚產品上的影響力遠高於歐巴馬。因此,他提出一個所謂的AIR Propagation Model,依據Authoritativeness、Interest、Relevance三項因素去評估影響力。

第五場的演講者是Fosca Giannotti博士,主題是Towards a Digital Time Machine Fueled by Big Data and Social Mining。她認為巨量資料是全民的資產,需要被民主化(Democratizing Big Data),因此提出「Big Data Analytic as a Service」的概念,希望巨量資料能夠盡可能被人民使用。義大利CNR在這個主題上,與歐洲許多研究單位合作,成立一個Euro Lab on Big Data Analytics and Social Ming(http://www.sobigdata.eu/)。

Giannotti博士談到巨量資料分析的許多好處。其中最重要的理念,就是希望利用社會顯微鏡(The Social Microscope)作為量測、理解、預測人類行為的工具。例如,她們在法國,利用兩千三百萬台手機在數週間的訊號資訊,根據每個使用者的行動力以及出現的位置計算出mobility diversity指數,結果發現這個mobility diversity指數與個人的整體身心健康狀況(wellbeing)有高度相關性,因此進一步分析出法國各地的wellbeing。

Giannotti博士如數家珍般講了很多現有的成果,許多的資料和論述,在「http://www.sobigdata.eu/」這個網頁上都找得到,值得國內學者借鏡。

沒有留言:

張貼留言