2008/02/18

[Computers] Web 2.0 時代的隱私滲透現象 (2)

嗯.. 很抱歉這篇文章寫得短短的,
在這篇裡面,我只提跟自己專題相關的事件與文章,
是對第一篇的想法的實做驗證;
文中放了一些相關的連結,方便大家點閱。

那麼,就請繼續閱讀吧。

筆者在前面提到了,人們有意無意放上網路的資料,一旦被機器索引起來之後可能產生的「資訊滲透壓」。

在 2006 年底,當時筆者只是為了好玩,想要知道「要經過多少人,才會碰到我認識的人」,與「兩個我認識,但在不同生活圈的人之間,是不是有什麼連線關係」,而開始著手進行程式的撰寫,起初只是很單純的抓出好友清單,轉換成方便瀏覽的網頁以方便點閱,但不久後便發現反向連結可能可以提供更多資訊,進而加入了資料庫,並做出了簡單的反向連結功能;在 2007 年的 HappyWeb4 中,第一次與網路先進們做了簡單的討論*1

隨著資料量增加,筆者發現了隱私滲透的現象 (在此筆者定義的「隱私資料」是指「能以此識別某人的資料」),並實做了簡單的排序系統,以 IR 常用的演算法對描述句進行了排序;意即,越相關的資訊將會被提到清單的上層,最後的輸出如圖所示。

20080218_WFFSample-1
[▲ 這張圖對象是誰就請不要追究了,總之是個存在的人]

20080218_WFFSample-2
[▲ 對於名人,這樣的描述或許就較不具可信度了]

而在資料蒐集期間,剛好遇上了無名小站發生了相簿外流事件,及星光幫相關的新聞事件,而既存在網路上的網路描述,看得到的資訊有時多於新聞,筆者就此與幾位先進討論*2。在 2007 年的駭客年會上,XDite 探討了這個議題*3,而陳存暘先生在駭客年會後,為此議題做了較深入的研究與統計*4,筆者節錄摘要中敘述:「..在我們蒐集到的樣本中,有30% 使用者的全名以及 72% 使用者的名字(不包括姓)可以從本篇論文所提出的演算法推測而得..」,種種的跡象顯示這股滲透壓正慢慢成型;也就是說,生活在網路時代的我們,在某種程度上是不具隱私的。

未經處理的資訊能有多大的壓力,滲透出來的資料又有多精確,或許到現在還未有定論,但可以確定的是,在不久的將來,以「人際網路」為對象的搜尋引擎將會出現*5;該如何適切地描述他人,又該如何確保自己的隱私資料,將是未來服務提供者與網路使用者必須研究琢磨的課題之一。

那麼,這篇讓我寫到失眠又頭痛的正經文章,就到這裡結束了。

感謝在 HappyWeb 中認識的獨孤木、Qing、XDite,
及中研院多媒體網路與系統研究室的陳存暘先生 :)

*1 相關網頁:
獨孤木: HappyWeb

*2 相關網頁:
Qing: 網路是人類集體的記憶
XDite: 從無名好友到樂多好友,它們都能拿來看朋友?

*3 相關網頁:
iThome: 台灣駭客年會 (「網站資訊全都露」段落)

*4 相關網頁:
無名小站中真實姓名洩露的危機

*5 事實上,已經有這樣的搜尋引擎了: Paterva Maltego


[posted by cornguo @ CornGuo's BLOG, of murmurs]

沒有留言: