2009年6月23日 星期二

社會性標記--Social Tagging

社會性標記(Social Tagging)是集合眾多個人對網路資源進行標記、以詞分類的新興資訊組織方式。這種自由標記與傳統以專家為基礎的圖書資訊組織方式相當不同。正當Web 2.0 成為熱門話題之際,Web 3.0 已悄然出現。觀察從1.0、2.0、到3.0,Web 1.0 強調傳統資訊環境的網路化,而Web 2.0 關心社會性網絡(Social Network)的互動力量,或許Web 3.0 是提倡系統智慧化等


在各種Web 2.0 的應用中,有關Social Tagging 的發展,在書籤共享Del.icio.us及圖片共享Flickr等網站帶動下,已成為Web 2.0 網站最重要的辨別特徵之一。前者據稱已有超過2,500 萬筆超連結資訊;而後者則有400 萬名使用者、上傳近3 億張圖片。Yahoo!於去年收購這兩家網站的主因,就在於其網羅龐大志工,依照可搜尋的詮釋資料(Metadata),共同替資訊作分類。其相關研究也受到圖書資訊領域重視,主要是因為標記(Tagging)與圖資專業中的分類與索引(Classification and Indexing)概念類似相較以專家為基礎的資訊組織方式,以使用者自由標記(Free Tagging)的模式,累積出的獨特分類體系,更能貼近使用者認知,也有別於傳統以知識為中心的分類方式。Social Tagging 是所有Web 2.0 網站所具備的重要功能之一,下表1列舉一些較具代表性的Social Tagging 網站。


表1:社會性標記網站舉例


Scial Tagging的意涵究其本質,是指由使用者共同為各種資源進行標記(User Tagging)。換言之,即由使用者個人來編輯索引(User Indexing),進而集結成共同索引的機制。Social Tagging這個名詞最早的說法應為社會性書籤(Social Bookmarking),泛指提供個人儲存與分享網站鏈結的服務,即個人將累積的書籤置於網路上與人分享。其中個人可對所收藏的鏈結給予標籤或關鍵詞以標籤分類,方便日後搜尋取用,這種新興的網路資源組織方式即所謂的Social Tagging。

Bookmark只是眾多資源類型的一種,使用者還可以針對其它類型資源進行標記,所以SocialBookmarking算是Social Tagging的應用,而非等同概念。俗民分類(Folksonomy)與Social Tagging意義接近。另有一社會性分類(Social Classification)概念,其強調社會性(Social),而較不去區分專家與大眾之別。但Folksonomy或Social Classification所涉及的層面較廣,有時Tagging的目的並不一定是分類、或過程中需要遵循分類結構。其它還有許多相關說法,包括如協力式分類(Collaborative Classification)、協力式標記(Collaborative Tagging)、自由標記(Free Tagging)、標籤分類學(Tagsonomy)、基層分類(Grassroots Classification)、民眾分類(Ethnoclassification)等。相關概念還包括強調社會性或互動取向的社會性軟體(Social Software)、社會網絡(Social Networks);或強調資訊組織取向的命名( Labeling 或Naming )、關鍵詞索引( Keyword Indexing )、分類(Categorization)、分面分類法(Faceted Classification)、分面索引法(Faceted Indexing)、知識本體(Ontology)、語意網(Semantic Web)等概念,相當多元與龐雜。 如下圖1所示,其實可由三種概念思考:使用者、資源、及分類。若從使用者角度,就產生如social、ethno的概念;若由資源角度,就有各類物件資源如bookmark 、photo的概念產生;若由分類角度,tagging 、labeling 、classification、categorization、indexing等則是常見的概念。總括來說,Social Tagging包含Social與Tagging兩種構面,Social關心使用者,而Tagging則較關心資源及分類的內容與結構,但二者皆需依賴使用者、分類、資源三方面的關聯。


圖1:社會性標籤之概念架構


Social Tagging的概念落實於Web 2.0網站應用,三種較常見的分法及其Tagging特性簡介如下:

  • 資源類型區分:這是最常見的區分方式,如書籤、書目、圖片、影片、Blog等。基本上,沒有文字的資源,如圖片、影片等,最需要使用者標記機制,主要當然是因為這些物件(Object)缺乏文字說明,也沒有脈絡(Context)可循,若有大量標籤,對於資訊檢所自然會有相當助益。此外,以文字型為主的資源,也會因內容太多,而發生“字”對但“意義”不一定相符的情形,若能有適當標籤,則可協助過率,節省瀏覽或閱讀時間。

  • 來源區分:在Social Tagging的網站中,大部分的資源是來自他人已建置好的資源。例如網站是由他人所建立,使用者個人只是針對這些網站提供標籤或註解。故分類或索引都具有相當主觀色彩,因此要視分類的目的來決定Tagging的特性與範疇。

  • 適用對象區分:在眾多的Social Tagging 網站中,大部分並不區分適用對象,例如YouTube、Technorati,都是人人可以使用與標記的網站。以大眾為主的Tagging 可以想見,其範疇及品質必然很難控制;而以特定群體為對象的網站,其標籤品質及可用性相對較高。

參考資料:

本文摘自部分"淺談社會性標記之意涵與應用",卜小蝶,Web2.0 與圖書館學術研討會

2009年6月8日 星期一

圖書資訊服務&網路資源服務

圖書資訊服務從過去提供實體書籍館藏、開發圖書資訊系統,隨著網路服務的多元化後亦擴展
資訊資源的應用。圖書資訊&網路資源的特性,如下表1:


表1:圖書資訊與網路資源特性比較[1]

所以"網路資源"的資料來源主要是由自動擷取網路上的網頁(Blog),與"圖書"所指的書籍.期刊.文獻等資訊有所區別。 故不論是"圖書資源"或是"網路資源",終究其使用者對資訊的需求可是有增無減。隨著"網路資源"的型態和變動性,下表2提供圖書資訊與網路資源組織與檢索特性之比較。首先,"圖書資訊"的索引來源是Metadata;而"網路資源"的索引來源則多來自資料本身與資料間的連結,故較"圖書資訊"缺乏結構性的資料項目。圖書館的"圖書資訊"有中國圖書分類法與杜威十進分類法的書籍編目,可從下表3得知中文書籍與西文書籍的分類目錄。所以相較於"網路資源"則是利用搜尋引擎(資源檢索系統),此自動化技術根據詞彙出現頻率.超連結特性等,來組織整理"網路資源"。就檢索技術而言,"圖書資訊"多以文字比對為基礎,以檢索詞彙(Query Term)或關鍵字(Keyword)進行比較;而"網路資源"的檢索除了重視字串比對外,更重視檢索結果的排序(Ranked)。正因為文字比對常有"比對不到"的可能,所以再使用圖書資訊檢索時就很容易發生查詢不到結果的情形,也就會產生較低的求全率(Recall)。反觀使用網路資源檢索賴於搜尋引擎的技術,即求準率(Precision)偏低。

  • 求全率(Recall):文件被檢索到的比率;
  • 求準率(Precision):檢索到的文件中相關文件的比例。

表2:圖書資訊與網路資源之組織與檢索特性比較[1]

表3:中文與西文圖書分類法

參考資料:

[1] "使用者導向之網路資源組織與檢索",卜小蝶著,文華圖書。