2009年6月23日 星期二

社會性標記--Social Tagging

社會性標記(Social Tagging)是集合眾多個人對網路資源進行標記、以詞分類的新興資訊組織方式。這種自由標記與傳統以專家為基礎的圖書資訊組織方式相當不同。正當Web 2.0 成為熱門話題之際,Web 3.0 已悄然出現。觀察從1.0、2.0、到3.0,Web 1.0 強調傳統資訊環境的網路化,而Web 2.0 關心社會性網絡(Social Network)的互動力量,或許Web 3.0 是提倡系統智慧化等


在各種Web 2.0 的應用中,有關Social Tagging 的發展,在書籤共享Del.icio.us及圖片共享Flickr等網站帶動下,已成為Web 2.0 網站最重要的辨別特徵之一。前者據稱已有超過2,500 萬筆超連結資訊;而後者則有400 萬名使用者、上傳近3 億張圖片。Yahoo!於去年收購這兩家網站的主因,就在於其網羅龐大志工,依照可搜尋的詮釋資料(Metadata),共同替資訊作分類。其相關研究也受到圖書資訊領域重視,主要是因為標記(Tagging)與圖資專業中的分類與索引(Classification and Indexing)概念類似相較以專家為基礎的資訊組織方式,以使用者自由標記(Free Tagging)的模式,累積出的獨特分類體系,更能貼近使用者認知,也有別於傳統以知識為中心的分類方式。Social Tagging 是所有Web 2.0 網站所具備的重要功能之一,下表1列舉一些較具代表性的Social Tagging 網站。


表1:社會性標記網站舉例


Scial Tagging的意涵究其本質,是指由使用者共同為各種資源進行標記(User Tagging)。換言之,即由使用者個人來編輯索引(User Indexing),進而集結成共同索引的機制。Social Tagging這個名詞最早的說法應為社會性書籤(Social Bookmarking),泛指提供個人儲存與分享網站鏈結的服務,即個人將累積的書籤置於網路上與人分享。其中個人可對所收藏的鏈結給予標籤或關鍵詞以標籤分類,方便日後搜尋取用,這種新興的網路資源組織方式即所謂的Social Tagging。

Bookmark只是眾多資源類型的一種,使用者還可以針對其它類型資源進行標記,所以SocialBookmarking算是Social Tagging的應用,而非等同概念。俗民分類(Folksonomy)與Social Tagging意義接近。另有一社會性分類(Social Classification)概念,其強調社會性(Social),而較不去區分專家與大眾之別。但Folksonomy或Social Classification所涉及的層面較廣,有時Tagging的目的並不一定是分類、或過程中需要遵循分類結構。其它還有許多相關說法,包括如協力式分類(Collaborative Classification)、協力式標記(Collaborative Tagging)、自由標記(Free Tagging)、標籤分類學(Tagsonomy)、基層分類(Grassroots Classification)、民眾分類(Ethnoclassification)等。相關概念還包括強調社會性或互動取向的社會性軟體(Social Software)、社會網絡(Social Networks);或強調資訊組織取向的命名( Labeling 或Naming )、關鍵詞索引( Keyword Indexing )、分類(Categorization)、分面分類法(Faceted Classification)、分面索引法(Faceted Indexing)、知識本體(Ontology)、語意網(Semantic Web)等概念,相當多元與龐雜。 如下圖1所示,其實可由三種概念思考:使用者、資源、及分類。若從使用者角度,就產生如social、ethno的概念;若由資源角度,就有各類物件資源如bookmark 、photo的概念產生;若由分類角度,tagging 、labeling 、classification、categorization、indexing等則是常見的概念。總括來說,Social Tagging包含Social與Tagging兩種構面,Social關心使用者,而Tagging則較關心資源及分類的內容與結構,但二者皆需依賴使用者、分類、資源三方面的關聯。


圖1:社會性標籤之概念架構


Social Tagging的概念落實於Web 2.0網站應用,三種較常見的分法及其Tagging特性簡介如下:

  • 資源類型區分:這是最常見的區分方式,如書籤、書目、圖片、影片、Blog等。基本上,沒有文字的資源,如圖片、影片等,最需要使用者標記機制,主要當然是因為這些物件(Object)缺乏文字說明,也沒有脈絡(Context)可循,若有大量標籤,對於資訊檢所自然會有相當助益。此外,以文字型為主的資源,也會因內容太多,而發生“字”對但“意義”不一定相符的情形,若能有適當標籤,則可協助過率,節省瀏覽或閱讀時間。

  • 來源區分:在Social Tagging的網站中,大部分的資源是來自他人已建置好的資源。例如網站是由他人所建立,使用者個人只是針對這些網站提供標籤或註解。故分類或索引都具有相當主觀色彩,因此要視分類的目的來決定Tagging的特性與範疇。

  • 適用對象區分:在眾多的Social Tagging 網站中,大部分並不區分適用對象,例如YouTube、Technorati,都是人人可以使用與標記的網站。以大眾為主的Tagging 可以想見,其範疇及品質必然很難控制;而以特定群體為對象的網站,其標籤品質及可用性相對較高。

參考資料:

本文摘自部分"淺談社會性標記之意涵與應用",卜小蝶,Web2.0 與圖書館學術研討會

2009年6月8日 星期一

圖書資訊服務&網路資源服務

圖書資訊服務從過去提供實體書籍館藏、開發圖書資訊系統,隨著網路服務的多元化後亦擴展
資訊資源的應用。圖書資訊&網路資源的特性,如下表1:


表1:圖書資訊與網路資源特性比較[1]

所以"網路資源"的資料來源主要是由自動擷取網路上的網頁(Blog),與"圖書"所指的書籍.期刊.文獻等資訊有所區別。 故不論是"圖書資源"或是"網路資源",終究其使用者對資訊的需求可是有增無減。隨著"網路資源"的型態和變動性,下表2提供圖書資訊與網路資源組織與檢索特性之比較。首先,"圖書資訊"的索引來源是Metadata;而"網路資源"的索引來源則多來自資料本身與資料間的連結,故較"圖書資訊"缺乏結構性的資料項目。圖書館的"圖書資訊"有中國圖書分類法與杜威十進分類法的書籍編目,可從下表3得知中文書籍與西文書籍的分類目錄。所以相較於"網路資源"則是利用搜尋引擎(資源檢索系統),此自動化技術根據詞彙出現頻率.超連結特性等,來組織整理"網路資源"。就檢索技術而言,"圖書資訊"多以文字比對為基礎,以檢索詞彙(Query Term)或關鍵字(Keyword)進行比較;而"網路資源"的檢索除了重視字串比對外,更重視檢索結果的排序(Ranked)。正因為文字比對常有"比對不到"的可能,所以再使用圖書資訊檢索時就很容易發生查詢不到結果的情形,也就會產生較低的求全率(Recall)。反觀使用網路資源檢索賴於搜尋引擎的技術,即求準率(Precision)偏低。

  • 求全率(Recall):文件被檢索到的比率;
  • 求準率(Precision):檢索到的文件中相關文件的比例。

表2:圖書資訊與網路資源之組織與檢索特性比較[1]

表3:中文與西文圖書分類法

參考資料:

[1] "使用者導向之網路資源組織與檢索",卜小蝶著,文華圖書。

2009年5月4日 星期一

美味書籤--Del.icio.us

Wikipedia上面對於Delicious的解釋:
"Delicious原名del.icio.us,是免費的社群性網路服務,用於交流網頁書籤網摘。它在2003年底上線,由約舒亞·沙科特(Joshua Schachter)開發。Delicious已於2005年12月被Yahoo!所收購,但仍然獨立運作。在2008年中,網站推出2.0版本。新網站運行在新平台中,提高了頁面的加載速度。亦使用了全新的搜尋引擎,令使用者更易找到所需。主域名亦更為Delicious.com (http://delicious.com/)。
"

Delicious是一個公開的書籤系統,使用者可以將自己喜愛的網站連結張貼於美味書籤,供個人使用與分享他人。由於Delicious是網友自發張貼自己的URL連結,讓使用者以標籤(tag)的方式使用關鍵字做自己的分類,其他人搜尋標籤(關鍵字)就可以輕易獲得該類別中的資訊。所以在大家共同進行大量標籤分類之後,該網站所收集的資訊不但質量很高,而且分類適當、易於搜尋,可視為是Folksonomy廣泛應用代表之一

以Google網站(http://www.google.com/)為例,在Delicious上的標籤,如下圖1所示。




圖1: Delicious上Google網站的標籤

(原始畫面:http://delicious.com/search?p=http%3A%2F%2Fwww.google.com&u=&chk=&context=&fr=del_icio_us&lc=0)

圖2顯示多數使用者對於Google網站共同認可的標籤,通常也是最具代表性的,如Search(10414)、google(8511)、Searchengine(3845)等。

圖2:多數使用者對Google網站定義之標籤

(原始畫面: http://delicious.com/url/ff90821feeb2b02a33a6f9fc8e5f3fcd)

參考資料:

What's the word -- Folksonomy?

Folksonomy--一個在Web2.0的衝擊與眾多分類問題之情況下,衍生使用任意關鍵字的協同分類工作。Folksonomy是由 Thomas Vander Wal 所創,以 folk (群眾)與 taxonomy(分類法) 所組成的詞彙。因此Folksonomy is n. classification by the people指的是一群使用者在公開分享的條件下對某一資源給予標記定義,使該資源產生具代表性的意義,為群眾的分類管理系統。譯名有:群眾分類/ 庶民分類 / 通俗分類 / 大眾分類 / 社群分類等。
雖然Folksonomy由taxonomy組成,實際並不是進行「分類」(classification),而是「歸類」(categorization)的活動。某一資源可同時存在在不同的類別之下,其類別與類別間的結構較寬鬆且未事先設定。
  • 優點:降低分類成本,並因為越多的使用者對同一資源加註標籤時,藉由總和標籤得知大眾的共同認知或用語,產生一需求線(Desire Line)。
  • 缺點:當同一詞彙出現多種意義時會容易產生語意模糊。或使用者使用相同的定義來描述某一資源會出現即使是相同意義的字,但系統在分類上視為不同。
Folksonomy在Web2.0發展與研究上可應用於依照使用者的偏好推薦網路資源,如圖片、影音、書籍、blog;或是知識搜尋與管理;或是blog和書籍的排名。例如分享書籤網站「del.icio.us」,相片分享網站「Flickr」,目標分享網站「43 Things」,網站分享網站「StumbleUpon」,音樂評論與同好網站「GenieLab」與「Upto11」,主題討論區「Tagsurf」。

2009年4月13日 星期一

什麼是雲端計算?

這是我閱讀 Wikipedia "Cloud Computing" 條目的整理。

什麼是雲端計算(Cloud Computing)


雲端計算是基於網際網路開發(Cloud)並使用電腦技術(Computing)。
Cloud computing is Internet-based ("cloud") development and use of computer technology ("computing").
無論在何時、何地都能透過網際網路(Internet)來取得以IT為基礎的服務(e.g. Web Service)

雲端運算的資訊永久存在網際網路上的伺服器,並暫時快取在客戶端,包括桌上型電腦、筆記型電腦...等。
Cloud Computing is a paradigm in which information is permanently stored in servers on the Internet and cached temporarily on clients that include desktops, entertainment centers, tablet computers, notebooks, wall computers, handhelds, sensors, monitors, etc.

雲端運算的架構

Clients

存取 Cloud Application 的硬體或軟體,例如:
  • 行動裝置 (Mobile)
  • 終端機 (Thin client)
  • 瀏覽器 (Thick client)


Service (e.g. Web Service)

是一個機器對機器,透過網路提供某種服務。
Cloud Service is "software system[s] designed to support interoperable machine-to-machine interaction over a network"
例如:


Application


基於眾多 Service 所建構出來的 Application。通常不必經過安裝即可使用(但必須安裝 Clinet),減少軟體維護、不間段操作(?)以及支援的成本。
  • 例如只要安裝瀏覽器,便可以使用 Google Docs 來編輯文件、試算表、投影片,或是使用 GmailGoogle CalenderGoogle Talk (以上四個整合起來成為 Google App ,而他可以使用別的 domain name,交大 g2 信箱即為一例)。
例如:


Platform


以 Platform 作為一種服務 (e.g. Platform as a Service)。

Service 的提供者 (網站的所有人) 所規定的 Framework,Application 必須依照 Platform 的規定來建立。

例如:


Storage


以資料儲存作為一種服務。 (Storage as a Service)

例如:


Infrastructure


以基礎資源(CPU、Memory)作為一種服務,通常是指虛擬化平台的環境 (Infrastructure as a Service)。
例如買一台超級電腦,上面跑很多虛擬機器,每一台虛擬機器租給別人賺錢。而 CPU(幾核心)、記憶體(多大)的資源都可以依照需求設定。

例如:
==========

相信經過這樣的介紹,相信對雲端計算有了基礎的了解了。其最根本的原則就是「所有東西都可以是服務 (Everything is Service)」,而任何服務都能透過網際網路來取得

CPU 可以是服務、記憶體可以是服務、儲存也可以是服務、軟體可以是服務、功能也可以是服務,而且這些服務都存在那片深不可測的網際網路之雲裡面。

這一切將會是個趨勢,把電腦科技的所有部份封裝、然後當作商品。這只是電腦演進的必經的路而已,就像是公司會把部份外包,而外包的公司因為集中管理而有降低成本的效果。

這樣看起來,在未來,寫程式不用自己控制主機了 (其實現在就不用自己控制主機),寫軟體也會跟現在大不相同。去外面租一台虛擬主機,然後進行需要的運算;或甚至不用租主機,直接把寫好的 Web Service 放到 Platform 中,然後再叫別人去執行。未來的電腦會越來越輕便、打開瀏覽器就能擁有全世界...

Ajax 作業心得筆記

這學期上了一門 Web 2.0 的課,這個禮拜寫了兩份作業,收穫頗多。
  • 第一份是助教寫了個網頁,但是 CSS 的部份請同學自己 layout 出來。助教有把作好的樣子存成圖檔,然後要做成圖檔的樣子。
  • 第二份是把第一份作業加入 ajax 的部份,讓留言版可以使用。使用者可以選擇顯示圖片,但是圖片選好以後要可以立刻預覽。所有動作都不能換頁。
此外還有一個要求,就是在 Firefox 3.0.7 和 IE 7 看起來要一樣,以及不能使用 table layout。

自從大學以後我就沒再特別深入 Web 程式設計,我前些日子做的網頁還是用 table 去排版,我真是石器時代的人呀。至於 javascript ,雖然以前有玩過,但也沒有玩的很精通,更不用說 ajax 了。總之對於 Web 2.0 AJAX 技術方面,我還是個新手。

幸好有 Google。(古人沒 google 到底是怎麼寫程式的? 個個神人呀!!!!!)

CSS 最麻煩的地方就是圖層的控制,如果把 position 設為 relative 和 absolute 就會往上提升一個圖層,然後位置會參考父層有設定 position 為 relative 和 absolute 的圖層,如果都沒有就會參考 body 層。此外 clear:both 可以清除 position 和 float 的設定。(感謝學弟)

AJAX 最麻煩的地方就是圖片預覽的部份。在 Input File 上,IE 可以取得檔案的完整路徑,Firefox 基於安全理由只給檔名,所以若要在兩種瀏覽器上都可以使用勢必要將圖片上傳到伺服器端然後回傳圖片網址。在 submit 的時候如果不指定 target 的話,原本的網頁一定會 refresh,於是就用 iframe 作為 target ,然後設定 Timer 過一點小時間去讀資料更新畫面 (這邊還沒想到更好的辦法)。

在寫 AJAX 得時候,為了得到更好的結果,javascript 一直改進一直增加一直變肥,簡直是 javascript 加很大~~加不用錢~~~~。現在的網頁這麼炫麗特效這麼多,javascript 的量肯定更恐怖,難怪我的 u100 Netbook 開網頁越來越慢,有的時候簡直像是當機一動也不動, Firefox 本身又吃資源,然後就要等個 30 秒讓 CPU 慢慢跑......(翻桌)

此外我更佩服 GMail 的附加檔案了,還有上傳進度條,配合這麼完美到底怎麼做的...慢慢刻我大概要刻到老死吧.....

要 寫留言板勢必要用到資料庫,趁這個時候摸了一下聽聞很久的 SQLite,在 Debian lenny 上只要裝 php5-sqlite 套件就好了。SQLite 版本號是 2.8.x ,所以不支援 BLOG 格式(?),因為天天趕作業趕論文都早上四五點睡,肝爆很大~~爆不用錢~~~~為了避免意外,我把圖片利用 php 的 base64_encode() 把圖片編成 base64 MIMEtype 文字再存進資料庫(前面再加上 MIME type + "\n"),等需要圖片的時候再 decode dump 回去即可。

然後這次文字編輯器有用過 Dreamwaver + sftp,不錯用,只是每次開啟它都會忘記密碼很健忘。然後趁這個機會又學了一下 VIM (原本我是用 joe)。
  • :sp [filename] 橫切螢幕
  • :vs [filename] 直切螢幕
  • :shell 回到 shell 下做事
  • Ctrl-W w 在切割的視窗中循環切換
  • Ctrl-W hjkl 在切割的視窗中切換
  • Ctrl-W q 關閉該視窗
最後唯一沒有玩的就是 jQuery ,因為我想完整的把 AJAX 中 javascript 的部份好好走過一遍,不想套用其他 library,所以這次沒機會啦!下次有機會再玩:p

哇...沒想到兩個作業作了這麼多事情,學這麼多東西真好。