元數(shù)據(jù)
定義
元資料是指“描述資料的資料”。雖然說源自于希臘介詞和前綴 μετ?- 的英文前綴“meta”代表“之后”或“之下”的意思,在此處實(shí)際上是使用知識(shí)論中“關(guān)于”的意思。元資料被定義為提供某些資料單方面或多方面資訊的資料;它被用來概述資料的基礎(chǔ)資訊,以簡(jiǎn)化查找過程與方便使用 。例如:
創(chuàng)建資料的方法
資料的用途
建立的時(shí)間與日期
資料的建立者或作者
資料被建立在電腦網(wǎng)絡(luò)的何處
用作標(biāo)準(zhǔn)
檔案大小
舉例,一個(gè)數(shù)位影像檔案可能會(huì)包括描述圖片大小、色彩深度、圖片分辨率、圖片建立時(shí)間、快門速度等資料的元資料 。一份文檔的元資料可能會(huì)包含文檔長(zhǎng)度、作者、建立時(shí)間、文檔概述等資訊。網(wǎng)頁(yè)中的元資料也可以包含葉面內(nèi)容的描述,以及有關(guān)于內(nèi)容的關(guān)鍵字等等 。這些東西常被稱作“元標(biāo)簽”(Metatags),其在1990年代后期以前被用來當(dāng)作決定搜索引擎結(jié)果順序的主要因素 。在1990年代后期,由于“ 關(guān)鍵字堆砌 ( 英語(yǔ) : keyword stuffing ) ”的出現(xiàn),對(duì)于元標(biāo)簽的倚賴程度逐漸降低 。元標(biāo)簽的濫用導(dǎo)致許多搜索引擎會(huì)誤認(rèn)某些結(jié)果的關(guān)聯(lián)性高于實(shí)際值 。
元資料可以在被稱作元資料注冊(cè)系統(tǒng)或元資料儲(chǔ)存庫(kù)的數(shù)據(jù)庫(kù)中儲(chǔ)存和管理 。不過,如果沒有文字和參考點(diǎn)的話,單純看是很難辨認(rèn)這些元資料的 。舉例來說:一個(gè)數(shù)據(jù)庫(kù)本身會(huì)包含一些數(shù)字,但是這些數(shù)字代表的涵義可能是某些計(jì)算后的結(jié)果,或者是書籍的ISBN碼──這就需要參考才能知道,而無(wú)法直接由資料容器內(nèi)部得知。菲利普·巴格利在1968年在他的著作《 Extension of Programming Language Concepts 》中發(fā)明了“metadata”這個(gè)詞,當(dāng)時(shí)的意思為“描述資料容器的資料”,也就是結(jié)構(gòu)性元資料,而非描述性元資料或常用于圖書館目錄的元內(nèi)容(metacontent) 。自那時(shí)起,資訊管理、資訊科學(xué)、資訊技術(shù)、圖書館學(xué)與地理資訊系統(tǒng)等領(lǐng)域廣泛接受了這個(gè)詞匯。在這些領(lǐng)域中,元資料的定義為“描述資料的資料” 。盡管這是最廣為接受的定義,許多學(xué)科也為了自用而采用了特殊的解釋或定義。
類型
雖然元資料的應(yīng)用層面很廣,涵蓋各式各樣的領(lǐng)域,有專門和公認(rèn)的方法來決定元資料的類型。 弗朗西斯·布雷瑟頓 ( 英語(yǔ) : Francis Bretherton ) 和辛格利(1994)將元資料分成兩類:結(jié)構(gòu)性/控制性元資料和指南性元資料 。 結(jié)構(gòu)性元資料 描述了諸如表格、欄、金鑰和索引等數(shù)據(jù)庫(kù)物件的結(jié)構(gòu)。 指南性元資料 幫助人們找到特定的物品,而且經(jīng)常被壓縮為一系列自然語(yǔ)言中的關(guān)鍵字。根據(jù) 拉爾夫金博爾 ( 英語(yǔ) : Ralph Kimball ) ,元資料可以分成兩個(gè)相似的類別:技術(shù)性元資料和商業(yè)性元資料。 技術(shù)性元資料 等同內(nèi)部性元資料,而 商業(yè)性元資料 則為外部性元資料。金博爾加入了第三種類別, 過程性元資料 。另一方面,美國(guó)國(guó)家資訊標(biāo)準(zhǔn)組織將元資料分成三種:描述性、結(jié)構(gòu)性和管理性 。
描述性元資料 通常用于發(fā)現(xiàn)和識(shí)別,作為搜尋和定位物件的資訊,例如標(biāo)題、作者、科目、關(guān)鍵字、出版商等等。 結(jié)構(gòu)性元資料 描述物件的構(gòu)成物是如何組織起來的,舉例來說,書頁(yè)是如何組成一本書中的章節(jié)的這種資料,就是結(jié)構(gòu)性元資料。最后, 管理性元資料 給予有助于管理資源的資訊。管理性元資料參考技術(shù)資訊,包括檔案類型、檔案建立時(shí)間和檔案建立方式。管理性元資料之下還有兩個(gè)小分類,權(quán)限性元資料和保存性元資料。 權(quán)限性元資料 解釋了知識(shí)產(chǎn)權(quán),而 保存性元資料 則包含保存和儲(chǔ)存資源的資訊 。
內(nèi)容
主要是描述資料屬性(property)的資訊,用來支持如指示儲(chǔ)存位置、歷史資料、資源尋找、文件記錄等功能。元資料算是一種電子式目錄,為了達(dá)到編制目錄的目的,必須在描述并收藏資料的內(nèi)容或特色,進(jìn)而達(dá)成協(xié)助資料檢索的目的。
該名詞起源于1969年,由Jack E. Myers所提出的.metadata即關(guān)于資料的資料( data-about-data ),可以說是一種標(biāo)準(zhǔn),是為支援互通性的資料描述,所取得一致的準(zhǔn)則。其基本定義出自O(shè)CLC與NCSA所主辦的“Metadata Workshop”研討會(huì)。它將Metadata定義為“描述資料的資料”(Data about data)。此后各種有關(guān)Metadata的定義紛紛的出現(xiàn)?,F(xiàn)存很多metadata的定義,主要端視特定社群或使用情境而不同。如有有關(guān)資料的資料(data about data),有關(guān)資訊物件之結(jié)構(gòu)的資訊(structured information about an information object),描述資源屬性的資料(Data describes attributes of resources)等。
都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元資料的一種應(yīng)用,是1995年2月由國(guó)際圖書館電腦中心(OCLC)和美國(guó)國(guó)家超級(jí)計(jì)算應(yīng)用中心(National Center for Supercomputing Applications,NCSA)所聯(lián)合贊助的研討會(huì),在邀請(qǐng)52位來自圖書館員、電腦專家,共同制定規(guī)格,建立一套描述網(wǎng)絡(luò)上電子文件之特征。
參見
元數(shù)據(jù)注冊(cè)系統(tǒng)
數(shù)據(jù)字典(又名元數(shù)據(jù)儲(chǔ)存庫(kù))
都柏林核心
分眾分類法
標(biāo)簽 (元數(shù)據(jù))
元數(shù)據(jù)注冊(cè)系統(tǒng)
元數(shù)學(xué)
微格式
本體 (信息科學(xué))
語(yǔ)義網(wǎng)
SGML
XML Schema
免責(zé)聲明:以上內(nèi)容版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。感謝每一位辛勤著寫的作者,感謝每一位的分享。
- 有價(jià)值
- 一般般
- 沒價(jià)值
{{item.userName}} 舉報(bào)
{{item.time}} {{item.replyListShow ? '收起' : '展開'}}評(píng)論 {{curReplyId == item.id ? '取消回復(fù)' : '回復(fù)'}}
{{_reply.userName}} 舉報(bào)
{{_reply.time}}