什麼是元數據?
已發表: 2022-07-21
即使您從未聽說過元數據這個術語,您也一定很熟悉它——您可能每天都在使用它,甚至都沒有意識到它。 元數據是設法隱藏在眾目睽睽之下的重要事物之一。
什麼是元數據?
元數據聽起來像是一個令人生畏的術語,但事實並非如此——元數據只是描述其他數據的數據。
在許多方面,元數據很像駕照或您熟悉的其他類型的 ID。 官方身份證通常會包含您的出生日期、身高、眼睛顏色、照片和其他關於您的信息。 元數據對計算機上的數字文件起到了類似的作用。 元數據通常會描述文件或文件夾的創建時間、上次修改時間以及有關它的其他重要屬性。
相關:如何在 Windows 中輕鬆查看最近修改的文件
不同類型的文件通常會有不同的元數據。 以下是您可能會發現附加到常見文件的元數據的一些具體示例。
元數據示例
存儲為元數據的信息因文件類型而異。 正如您可能想像的那樣,圖片或圖像需要不同於文本文檔的元數據。
照片和視頻
假設您一直在使用手機的 GPS 來指導您進行遠足旅行。 在旅途中,你拿出手機拍了一張動物、奇怪的真菌或風景的照片。 一拍照片,就會附上一些信息:相機設置,包括曝光長度、ISO、F-stop、相機的製造商、拍攝圖像的時間,以及可能的 GPS 坐標拍攝圖像時的相機。
保存該數據後,可以使用它對圖像進行排序和分類。 手機上的照片庫應用就是一個很好的例子——你可以按日期對圖像進行排序,如果你啟用了地理標記,甚至可以按位置排序。 現代照片庫應用程序甚至可能附加描述圖像內容的附加數據,例如“食物”、“寵物”或特定人的姓名。 這就是使您能夠根據內容在手機上搜索圖像的原因。 以下是在手機啟用 GPS 的情況下拍攝的照片示例:

您可以在手機或 PC 上直接查看圖像的元數據。
相關:如何在 Windows 和 macOS 中查看圖像的 EXIF 數據
附加到圖像的 GPS 元數據的準確度僅與手機中的 GPS 一樣準確,但在大多數情況下,準確度在幾米以內。
視頻文件將有很多相同的信息,然後還有一些與視頻相關的幀速率和音頻相關的額外信息。
聲音的
音頻元數據將包括通常的內容,例如文件的創建時間,但它也保存特定於音頻文件的信息。 音頻文件的元數據通常包含有關藝術家、專輯、曲目編號和名稱的信息,以及有關音頻本身的信息,例如比特率、比特深度和採樣率。
留言
您發送給其他人的消息也有關聯的元數據。 附加到消息的元數據的典型示例是發送時間、收件人以及有關消息可能包含的任何附件的信息。 一些消息傳遞應用程序也可能在其消息中嵌入額外的元數據,例如接收時間和表情符號反應。
文件擴展名
一種特別重要的元數據是文件擴展名。 文件擴展名是 PNG、TXT、DOCX、JPG、MP3 等。 文件擴展名讓 Windows 知道需要什麼樣的數據以及如何打開文件。 沒有它,Windows 將無法自動知道如何打開它,您必須手動告訴它使用特定程序打開文件。
相關:什麼是文件擴展名?
注意:並非所有操作系統都使用文件擴展名來存儲文件格式元數據。
其他計算機文件
大多數文件都有特定於文件類型的元數據,但是,某些元數據基本上是通用的。 如果您檢查 PC 上幾乎所有文件的屬性(無論文件類型如何),您都會看到有關文件存儲位置、創建時間、訪問時間、修改時間和時間的信息創建的。 以下是 Windows 10 的示例:

個人如何使用元數據?
如果您使用任何類型的現代計算機(包括手機),您就會經常使用元數據。 元數據允許您根據類型對文件進行排序。 它允許您按“創建日期”、“修改日期”或“訪問日期”對文件進行排序。 大多數現代媒體播放器允許您按比特率列出您的音樂或根據分辨率將您的電影庫分類。 網站通常包含“元標籤”,這是一種在網站標題中發現的特定類型的元數據,用於向搜索引擎描述網頁的內容。
每當您對文件、文件夾或網站進行分類時,您都依賴於元數據。
元數據還有什麼用途?
個人以特定方式使用元數據,但大局呢? 您在計算機上所做的每一件事都會生成數據和元數據。 考慮到今天有數百億台計算機在使用,其中包括大約 6 到 70 億台智能手機——我們每天都在共同創建數量龐大的元數據。
將廣告和內容定位到特定人群
這些信息不只是被丟棄。 其中很大一部分被輸入複雜的算法和機器學習模型進行分析。 然後會發生什麼實際上取決於誰收集了元數據以及他們想了解什麼——它可以用來分析從個人行為到社會最大模式和趨勢的一切。
最直接的用例是有針對性的廣告和個性化內容建議。 是否曾經發現您的社交媒體提要中充斥著與您在手機上查找的內容相關的廣告? 您是否在 YouTube 上單擊了一些不尋常的內容,卻發現您的建議發生了變化,以包含更多結果,例如您剛剛單擊的內容? 這就是工作中的算法,處理與您相關的數據和元數據,以顯示它“認為”最有可能吸引您的眼球並讓您點擊的結果。
使用元數據來增加用戶參與度會產生一些不良後果。 最值得注意的是,它傾向於偏愛情緒極端的內容:它要么讓你感覺非常好,要么讓你感覺非常糟糕——這兩種情況通常比實事求是的內容更刺激。 這是讓在社交媒體上無意識地滾動如此令人難以置信的上癮的重要部分。
它有時也會導致人們發現非常具有侵入性的廣告——當你感覺不舒服時,沒有什麼比查看 WebMD 更能發現你的 Facebook 時間軸上裝滿了藥物的廣告,這些藥物治療了一系列可以解釋你症狀的疾病。
注意: Facebook 已承諾限制一些與醫療相關的廣告等,並且之前對藥品廣告增加了額外的限制。 我們將看到這些變化在未來如何發揮作用。
當然,即使社交媒體政策發生變化並且這些事情不再出現在您的社交媒體供稿上,但這並不能否定信息就在那裡並且通常提供給最高出價者的事實。 從歷史上看,您的大部分敏感數據都受到法律保護——例如,在美國,HIPAA 保護您的醫療信息不被傳輸或使用,除非在非常特殊的條件下。 但是,在大多數司法管轄區,從您的元數據中收集的信息很少有這樣的保護措施,儘管這種情況正在發生變化。
相關:什麼是 GDPR 隱私法以及您為什麼要關心?
收集元數據用於監控
除了廣告和定位內容之外,元數據還有很多用途。 其中最具爭議的是監視。 愛德華·斯諾登(Edward Snowden)提供證據表明美國國家安全局每天從數億條短信中收集元數據時引發了巨大爭議。
警察可以使用黃貂魚塔做類似的事情,儘管規模要小得多。 黃貂魚塔模仿真實的手機塔,以便附近的蜂窩流量通過它們進行路由。 在這種情況下,捕獲的數據類型可能會有所不同——任何未加密傳輸的數據都可能是完全可讀的,而如果通信被加密,則只會暴露一些元數據。
注意:一些消息傳遞應用程序(如 Signal)竭盡全力將未加密的元數據量降至最低,並且他們表示它們也不存儲元數據。
即使沒有消息的實際內容,元數據中也有足夠的信息來確定您與誰聯繫、何時與他們交談,甚至可能收集您的動作。
元數據是隱私問題嗎?
大多數數字文件都會有一些與之相關的元數據——有時文件本身包含元數據,有時,元數據由操作系統單獨存儲。 大多數上傳到互聯網的視頻和圖像現在都會自動刪除其元數據——所有主要社交媒體網站和大多數圖像託管平台都會刪除元數據,大多數現代聊天應用程序也是如此,包括 Slack、Discord、WhatsApp、Facebook Messenger、Signal、和電報。
警告:將照片上傳到雲存儲服務不會刪除元數據,因此請小心以這種方式共享照片。 通過電子郵件發送圖像也不會刪除元數據。
相關:如何防止 Android 使用您的位置對照片進行地理標記
更重要的是,您所做的一切都會生成元數據。 每當您通過蜂窩網絡或互聯網傳輸或接收數據時,都會創建元數據。 這些數據由政府和私營公司收集,可用於分析個人或團體的行為。
考慮到元數據的普遍性——以及它的揭示性——這無疑是一個隱私問題。
大多數智能設備都會收集使用信息,而物聯網 (IoT) 只會擴大收集的數據量和元數據。 您的元數據通常與您的數據一樣具有啟發性。 採取措施保護您的隱私,並在將信息上傳到互聯網時謹慎行事。
相關:電視製造商從廣告中獲得的收益多於銷售電視