什么是元数据?

已发表: 2022-07-21
放大镜下的元数据。
伊米利安/Shutterstock.com

即使您从未听说过元数据这个术语,您也一定很熟悉它——您可能每天都在使用它,甚至都没有意识到它。 元数据是设法隐藏在众目睽睽之下的重要事物之一。

什么是元数据?

元数据听起来像是一个令人生畏的术语,但事实并非如此——元数据只是描述其他数据的数据。

在许多方面,元数据很像驾照或您熟悉的其他类型的 ID。 官方身份证通常会包含您的出生日期、身高、眼睛颜色、照片和其他关于您的信息。 元数据对计算机上的数字文件起到了类似的作用。 元数据通常会描述文件或文件夹的创建时间、上次修改时间以及有关它的其他重要属性。

相关:如何在 Windows 中轻松查看最近修改的文件

不同类型的文件通常会有不同的元数据。 以下是您可能会发现附加到常见文件的元数据的一些具体示例。

元数据示例

存储为元数据的信息因文件类型而异。 正如您可能想象的那样,图片或图像需要不同于文本文档的元数据。

照片和视频

假设您一直在使用手机的 GPS 来指导您进行远足旅行。 在旅途中,你拿出手机拍了一张动物、奇怪的真菌或风景的照片。 一拍照片,就会附上一些信息:相机设置,包括曝光长度、ISO、F-stop、相机的制造商、拍摄图像的时间,以及可能的 GPS 坐标拍摄图像时的相机。

保存该数据后,可以使用它对图像进行排序和分类。 手机上的照片库应用就是一个很好的例子——你可以按日期对图像进行排序,如果你启用了地理标记,甚至可以按位置排序。 现代照片库应用程序甚至可能附加描述图像内容的附加数据,例如“食物”、“宠物”或特定人的姓名。 这就是使您能够根据内容在手机上搜索图像的原因。 以下是在手机启用 GPS 的情况下拍摄的照片示例:

一座城市的高楼。
尼克·刘易斯

您可以在手机或 PC 上直接查看图像的元数据。

相关:如何在 Windows 和 macOS 中查看图像的 EXIF 数据

您可能会在手机拍摄的照片中找到一些元数据。

附加到图像的 GPS 元数据的准确度仅与手机中的 GPS 一样准确,但在大多数情况下,准确度在几米以内。

有时图像中嵌入了位置元数据。

视频文件将有很多相同的信息,然后还有一些与视频相关的帧速率和音频相关的额外信息。

声音的

音频元数据将包括通常的内容,例如文件的创建时间,但它也保存特定于音频文件的信息。 音频文件的元数据通常包含有关艺术家、专辑、曲目编号和名称的信息,以及有关音频本身的信息,例如比特率、比特深度和采样率。

留言

您发送给其他人的消息也有关联的元数据。 附加到消息的元数据的典型示例是发送时间、收件人以及有关消息可能包含的任何附件的信息。 一些消息传递应用程序也可能在其消息中嵌入额外的元数据,例如接收时间和表情符号反应。

文件扩展名

一种特别重要的元数据是文件扩展名。 文件扩展名是 PNG、TXT、DOCX、JPG、MP3 等。 文件扩展名让 Windows 知道需要什么样的数据以及如何打开文件。 没有它,Windows 将无法自动知道如何打开它,您必须手动告诉它使用特定程序打开文件。

相关:什么是文件扩展名?

注意:并非所有操作系统都使用文件扩展名来存储文件格式元数据。

其他计算机文件

大多数文件都有特定于文件类型的元数据,但是,某些元数据基本上是通用的。 如果您检查 PC 上几乎所有文件的属性(无论文件类型如何),您都会看到有关文件存储位置、创建时间、访问时间、修改时间和时间的信息创建的。 以下是 Windows 10 的示例:

显示有关文件的一些元数据的 Windows 10 属性窗口。

个人如何使用元数据?

如果您使用任何类型的现代计算机(包括手机),您就会经常使用元数据。 元数据允许您根据类型对文件进行排序。 它允许您按“创建日期”、“修改日期”或“访问日期”对文件进行排序。 大多数现代媒体播放器允许您按比特率列出您的音乐或根据分辨率将您的电影库分类。 网站通常包含“元标签”,这是一种在网站标题中发现的特定类型的元数据,用于向搜索引擎描述网页的内容。

每当您对文件、文件夹或网站进行分类时,您都依赖于元数据。

元数据还有什么用途?

个人以特定方式使用元数据,但大局呢? 您在计算机上所做的每一件事都会生成数据和元数据。 考虑到今天有数百亿台计算机在使用,其中包括大约 6 到 70 亿台智能手机——我们每天都在共同创建数量庞大的元数据。

将广告和内容定位到特定人群

这些信息不只是被丢弃。 其中很大一部分被输入复杂的算法和机器学习模型进行分析。 然后会发生什么实际上取决于谁收集了元数据以及他们想了解什么——它可以用来分析从个人行为到社会最大模式和趋势的一切。

最直接的用例是有针对性的广告和个性化内容建议。 是否曾经发现您的社交媒体提要中充斥着与您在手机上查找的内容相关的广告? 您是否在 YouTube 上单击了一些不寻常的内容,却发现您的建议发生了变化,以包含更多结果,例如您刚刚单击的内容? 这就是工作中的算法,处理与您相关的数据和元数据,以显示它“认为”最有可能吸引您的眼球并让您点击的结果。

使用元数据来增加用户参与度会产生一些不良后果。 最值得注意的是,它倾向于偏爱情绪极端的内容:它要么让你感觉非常好,要么让你感觉非常糟糕——这两种情况通常比实事求是的内容更刺激。 这是让在社交媒体上无意识地滚动如此令人难以置信的上瘾的重要部分。

什么是末日卷轴?
相关什么是末日滚动?

它有时也会导致人们发现非常具有侵入性的广告——当你感觉不舒服时,没有什么比查看 WebMD 更能发现你的 Facebook 时间轴上装满了药物的广告,这些药物治疗了一系列可以解释你症状的疾病。

注意: Facebook 已承诺限制一些与医疗相关的广告等,并且之前对药品广告增加了额外的限制。 我们将看到这些变化在未来如何发挥作用。

当然,即使社交媒体政策发生变化并且这些事情不再出现在您的社交媒体供稿上,但这并不能否定信息就在那里并且通常提供给最高出价者的事实。 从历史上看,您的大部分敏感数据都受到法律保护——例如,在美国,HIPAA 保护您的医疗信息不被传输或使用,除非在非常特殊的条件下。 但是,在大多数司法管辖区,从您的元数据中收集的信息很少有这样的保护措施,尽管这种情况正在发生变化。

相关:什么是 GDPR 隐私法以及您为什么要关心?

收集元数据用于监控

除了广告和定位内容之外,元数据还有很多用途。 其中最具争议的是监视。 爱德华·斯诺登(Edward Snowden)提供证据表明美国国家安全局每天从数亿条短信中收集元数据时引发了巨大争议。

警察可以使用黄貂鱼塔做类似的事情,尽管规模要小得多。 黄貂鱼塔模仿真实的手机塔,以便附近的蜂窝流量通过它们进行路由。 在这种情况下,捕获的数据类型可能会有所不同——任何未加密传输的数据都可能是完全可读的,而如果通信被加密,则只会暴露一些元数据。

注意:一些消息传递应用程序(如 Signal)竭尽全力将未加密的元数据量降至最低,并且他们表示它们也不存储元数据。

即使没有消息的实际内容,元数据中也有足够的信息来确定您与谁联系、何时与他们交谈,甚至可能收集您的动作。

元数据是隐私问题吗?

大多数数字文件都会有一些与之相关的元数据——有时文件本身包含元数据,有时,元数据由操作系统单独存储。 大多数上传到互联网的视频和图像现在都会自动删除其元数据——所有主要社交媒体网站和大多数图像托管平台都会删除元数据,大多数现代聊天应用程序也是如此,包括 Slack、Discord、WhatsApp、Facebook Messenger、Signal、和电报。

警告:将照片上传到云存储服务不会删除元数据,因此请小心以这种方式共享照片。 通过电子邮件发送图像也不会删除元数据。

相关:如何防止 Android 使用您的位置对照片进行地理标记

更重要的是,您所做的一切都会生成元数据。 每当您通过蜂窝网络或互联网传输或接收数据时,都会创建元数据。 这些数据由政府和私营公司收集,可用于分析个人或团体的行为。

考虑到元数据的普遍性——以及它的揭示性——这无疑是一个隐私问题。

大多数智能设备都会收集使用信息,而物联网 (IoT) 只会扩大收集的数据量和元数据。 您的元数据通常与您的数据一样具有启发性。 采取措施保护您的隐私,并在将信息上传到互联网时谨慎行事。

相关:电视制造商从广告中获得的收益多于销售电视