既然有文件后缀名,为何还需要MIME类型?

date
Apr 17, 2018
slug
1694931985
status
Published
tags
文章
计算机科学
type
Post

作者:Vincross
链接:https://www.zhihu.com/question/60495696/answer/204530120
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

下面是正经的科普时间。
文件扩展名是什么?
操作系统用来标注文件格式的一种机制,用一个点号(.)和主文件名分隔开。由于历史原因,多数扩展名是三个字母。
注意,这里说的是标注,而非定义,既然是标注,说明不是强制的。
比如你用photoshop可以打开一个psd图像文件。把这个文件扩展名改为txt,再拖到photoshop窗口里,还是一样能打开,说明内容完全没有变化,变化的只是双击时的默认打开方式。
而MIME又是什么?
它全名叫多用途互联网邮件扩展(Multipurpose Internet Mail Extensions),最初是为了将纯文本格式的电子邮件扩展到可以支持多种信息格式而定制的。后来被应用到多种协议里,包括我们常用的HTTP协议
MIME的常见形式是一个主类型加一个子类型,用斜线分隔。比如text/html、application/javascript、image/png等。
在访问网页时,MIME type帮助浏览器识别一个HTTP请求返回的是什么内容的数据,应该如何打开、如何显示。
看到了吧,两者有共同的用途:用来标注信息的格式。
但应用场景完全不同:一个是操作系统中标注文件的,一个是邮件和HTTP协议中用来标注网络数据的。
但为什么两者会发生混淆,以至于有人把错误的结论写进了百度百科呢?
这就是历史原因了。
当Web服务刚诞生时,所有的网页其实就是静态页面的展示,没有互动、没有动态内容,只能靠超链接跳来跳去。而这些页面、样式、图片保存在哪呢?最简单的方式就是把url地址直接映射到本地文件。
比如http://www.xxx.com/images/logo.jpg,实际就对应着服务器上的一个/xxxxxx/images/logo.jpg文件。在有人访问它时,返回的MIME type是image/jpeg。
所以会造成一种误解:一个网址就是一个文件,它们的扩展名和MIME type是一一对应的。
实际上呢?当然不是这样,那只是在最简情况下的一种特殊做法。实际上,随着Web技术的发展,通过服务器端动态脚本和各种开发语言,网址和本地文件的关系已经不再紧密。
一张图片的网址所返回的MIME type是固定的(比如image/jpeg),但它的本体对应的可能是服务器上的一个文件,也可能是缓存中的一段数据,还可能是数据库中的一个字段,甚至是程序代码动态生成的图像。
尤其是RESTful等风格的url流行开后,网址中的文件扩展名部分也不见了。主流的url都变成了http://www.xxx.com/users/zhangsan/followers/page/20/这种形式。早已看不到任何文件名的踪影,与本地文件彻底脱钩,没有任何关系了。
现在你知道文件扩展名和MIME type是作用相似,但应用场合完全不同的两种东西了吧。仅仅因为一些历史原因,让两者在某些情况下的外观有些重合,才导致了这些误解。
而这种错误的理解被人传来传去,最后还有一个根本连话都说不通顺的版本被写进了百度百科。
所·以·说:
程序猿们,能不用百度就不要用百度,就算真的用了,也别信百度百科和百度知道里那些为了凑积分不知从哪Ctrl-C Ctrl-V来的东西!

© CXPLAY 2024