MIME 的学习

MIME

multipurpose Internet mail extensions 的缩写。它是一种协议,可使电子邮件除包含一般纯文本以外,还可加上彩色图片、视频、声音或二进位格式的文件。它要求邮件的发送端和接收端必须有解读MIME 协议的电子邮件程序。

多用途互联网邮件扩展(MIME,Multipurpose Internet Mail Extensions)是一个互联网标准,它扩展了电子邮件标准,使其能够支持非ASCII字符、二进制格式附件等多种格式的邮件消息。这个标准被定义 在;RFC 2045,; RFC 2046,; RFC 2047,; RFC 2048,; RFC 2049等RFC中。 由RFC 822转变而来的RFC 2822,规定电子邮件标准并不允许在邮件消息中使用7位ASCII字符集以外的字符。正因如此,一些非英语字符消息和二进制文件,图像,声音等非文字消 息都不能在电子邮件中传输。MIME规定了用于表示各种各样的数据类型的符号。

Headers

MIME是通过标准化电子邮件报文的头部的附加领域(fields)而实现的;这些头部的附加领域,描述新的报文类型的内容和组织形式。

MIME版本

MIME版本(MIME-Version),这个头部领域在邮件消息的报文用一个版本号码来指明消息遵从的MIME规范的版本。目前版本是1.0。

MIME-Version: 1.0

内容类型

内容类型(Content-Type),这个头部领域用于指定消息的类型。一般以下面的形式出现。

Content-Type: [type]/[subtype]; parameter

type有下面的形式。

每个MIME类型由两部分组成,前面是数据的大类别,例如声音audio、图象image等,后面定义具体的种类。
  常见的MIME类型
  超文本标记语言文本 .html,.html text/html 
  普通文本 .txt text/plain 
  RTF文本 .rtf application/rtf 
  GIF图形 .gif image/gif 
  JPEG图形 .jpeg,.jpg image/jpeg 
  au声音文件 .au audio/basic 
  MIDI音乐文件 mid,.midi audio/midi,audio/x-midi 
  RealAudio音乐文件 .ra, .ram audio/x-pn-realaudio 
  MPEG文件 .mpg,.mpeg video/mpeg 
  AVI文件 .avi video/x-msvideo 
  GZIP文件 .gz application/x-gzip 
  TAR文件 .tar application/x-tar 
   Internet中有一个专门组织IANA来确认标准的MIME类型,但Internet发展的太快,很多应用程序等不及IANA来确认他们使用的 MIME类型为标准类型。因此他们使用在类别中以x-开头的方法标识这个类别还没有成为标准,例如:x-gzip,x-tar等。事实上这些类型运用的很 广泛,已经成为了事实标准。只要客户机和服务器共同承认这个MIME类型,即使它是不标准的类型也没有关系,客户程序就能根据MIME类型,采用具体的处 理手段来处理数据。而Web服务器和浏览器(包括操作系统)中,缺省都设置了标准的和常见的MIME类型,只有对于不常见的 MIME类型,才需要同时设 置服务器和客户浏览器,以进行识别。
  由于MIME类型与文档的后缀相关,因此服务器使用文档的后缀来区分不同文件的MIME类型,服务器中必 须定义文档后缀和MIME类型之间的对应关系。而客户程序从服务器上接收数据的时候,它只是从服务器接受数据流,并不了解文档的名字,因此服务器必须使用 附加信息来告诉客户程序数据的MIME类型。服务器在发送真正的数据之前,就要先发送标志数据的MIME类型的信息,这个信息使用Content- type关键字进行定义,例如对于HTML文档,服务器将首先发送以下两行MIME标识信息,这个标识并不是真正的数据文件的一部分。
  Content-type: text/html
  注意,第二行为一个空行,这是必须的,使用这个空行的目的是将MIME信息与真正的数据内容分隔开。
   MIME利用了一个事实就是,RFC 822在消息体的内容中做了一点限制:唯一的限制就是只能使用简单的ASCII文本。所以,MIME信息由正常的 Internet文本邮件组成,文本邮件拥有一些特别的符合RFC 822的信息头和格式化过的信息体(用ASCII 的子集来表示的附件)。这些 MIME头给出了一种在邮件中表示附件的特别的方法。 
  MIME信息的剖析 
  一个普通的文本邮件的信息包含一个头部分 (To: From: Subject: 等等)和一个体部分(Hello Mr.,等等)。在一个符合MIME的信息中,也包含一个信息头并不奇怪,邮 件的各个部分叫做MIME段,每段前也缀以一个特别的头。MIME邮件只是基于RFC 822邮件的一个扩展。然而它有着自己的RFC规范集。 
  头字段 
  MIME头根据在邮件包中的位置,大体上分为MIME信息头和MIME段头。(译者:MIME信息头指整个邮件的头,而MIME段头只每个MIME段的头。) 
  MIME信息头有: 
  MIME-Version: 
  这个头提供了所用MIME的版本号。这个值习惯上为1.0。 
  Content-Type: 
  它定义了数据的类型,以便数据能被适当的处理。有效的类型有:text, 
   image,audio,video, applications,multipart和message。注意任何一个二进制附件都应该被叫做 application/octet- stream。这个头的一些用例为:image/jpg, application /mswork,multipart/mixed,这只是很少的一部分。 
  Content-Transfer-Encoding: 
  这是所有头中最重要的一个,因为它说明了对数据所执行的编码方式,客 
  户/MUA 将用它对附件进行解码。对于每个附件,可以使用7bit,8bit, 
   binary ,quoted-printable,base64和custom中的一种编码方式。7bit编码是用在US ASCII字符集上的常用 的一种编码方式,也就是,保持它的原样。8bit和binary编码一般不用。对人类可读的标准文本,如果传输要经过对格式有影响的网关时对其进行保护, 可以使用quoted printable 。Base64是一种通用方法,在需要决定使用哪一种编码方法时,它提供了一个不用费脑子的选择;它通常用在 二进制,非文本数据上。注意,任何非7bit 数据必须用一种模式编码,这样它就可以通过Internet邮件网关! 
  Content-ID: 
  如果Content-Type是message/external-body或multipart/alternative时,这个 
  头就有用了。它超出了本文的范围。 
  Content-Description: 
  这是一个可选的头。它是任何信息段内容的自由文本描述。描述必须使用us-ascii码。 
  Content-Disposition: 
  一个试验性的头,它用于给客户程序/MUA提供提示,来决定是否在行内显示附件或作为单独的附件。 
   MIME段头(出现在实际的MIME附件部分的头),除了MIME-Version头,可以拥有以上任何头字段。如果一个MIME头是信息块的一部分, 它将作用于整个信息体。例如,如果Content-Transfer-Encoding显示在信息(指整个信息)头中,它应用于整个信息体,但是如果它显 示在一个MIME段里,它"只能"用于那个段中. 
  注意:其可以对自动对收到的邮件进行解密

内容传输编码

内容传输编码(Content-Transfer-Encoding),这个区域使指定ASCII以外的字符编码方式成为可能。形式如下:Content-Transfer-Encoding: [mechanism]

其中,mechanism的值可以指定为“7bit”,“8bit”,“binary”,“quoted-printable”,“base64”。

7bit

7bit这里指的是7字节的ASCII编码方式。

8bit

8字节ASCII码。

binary

quoted-printable

因 为欧洲的一些文字和ASCII字符集中的某些字符有部分相同。如果邮件消息使用的是这些语言的话,于ASCII重叠的那些字符可以原样使用,ASCII字 符集中不存在的字符采用形如“=??”的方法编码。这里“??”需要用将字符编码后的16进制数字来指定。采用quoted-printable编码的消 息,长度不会变得太长,而且大部分都是ASCII中的字符,即使不通过解码也大致可以读懂消息的内容。

base64

base64是一种将二进制的01序列转化成ASCII字符的编码方法。编码后的文本或者二进制消息,就可以运用SMTP等只支持ASCII字符的协议传送了。Base64一般被认为会平均增加33%的报文长度,而且,经过编码的消息对于人类来说是不可读的。

x-encodingname

这个值是预留的扩展。

猜你喜欢

转载自crazywen2011.iteye.com/blog/1791620