ISO-8859-1 是大多数浏览器默认的字符集。ISO-8859-1 的较低部分(从 1 到 127 之间的代码)是最初的 ASCII 字符集(0-9 的数字,大写和小写英文字母表,以及一些特殊字符)。ISO-8859-1 的较高部分(从 160 到 255 之间的代码)包含了一些西欧国家使用的字符和一些被广泛使用的特殊字符,它们全都有实体名称。这些符号中的大多数都可以在不进行实体引用的情况下使用,但是实体名称或实体编号为那些不容易通过键盘键入的符号提供了表达的方法。下面列出了世界各地使用的不同字符集:
ISO 字符集 | ||
---|---|---|
字符集 | 描述 | 适用范围 |
ISO-8859-1 | Latin alphabet part 1 | 北美、西欧、拉丁美洲、加勒比海、加拿大、非洲 |
ISO-8859-2 | Latin alphabet part 2 | 东欧 |
ISO-8859-3 | Latin alphabet part 3 | SE Europe、世界语、其他杂项 |
ISO-8859-4 | Latin alphabet part 4 | 斯堪的纳维亚/波罗的海(以及其他没有包括在 ISO-8859-1 中的部分) |
ISO-8859-5 | Latin/Cyrillic part 5 | 使用古代斯拉夫语字母表的语言,比如保加利亚语、白俄罗斯文、俄罗斯语、马其顿语 |
ISO-8859-6 | Latin/Arabic part 6 | 使用阿拉伯字母的语言 |
ISO-8859-7 | Latin/Greek part 7 | 现代希腊语,以及由希腊语衍生的数学符号 |
ISO-8859-8 | Latin/Hebrew part 8 | 使用希伯来语的语言 |
ISO-8859-9 | Latin 5 part 9 | 土耳其语。除了土耳其字符取代了冰岛文字,其它与 ISO-8859-1 相同 |
ISO-8859-10 | Latin 6 | 拉普兰语、日耳曼语、爱斯基摩北欧语 |
ISO-8859-15 | Latin 9 (aka Latin 0) | 与 ISO 8859-1 类似,欧元符号和其他一些字符取代了一些较少使用的符号 |
ISO-2022-JP | Latin/Japanese part 1 | 日本语 |
ISO-2022-JP-2 | Latin/Japanese part 2 | 日本语 |
ISO-2022-KR | Latin/Korean part 1 | 韩语 |
由于上面列出的字符集都有容量限制,而且不兼容多语言环境,Unicode 联盟开发了 Unicode 标准。Unicode 标准涵盖了世界上的所有字符、标点和符号。不论是何种平台、程序或语言,Unicode 都能够进行文本数据的处理、存储和交换。Unicode 标准已经获得了成功,在 XML、Java、ECMAScript (JavaScript)、LDAP、CORBA 3.0、WML 中,Unicode 已经得到了实现。在许多操作系统以及所有的现代浏览器中,Unicode 同样得到了支持。Unicode 联盟与领导性的标准发展组织进行合作,比如 ISO、W3C 以及 ECMA。Unicode 可以被不同的字符集兼容。最常用的编码方式是 UTF-8 和 UTF-16:
UTF-8 中的字符可以是 1-4 个字节长。UTF-8 可以表示 Unicode 标准中的任意字符。UTF-8 向后兼容 ASCII。UTF-8 是网页和电子邮件的首选编码。
UTF-16 16 比特的 Unicode 转换格式是一种 Unicode 可变字符编码,能够对全部 Unicode 指令表进行编码。UTF-16 主要被用于操作系统和环境中,比如微软的 Windows 2000/XP/2003/Vista/CE 以及 Java 和 .NET 字节代码环境。
关于ISO-8859-1 的较低部分(从 1 到 127 之间的代码)是最初的 ASCII 字符集,在另一篇文章中已经详细介绍了,这里不重复介绍。ISO-8859-1 的较高部分(从 160 到 255 之间的代码)包含了一些西欧国家使用的字符和一些被广泛使用的特殊字符,它们全都有实体名称。由于CSDN的编辑器自身支持 HTML 5 ,所以没有办法直接输出成原始标签。如果有哪位可以指导一下,万分感谢。请读者在使用过程中,在实体编号和实体名称前加上 “&” 字符,在后加上 “;” 字符。
ISO-8859-1 的较高部分 | |||
---|---|---|---|
字符 | 实体编号 | 实体名称 | 描述 |
#160 | nbsp | 非间断空格(non-breaking space) | |
¡ | #161 | iexcl | 倒置感叹号(inverted exclamation mark) |
¢ | #162 | cent | 美分符号(cent) |
£ | #163 | pound | 英镑符号(pound) |
¤ | #164 | curren | 货币符号(currency) |
¥ | #165 | yen | 人民币/日元符号(yen) |
¦ | #166 | brvbar | 间断的竖杠(broken vertical bar) |
§ | #167 | sect | 小节号(section) |
¨ | #168 | uml | 分音符号(spacing diaeresis) |
© | #169 | copy | 版权所有(copyright) |
ª | #170 | ordf | 阴性序数记号(feminine ordinal indicator) |
« | #171 | laquo | 左双角引号(angle quotation mark (left)) |
¬ | #172 | not | 否定符号(negation) |
| #173 | shy | 软连字符(soft hyphen) |
® | #174 | reg | 注册商标(registered trademark) |
¯ | #175 | macr | 长音符号(spacing macron) |
° | #176 | deg | 度符号(degree) |
± | #177 | plusmn | 加减号/正负号(plus-or-minus) |
² | #178 | sup2 | 上标 2(superscript 2) |
³ | #179 | sup3 | 上标 3(superscript 3) |
´ | #180 | acute | 尖音符号(spacing acute) |
µ | #181 | micro | 微米符号(micro) |
¶ | #182 | para | 段落符号(paragraph) |
· | #183 | middot | 中间点(middle dot) |
¸ | #184 | cedil | 变音符号(spacing cedilla) |
¹ | #185 | sup1 | 上标 1(superscript 1) |
º | #186 | ordm | 阳性序数记号(masculine ordinal indicator) |
» | #187 | raquo | 右双角引号(angle quotation mark (right)) |
¼ | #188 | frac14 | 1/4 分数(fraction 1/4) |
½ | #189 | frac12 | 1/2 分数(fraction 1/2) |
¾ | #190 | frac34 | 3/4 分数(fraction 3/4) |
¿ | #191 | iquest | 倒置问号(inverted question mark) |
À | #192 | Agrave | 大写字母 A,重音(grave accent) |
Á | #193 | Aacute | 大写字母 A,尖音(acute accent) |
 | #194 | Acirc | 大写字母 A,抑扬音(circumflex accent) |
à | #195 | Atilde | 大写字母 A,腭化(tilde) |
Ä | #196 | Auml | 大写字母 A,带有变音符号标记(umlaut mark) |
Å | #197 | Aring | 大写字母 A,带有上圆圈(ring) |
Æ | #198 | AElig | 大写字母 AE |
Ç | #199 | Ccedil | 大写字母 C,变音(cedilla) |
È | #200 | Egrave | 大写字母 E,重音(grave accent) |
É | #201 | Eacute | 大写字母 E,尖音(acute accent) |
Ê | #202 | Ecirc | 大写字母 E,抑扬音(circumflex accent) |
Ë | #203 | Euml | 大写字母 E,带有变音符号标记(umlaut mark) |
Ì | #204 | Igrave | 大写字母 I,重音(grave accent) |
Í | #205 | Iacute | 大写字母 I,尖音(acute accent) |
Î | #206 | Icirc | 大写字母 I,抑扬音(circumflex accent) |
Ï | #207 | Iuml | 大写字母 I,带有变音符号标记(umlaut mark) |
Ð | #208 | ETH | 冰岛语大写字母 eth |
Ñ | #209 | Ntilde | 大写字母 N,腭化(tilde) |
Ò | #210 | Ograve | 大写字母 O,重音(grave accent) |
Ó | #211 | Oacute | 大写字母 O,尖音(acute accent) |
Ô | #212 | Ocirc | 大写字母 O,抑扬音(circumflex accent) |
Õ | #213 | Otilde | 大写字母 O,腭化(tilde) |
Ö | #214 | Ouml | 大写字母 O,带有变音符号标记(umlaut mark) |
× | #215 | times | 乘号(multiplication) |
Ø | #216 | Oslash | 大写字母 O,带有斜线(slash) |
Ù | #217 | Ugrave | 大写字母 U,重音(grave accent) |
Ú | #218 | Uacute | 大写字母 U,尖音(acute accent) |
Û | #219 | Ucirc | 大写字母 U,抑扬音(circumflex accent) |
Ü | #220 | Uuml | 大写字母 U,带有变音符号标记(umlaut mark) |
Ý | #221 | Yacute | 大写字母 Y,尖音(acute accent) |
Þ | #222 | THORN | 冰岛语大写字母 THORN |
ß | #223 | szlig | 德语小写字母 sharp s |
à | #224 | agrave | 小写字母 a,重音(grave accent) |
á | #225 | aacute | 小写字母 a,尖音(acute accent) |
â | #226 | acirc | 小写字母 a,抑扬音(circumflex accent) |
ã | #227 | atilde | 小写字母 a,腭化(tilde) |
ä | #228 | auml | 小写字母 a,带有变音符号标记(umlaut mark) |
å | #229 | aring | 小写字母 a,带有上圆圈(ring) |
æ | #230 | aelig | 小写字母 ae |
ç | #231 | ccedil | 小写字母 c,变音(cedilla) |
è | #232 | egrave | 小写字母 e,重音(grave accent) |
é | #233 | eacute | 小写字母 e,尖音(acute accent) |
ê | #234 | ecirc | 小写字母 e,抑扬音(circumflex accent) |
ë | #235 | euml | 小写字母 e,带有变音符号标记(umlaut mark) |
ì | #236 | igrave | 小写字母 i,重音(grave accent) |
í | #237 | iacute | 小写字母 i,尖音(acute accent) |
î | #238 | icirc | 小写字母 i,抑扬音(circumflex accent) |
ï | #239 | iuml | 小写字母 i,带有变音符号标记(umlaut mark) |
ð | #240 | eth | 冰岛语小写字母 eth |
ñ | #241 | ntilde | 小写字母 n,腭化(tilde) |
ò | #242 | ograve | 小写字母 o,重音(grave accent) |
ó | #243 | oacute | 小写字母 o,尖音(acute accent) |
ô | #244 | ocirc | 小写字母 o,抑扬音(circumflex accent) |
õ | #245 | otilde | 小写字母 o,腭化(tilde) |
ö | #246 | ouml | 小写字母 o,带有变音符号标记(umlaut mark) |
÷ | #247 | divide | 除号(division) |
ø | #248 | oslash | 小写字母 o,带有斜线(slash) |
ù | #249 | ugrave | 小写字母 u,重音(grave accent) |
ú | #250 | uacute | 小写字母 u,尖音(acute accent) |
û | #251 | ucirc | 小写字母 u,抑扬音(circumflex accent) |
ü | #252 | uuml | 小写字母 u,带有变音符号标记(umlaut mark) |
ý | #253 | yacute | 小写字母 y,尖音(acute accent) |
þ | #254 | thorn | 冰岛语小写字母 thorn |
ÿ | #255 | yuml | 小写字母 y,带有变音符号标记(umlaut mark) |