HTML实体字符/ISO Latin-1字符集
一、概述
实体是一种在HTML中编写特殊字符或符号的机制,例如数学符号、大多数语言中的字符和许多其他符号。可以使用下表中显示的三种格式指定实体。
这些字符通常以 & 开头,以 ; 结尾。
| Format type | Format example | Symbol | Description |
|---|---|---|---|
| 实体名称 | © | © | HTML定义了常见的已知实体的名称。实体名称通常是符号的英文名称的缩写。 |
| 十进制数 | © | © | 每个HTML实体都有一个唯一的数字,可以指定为十进制值。 |
| 十六进制数 | © | © | 每个HTML实体都有一个唯一的十六进制数,它是与实体的十进制数相等的十六进制数。 |
二、空格字符
HTML提供了5种空格实体(space entity),它们拥有不同的宽度,非断行空格( )是常规空格的宽度,可运行于所有主流浏览器。其他几种空格(       ‌‍)在不同浏览器中宽度各异。
它叫不换行空格,全称No-Break Space,它是最常见和我们使用最多的空格,大多数的人可能只接触了 ,它是按下space键产生的空格。在HTML中,如果你用空格键产生此空格,空格是不会累加的(只算1个,例如:您在文本中写 10 个空格,在显示该页面之前,浏览器会删除它们中的 9 个)。要使用html实体表示才可累加,该空格占据宽度受字体影响明显而强烈。浏览器总是会截短 HTML 页面中的空格。
 
它叫“半角空格”,全称是En Space,en是字体排印学的计量单位,为em宽度的一半。根据定义,它等同于字体度的一半(如16px字体中就是8px)。名义上是小写字母n的宽度。此空格传承空格家族一贯的特性:透明的,此空格有个相当稳健的特性,就是其占据的宽度正好是1/2个中文宽度,而且基本上不受字体影响。
 
它叫“全角空格”,全称是Em Space,em是字体排印学的计量单位,相当于当前指定的点数。例如,1 em在16px的字体中就是16px。此空格也传承空格家族一贯的特性:透明的,此空格也有个相当稳健的特性,就是其占据的宽度正好是1个中文宽度,而且基本上不受字体影响。
 
它叫窄空格,全称是Thin Space。我们不妨称之为“瘦弱空格”,就是该空格长得比较瘦弱,身体单薄,占据的宽度比较小。它是em之六分之一宽。
‌
它叫零宽不连字,全称是Zero Width Non Joiner,简称“ZWNJ”,是一个不打印字符,放在电子文本的两个字符之间,抑制本来会发生的连字,而是以这两个字符原本的字形来绘制。Unicode中的零宽不连字字符映射为“”(zero width non-joiner,U+200C),HTML字符值引用为: ‌
‍
它叫零宽连字,全称是Zero Width Joiner,简称“ZWJ”,是一个不打印字符,放在某些需要复杂排版语言(如阿拉伯语、印地语)的两个字符之间,使得这两个本不会发生连字的字符产生了连字效果。零宽连字符的Unicode码位是U+200D (HTML: ‍ ‍)。
三、html中tab键的表示
HTML特殊字符不包括TAB(TAB应该可以用 	表示. 但只有在 <PRE>...</PRE>这样的标记内部才起作用,其他地方只相当于一个空格)。
如果想模拟表示,可以使用  这个。
HTML中      等6种空白空格的区别
HTML提供了5种空格实体(space entity),它们拥有不同的宽度,非断行空格( )是常规空格的宽度,可运行于所有主流浏览器。其他几种空格(       ‌‍)在不同浏览器中宽度各异。
它叫不换行空格,全称No-Break Space,它是最常见和我们使用最多的空格,大多数的人可能只接触了 ,它是按下space键产生的空格。在HTML中,如果你用空格键产生此空格,空格是不会累加的(只算1个)。要使用html实体表示才可累加,该空格占据宽度受字体影响明显而强烈。
 
它叫“半角空格”,全称是En Space,en是字体排印学的计量单位,为em宽度的一半。根据定义,它等同于字体度的一半(如16px字体中就是8px)。名义上是小写字母n的宽度。此空格传承空格家族一贯的特性:透明的,此空格有个相当稳健的特性,就是其占据的宽度正好是1/2个中文宽度,而且基本上不受字体影响。
 
它叫“全角空格”,全称是Em Space,em是字体排印学的计量单位,相当于当前指定的点数。例如,1 em在16px的字体中就是16px。此空格也传承空格家族一贯的特性:透明的,此空格也有个相当稳健的特性,就是其占据的宽度正好是1个中文宽度,而且基本上不受字体影响。
 
它叫窄空格,全称是Thin Space。我们不妨称之为“瘦弱空格”,就是该空格长得比较瘦弱,身体单薄,占据的宽度比较小。它是em之六分之一宽。
‌
它叫零宽不连字,全称是Zero Width Non Joiner,简称“ZWNJ”,是一个不打印字符,放在电子文本的两个字符之间,抑制本来会发生的连字,而是以这两个字符原本的字形来绘制。Unicode中的零宽不连字字符映射为“”(zero width non-joiner,U+200C),HTML字符值引用为: ‌
‍
它叫零宽连字,全称是Zero Width Joiner,简称“ZWJ”,是一个不打印字符,放在某些需要复杂排版语言(如阿拉伯语、印地语)的两个字符之间,使得这两个本不会发生连字的字符产生了连字效果。零宽连字符的Unicode码位是U+200D (HTML: ‍ ‍)。
此外,浏览器还会把以下字符当作空白进行解析:空格( )、制表位(	)、换行(
)和回车(
)还有( )等等。
四、结合音标符
发音符号是加到字母上的一个"glyph(字形)"。一些变音符号, 如 尖音符 ( ̀) 和 抑音符 ( ́) 。变音符号可以出现字母的上面和下面,或者字母里面,或者两个字母间。
变音符号可以与字母、数字字符的组合来使用。
| 音标符 | 字符 | Construct | 输出结果 |
|---|---|---|---|
| ̀ | a | à | à |
| ́ | a | á | á |
| ̂ | a | â | â |
| ̃ | a | ã | ã |
| ̀ | O | Ò | Ò |
| ́ | O | Ó | Ó |
| ̂ | O | Ô | Ô |
| ̃ | O | Õ | Õ |
作者:前端王祖蓝
链接:https://juejin.cn/post/6904905859852156936
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
五、常用实体字符列表
| 字符 | 十进制字符编号 | 实体名字 | 说明 |
|---|---|---|---|
| --- | � | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- | 	 | --- | 制表符Horizontal tab |
| --- | | --- | 换行Line feed |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- | | --- | 回车Carriage Return |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
| --- |  | --- | 未使用Unused |
  | --- | Space | |
| ! | ! | --- | 惊叹号Exclamation mark |
| " | " | " | 双引号Quotation mark |
| # | # | --- | 数字标志Number sign |
| $ | $ | --- | 美元标志Dollar sign |
| % | % | --- | 百分号Percent sign |
| & | & | & | Ampersand |
| ' | ' | --- | 单引号Apostrophe |
| ( | ( | --- | 小括号左边部分Left parenthesis |
| ) | ) | --- | 小括号右边部分Right parenthesis |
| * | * | --- | 星号Asterisk |
| + | + | --- | 加号Plus sign |
| , | , | --- | 逗号Comma |
| - | - | --- | 连字号Hyphen |
| . | . | --- | 句号Period (fullstop) |
| / | / | --- | 斜杠Solidus (slash) |
| 0 | 0 | --- | 数字0 Digit 0 |
| 1 | 1 | --- | 数字1 Digit 1 |
| 2 | 2 | --- | 数字2 Digit 2 |
| 3 | 3 | --- | 数字3 Digit 3 |
| 4 | 4 | --- | 数字4 Digit 4 |
| 5 | 5 | --- | 数字5 Digit 5 |
| 6 | 6 | --- | 数字6 Digit 6 |
| 7 | 7 | --- | 数字7 Digit 7 |
| 8 | 8 | --- | 数字8 Digit 8 |
| 9 | 9 | --- | 数字9 Digit 9 |
| : | : | --- | 冒号Colon |
| ; | ; | --- | 分号Semicolon |
| < | < | < | 小于号Less than |
| = | = | --- | 等于符号Equals sign |
| > | > | > | 大于号Greater than |
| ? | ? | --- | 问号Question mark |
| @ | @ | --- | Commercial at |
| A | A | --- | 大写A Capital A |
| B | B | --- | 大写B Capital B |
| C | C | --- | 大写C Capital C |
| D | D | --- | 大写D Capital D |
| E | E | --- | 大写E Capital E |
| F | F | --- | 大写F Capital F |
| G | G | --- | 大写G Capital G |
| H | H | --- | 大写H Capital H |
| I | I | --- | 大写J Capital I |
| J | J | --- | 大写K Capital J |
| K | K | --- | 大写L Capital K |
| L | L | --- | 大写K Capital L |
| M | M | --- | 大写M Capital M |
| N | N | --- | 大写N Capital N |
| O | O | --- | 大写O Capital O |
| P | P | --- | 大写P Capital P |
| Q | Q | --- | 大写Q Capital Q |
| R | R | --- | 大写R Capital R |
| S | S | --- | 大写S Capital S |
| T | T | --- | 大写T Capital T |
| U | U | --- | 大写U Capital U |
| V | V | --- | 大写V Capital V |
| W | W | --- | 大写W Capital W |
| X | X | --- | 大写X Capital X |
| Y | Y | --- | 大写Y Capital Y |
| Z | Z | --- | 大写Z Capital Z |
| [ | [ | --- | 中括号左边部分Left square bracket |
| \ | \ | --- | 反斜杠Reverse solidus (backslash) |
| ] | ] | --- | 中括号右边部分Right square bracket |
| ^ | ^ | --- | Caret |
| _ | _ | --- | 下划线Horizontal bar (underscore) |
| ` | ` | --- | 尖重音符Acute accent |
| a | a | --- | 小写a Small a |
| b | b | --- | 小写b Small b |
| c | c | --- | 小写c Small c |
| d | d | --- | 小写d Small d |
| e | e | --- | 小写e Small e |
| f | f | --- | 小写f Small f |
| g | g | --- | 小写g Small g |
| h | h | --- | 小写h Small h |
| i | i | --- | 小写i Small i |
| j | j | --- | 小写j Small j |
| k | k | --- | 小写k Small k |
| l | l | --- | 小写l Small l |
| m | m | --- | 小写m Small m |
| n | n | --- | 小写n Small n |
| o | o | --- | 小写o Small o |
| p | p | --- | 小写p Small p |
| q | q | --- | 小写q Small q |
| r | r | --- | 小写r Small r |
| s | s | --- | 小写s Small s |
| t | t | --- | 小写t Small t |
| u | u | --- | 小写u Small u |
| v | v | --- | 小写v Small v |
| w | w | --- | 小写w Small w |
| x | x | --- | 小写x Small x |
| y | y | --- | 小写y Small y |
| z | z | --- | 小写z Small z |
| { | { | --- | 大括号左边部分Left curly brace |
| | | | | --- | 竖线Vertical bar |
| } | } | --- | 大括号右边部分Right curly brace |
| ~ | ~ | --- | Tilde |
| --- |  | --- | 未使用Unused |
  | | 不间断空格 Nonbreaking space | |
  |   | 半角空格 | |
  |   | 全角空格 | |
| ¡ | ¡ | ¡ | Inverted exclamation |
| ¢ | ¢ | ¢ | 货币分标志Cent sign |
| £ | £ | £ | 英镑标志Pound sterling |
| ¤ | ¤ | ¤ | 通用货币标志General currency sign |
| ¥ | ¥ | ¥ | 日元标志Yen sign |
| ¦ | ¦ | ¦ or &brkbar; | 断竖线Broken vertical bar |
| § | § | § | 分节号Section sign |
| ¨ | ¨ | ¨ or ¨ | 变音符号Umlaut |
| © | © | © | 版权标志Copyright |
| ª | ª | ª | Feminine ordinal |
| « | « | « | Left angle quote, guillemet left |
| ¬ | ¬ | ¬ | Not sign |
| | ­ | ­ | Soft hyphen |
| ® | ® | ® | 注册商标标志Registered trademark |
| ¯ | ¯ | ¯ or &hibar; | 长音符号Macron accent |
| ° | ° | ° | 度数标志Degree sign |
| ± | ± | ± | 加或减Plus or minus |
| ² | ² | ² | 上标2 Superscript two |
| ³ | ³ | ³ | 上标3 Superscript three |
| ´ | ´ | ´ | 尖重音符Acute accent |
| µ | µ | µ | Micro sign |
| ¶ | ¶ | ¶ | Paragraph sign |
| · | · | · | Middle dot |
| ¸ | ¸ | ¸ | Cedilla |
| ¹ | ¹ | ¹ | 上标1 Superscript one |
| º | º | º | Masculine ordinal |
| » | » | » | Right angle quote, guillemet right |
| ¼ | ¼ | ¼ | 四分之一Fraction one-fourth |
| ½ | ½ | ½ | 二分之一Fraction one-half |
| ¾ | ¾ | ¾ | 四分之三Fraction three-fourths |
| ¿ | ¿ | ¿ | Inverted question mark |
| À | À | À | Capital A, grave accent |
| Á | Á | Á | Capital A, acute accent |
| Â | Â | Â | Capital A, circumflex |
| Ã | Ã | Ã | Capital A, tilde |
| Ä | Ä | Ä | Capital A, di?esis / umlaut |
| Å | Å | Å | Capital A, ring |
| Æ | Æ | Æ | Capital AE ligature |
| Ç | Ç | Ç | Capital C, cedilla |
| È | È | È | Capital E, grave accent |
| É | É | É | Capital E, acute accent |
| Ê | Ê | Ê | Capital E, circumflex |
| Ë | Ë | Ë | Capital E, di?esis / umlaut |
| Ì | Ì | Ì | Capital I,grave accent |
| Í | Í | Í | Capital I,acute accent |
| Î | Î | Î | Capital I, circumflex |
| Ï | Ï | Ï | Capital I, di?esis / umlaut |
| Ð | Ð | Ð | Capital Eth, Icelandic |
| Ñ | Ñ | Ñ | Capital N, tilde |
| Ò | Ò | Ò | Capital O, grave accent |
| Ó | Ó | Ó | Capital O, acute accent |
| Ô | Ô | Ô | Capital O, circumflex |
| Õ | Õ | Õ | Capital O, tilde |
| Ö | Ö | Ö | Capital O, di?esis / umlaut |
| × | × | × | 乘号Multiply sign |
| Ø | Ø | Ø | Capital O, slash |
| Ù | Ù | Ù | Capital U, grave accent |
| Ú | Ú | Ú | Capital U, acute accent |
| Û | Û | Û | Capital U, circumflex |
| Ü | Ü | Ü | Capital U, di?esis / umlaut |
| Ý | Ý | Ý | Capital Y, acute accent |
| Þ | Þ | Þ | Capital Thorn, Icelandic |
| ß | ß | ß | Small sharp s, German sz |
| à | à | à | Small a, grave accent |
| á | á | á | Small a, acute accent |
| â | â | â | Small a, circumflex |
| ã | ã | ã | Small a, tilde |
| ä | ä | ä | Small a, di?esis / umlaut |
| å | å | å | Small a, ring |
| æ | æ | æ | Small ae ligature |
| ç | ç | ç | Small c, cedilla |
| è | è | è | Small e, grave accent |
| é | é | é | Small e, acute accent |
| ê | ê | ê | Small e, circumflex |
| ë | ë | ë | Small e, di?esis / umlaut |
| ì | ì | ì | Small i, grave accent |
| í | í | í | Small i, acute accent |
| î | î | î | Small i, circumflex |
| ï | ï | ï | Small i, di?esis / umlaut |
| ð | ð | ð | Small eth, Icelandic |
| ñ | ñ | ñ | Small n, tilde |
| ò | ò | ò | Small o, grave accent |
| ó | ó | ó | Small o, acute accent |
| ô | ô | ô | Small o, circumflex |
| õ | õ | õ | Small o, tilde |
| ö | ö | ö | Small o, di?esis / umlaut |
| ÷ | ÷ | ÷ | 除号Division sign |
| ø | ø | ø | Small o, slash |
| ù | ù | ù | Small u, grave accent |
| ú | ú | ú | Small u, acute accent |
| û | û | û | Small u, circumflex |
| ü | ü | ü | Small u, di?esis / umlaut |
| ý | ý | ý | Small y, acute accent |
| þ | þ | þ | Small thorn, Icelandic |
| ÿ | ÿ | ÿ | Small y, umlaut |
| Α | Α | Α | alpha |
| Β | Β | Β | beta |
| Γ | Γ | Γ | gamma |
| Δ | Δ | Δ | delta |
| Ε | Ε | Ε | epsilon |
| Ζ | Ζ | Ζ | zeta |
| Η | Η | Η | eta |
| Θ | Θ | Θ | theta |
| Ι | Ι | Ι | iota |
| Κ | Κ | Κ | kappa |
| Λ | Λ | Λ | lambda |
| Μ | Μ | Μ | mu |
| Ν | Ν | Ν | nu |
| Ξ | Ξ | Ξ | xi |
| Ο | Ο | Ο | omicron |
| Π | Π | Π | pi |
| Ρ | Ρ | Ρ | rho |
| Σ | Σ | Σ | sigma |
| Τ | Τ | Τ | tau |
| Υ | Υ | Υ | upsilon |
| Φ | Φ | Φ | phi |
| Χ | Χ | Χ | chi |
| Ψ | Ψ | Ψ | psi |
| Ω | Ω | Ω | omega |
| α | α | α | alpha |
| β | β | β | beta |
| γ | γ | γ | gamma |
| δ | δ | δ | delta |
| ε | ε | ε | epsilon |
| ζ | ζ | ζ | zeta |
| η | η | η | eta |
| θ | θ | θ | theta |
| ι | ι | ι | iota |
| κ | κ | κ | kappa |
| λ | λ | λ | lambda |
| μ | μ | μ | mu |
| ν | ν | ν | nu |
| ξ | ξ | ξ | xi |
| ο | ο | ο | omicron |
| π | π | π | pi |
| ρ | ρ | ρ | rho |
| ς | ς | ς | sigmaf |
| σ | σ | σ | sigma |
| τ | τ | τ | tau |
| υ | υ | υ | upsilon |
| φ | φ | φ | phi |
| χ | χ | χ | chi |
| ψ | ψ | ψ | psi |
| ω | ω | ω | omega |
| ϑ | ϑ | ϑ | thetasym |
| ϒ | ϒ | ϒ | upsih |
| ϖ | ϖ | ϖ | piv |
| • | • | • | bull |
| … | … | … | hellip |
| ′ | ′ | ′ | prime |
| ″ | ″ | ″ | Prime |
| ‾ | ‾ | ‾ | oline |
| ⁄ | ⁄ | ⁄ | frasl |
| ℘ | ℘ | ℘ | weierp |
| ℑ | ℑ | ℑ | image |
| ℜ | ℜ | ℜ | real |
| ™ | ™ | ™ | trade |
| ℵ | ℵ | ℵ | alefsym |
| ← | ← | ← | larr |
| ↑ | ↑ | ↑ | uarr |
| → | → | → | rarr |
| ↓ | ↓ | ↓ | darr |
| ↔ | ↔ | ↔ | harr |
| ↵ | ↵ | ↵ | crarr |
| ⇐ | ⇐ | ⇐ | lArr |
| ⇑ | ⇑ | ⇑ | uArr |
| ⇒ | ⇒ | ⇒ | rArr |
| ⇓ | ⇓ | ⇓ | dArr |
| ⇔ | ⇔ | ⇔ | hArr |
| ∀ | ∀ | ∀ | forall |
| ∂ | ∂ | ∂ | part |
| ∃ | ∃ | ∃ | exist |
| ∅ | ∅ | ∅ | empty |
| ∇ | ∇ | ∇ | nabla |
| ∈ | ∈ | ∈ | isin |
| ∉ | ∉ | ∉ | notin |
| ∋ | ∋ | ∋ | ni |
| ∏ | ∏ | ∏ | prod |
| ∑ | ∑ | ∑ | 求和 sum |
| − | − | − | 减号 minus |
| ∗ | ∗ | ∗ | lowast |
| √ | √ | √ | radic |
| ∝ | ∝ | ∝ | prop |
| ∞ | ∞ | ∞ | infin |
| ∠ | ∠ | ∠ | ang |
| ∧ | ∧ | ∧ | and |
| ∨ | ∨ | ∨ | or |
| ∩ | ∩ | ∩ | cap |
| ∪ | ∪ | ∪ | cup |
| ∫ | ∫ | ∫ | int |
| ∴ | ∴ | ∴ | there4 |
| ∼ | ∼ | ∼ | sim |
| ≅ | ≅ | ≅ | cong |
| ≈ | ≈ | ≈ | asymp |
| ≠ | ≠ | ≠ | ne |
| ≡ | ≡ | ≡ | equiv |
| ≤ | ≤ | ≤ | 小于等于 le |
| ≥ | ≥ | ≥ | 大于等于 ge |
| ⊂ | ⊂ | ⊂ | sub |
| ⊃ | ⊃ | ⊃ | sup |
| ⊄ | ⊄ | ⊄ | nsub |
| ⊆ | ⊆ | ⊆ | sube |
| ⊇ | ⊇ | ⊇ | supe |
| ⊕ | ⊕ | ⊕ | oplus |
| ⊗ | ⊗ | ⊗ | otimes |
| ⊥ | ⊥ | ⊥ | perp |
| ⋅ | ⋅ | ⋅ | sdot |
| ⌈ | ⌈ | ⌈ | lceil |
| ⌉ | ⌉ | ⌉ | rceil |
| ⌊ | ⌊ | ⌊ | lfloor |
| ⌋ | ⌋ | ⌋ | rfloor |
| ◊ | ◊ | ◊ | loz |
| ♠ | ♠ | ♠ | 桃 spades |
| ♣ | ♣ | ♣ | 梅花 clubs |
| ♥ | ♥ | ♥ | 心 hearts |
| ♦ | ♦ | ♦ | 方块 diams |
六、参考资料
- 十六进制字符表:https://html.spec.whatwg.org/multipage/named-characters.html
- HTML Entity List:https://www.freeformatter.com/html-entities.html#math-symbols
- HTML Currency Symbols, Currency Entities and ASCII Currency Character Code Reference: https://www.toptal.com/designers/htmlarrows/symbols/
- html-entities:https://symbl.cc/en/html-entities/
- XML 和 HTML 字符实体引用列表(维基百科):https://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references
- Character Entities for HTML, CSS and Javascript:https://oinam.github.io/entities/
- HTML实体字符:https://juejin.cn/post/6904905859852156936
