Unicode 格式控制字符
2018-06-16 14:14 更新
Unicode 格式控制字符(即,Unicode 字符数据库中“Cf”分类里的字符,如“左至右符号 (left-to-right mark)”或“右至左符号 (left-to-right mark)”)是用来控制被更高层级协议(如标记语言)忽略的文本范围的格式的控制代码。
允许在源文本中出现控制字符是有用的,以方便编辑和显示。所有格式控制字符可写入到注释,字符串字面量,正则表达式字面量中。
在某些语言中和控制字符用于创建必要的的分隔符分割词或短语。在 ECMAScript 源文本里,和还可以用在一个标识符后的第一个字符。
控制字符主要出现的文本的开头,标记它是 Unicode,并允许检测文本的编码和字节顺序。用于这一目的字符,有时也可能出现在文本开始的后面,例如,一个合并的文件。字符被视为空白字符(见 [7.2])。
表 1 总结了一些在注释,字符串字面量,正则表达式字面量之外被特殊对待的格式控制字符。
表-——控制字符的使用
字符编码值 | 名称 | 正式名称 | 用途 |
---|---|---|---|
\u200C | 零宽非连接符 | <ZWNJ> | IdentifierPart |
\u200D | 零宽连接符 | <ZWJ> | IdentifierPart |
\uFEFF | 位序掩码 | <BOM> | Whitespace |
以上内容是否对您有帮助:
← 词法
更多建议: