阅读(5.5k) 书签赞(0) 我要纠错

Unicode 格式控制字符

2018-06-16 14:14 更新

Unicode 格式控制字符（即，Unicode 字符数据库中“Cf”分类里的字符，如“左至右符号 (left-to-right mark)”或“右至左符号 (left-to-right mark)”）是用来控制被更高层级协议（如标记语言）忽略的文本范围的格式的控制代码。

允许在源文本中出现控制字符是有用的，以方便编辑和显示。所有格式控制字符可写入到注释，字符串字面量，正则表达式字面量中。

在某些语言中和控制字符用于创建必要的的分隔符分割词或短语。在 ECMAScript 源文本里，和还可以用在一个标识符后的第一个字符。

控制字符主要出现的文本的开头，标记它是 Unicode，并允许检测文本的编码和字节顺序。用于这一目的字符，有时也可能出现在文本开始的后面，例如，一个合并的文件。字符被视为空白字符（见 [7.2]）。

表 1 总结了一些在注释，字符串字面量，正则表达式字面量之外被特殊对待的格式控制字符。

表-——控制字符的使用

字符编码值	名称	正式名称	用途
\u200C	零宽非连接符	<ZWNJ>	IdentifierPart
\u200D	零宽连接符	<ZWJ>	IdentifierPart
\uFEFF	位序掩码	<BOM>	Whitespace

以上内容是否对您有帮助：

写笔记

我要补充