表示法
源代码编码为UTF-8。
文本无需规范化。
字符
本文件将使用术语 字符 来指代Unicode编码点。
以下术语用于表示特定的Unicode字符类别:
newline = /* the Unicode code point U+000A */ .
unicode_char = /* an arbitrary Unicode code point except newline */ .
unicode_letter = /* a Unicode code point classified as "Letter" */ .
unicode_digit = /* a Unicode code point classified as "Number, decimal digit" */ .
在Unicode标准8.0的第4.5节中,“一般类别”定义了一组字符类别。Flux将任何字母类别(Lu, Ll, Lt, Lm或Lo)中的所有字符视为Unicode字母,将数字类别(Nd)中的字符视为Unicode数字。
字母和数字
下划线字符 _ (U+005F) 被视为一个字母。
letter = unicode_letter | "_" .
decimal_digit = "0" … "9" .