语法参考系列——(二)词汇结构
标签(空格分隔): Swift 学习笔记
什么是词汇结构
词汇就是语言的最小单元,是一系列字符的组成的标记,词汇包括标识符、关键字(keyword)、标点、字面值和操作符。
词汇结构就是定义什么样的字符序列才是合法的词汇。
编译器会从Swift源文件中读取这些标记,读取的规则是longest match 或 maximal munch.
空白和注释
空白就俩作用:分隔词汇标记和用来判断是前缀还是后缀操作符,其他情况会被忽略。
会被当作空白处理的输入:空格、换行、回车、水平制表符、垂直制表符、换页符和null。
注释会被编译器当作空白处理。
单行注释以“//”开始,以回车或者换行结束。
多行注释以“/”开始,以“/”结束。允许嵌套注释,但是注释标记需要成对。
注释里面还可以弄一些花样,弄一些在开发环境或者文档中方便阅读的样式。
标识符
标识符的起始字符可以是:小写或者大写的从A到Z的字母、下划线、非结合的基本多语言面 (Basic Multilingual Plane,BMP)中的字符、BMP之外而且不在Private Use Area区域内的字符。起始字符之外数字和组合Unicode字符也是可以使用的。
如果想使用保留字做标识符,需要用“ `”包裹保留字,这样用“ `”不会被当作标识符的一部分被处理。“`x`”和“x”是同一个标识符。
对于没有明确参数名称的闭包,参数默认被命名为$0,$1,$2……,这些名字只在闭包的作用范围内有效。
下面是具体的语法规则。
关键字和标点符号
用来声明的关键字
class,deinit,enum,extension,func,import,init,inout,internal,let,operator,private,protocol,public,static,struct,subscript,typealias,var.
用作语句的关键字
break,case,continue,default,defer,do,else,fallthrough,for,guard,if,in,repeat,return,switch,where,while
用作表达式和类型的关键字
as,catch,dynamicType,false,is,nil,rethrows,super,self,Self,throw,throws,true,try,__COLUMN__,__FILE__,__FUNCTION__,__LINE__.
用作模式的关键字
_
(这货是干啥用的???)
用作特定上下文环境中的保留字
associativity,convenience,dynamic,didSet,final,get,infix,indirect,lazy,left,mutating,none,nonmutating,optional,override,postfix,precedence,prefix,Protocol,required,right,set,Type,unowned,weak,willSet
这部分保留字在特定的环境之外可以用作标识符。
做为标点符号被保留限制作为自定义操作符使用的符号
限制作为前缀操作符的
(,),{,},[,],.,:,;,=,@,#,&
限制作为后缀操作符的
->,`,?,!
字面值
字面值是表现一个类型的值的源码。
字面值不具备类型,它们会被无限精度的解析,Swift的类型推测机制会尝试推测出子面值的类型。子面值会被推测为Swift标准库中的每种类型。
当声明了类型时,声明的类型必须要能够将字面值实例化。这些类型必须遵循Swift标准库中的一系列协议:IntegerLiteralConvertible
对应整形字面值、FloatingPointLiteralConvertible
对应浮点型字面值、StringLiteralConvertible
对应字符串字面值、BooleanLiteralConvertible
对应布尔型字面值。
整型字面值
整型字面值表示没有指定精度的整型。默认是十进制的;可以选择使用一个表示进制的前缀。二进制的字面值以0b
开头,八进制的子面值以0o
开头,十六进制的子面值以0x
开头。
十进制的字面值包含数字0到9。二进制的字面值包含数字0和1。八进制的子面值包含数字0到7。十六进制的字面值包含数字0到9,大写或小写的字母A到F。
负整数的字面值用整数字面值前面加负号表示。
下划线(_)可以用在数字之间,目的是为了增加易读性,它们不会影响字面值的值。整型的字面值前面可以添加0,但这一只是为了易读,同样不会影响值和进制。
除非指定,Swift会将整型字面值的默认类型推测为Int
。另外,Swift标准库中还定义了不同尺寸整型的以及无符号整型,这些请参见 整型 一章。
浮点数的字面值
浮点数的字面值表现一个没有指定精度的浮点数。
默认情况下(没有前缀时)浮点数的字面值是十进制的,当然也可以用十六进制表示(用前缀0x
)。
十进制的浮点数字面值由一串十进制数字跟随十进制小数部分和十进制的指数部分的部分或全部组成。小数部分包括小数点和其后的一串十进制数字。指数部分包括一个大写或者小写的字母e
前缀和紧随其后的一串数字,这表示的含义是10的多少次方。
十六进制的浮点数子面值由前缀0x
、紧随前缀的可选的十六进制小数部分、接下来的十六进制的指数部分共同组成。十六进制的小数部分有小数点、紧随其后的一串十六进制字符组成。指数部分由大写或者小写的p
做前缀,紧跟一串十六进制字符,它表示的是2的多少次方。
负的浮点数字面值就是在整的浮点数子面值前加负号。
没有指定的情况下,Swift会默认推测浮点数的字面值为Swift标准库中的Double
类型,一个64位的浮点数。Swift标准库中也定义了Float
类型,表示一个32位的浮点数。
字符串字面值
字符串是一系列被“"
”包裹的字符。
字符串不能包括一个未转义的“"
”、一个未转义的“\
”、一个回车、一个换行。
特殊符号可以包含在一个字符串中,但要经过如下转义:
空白记号(
\0
)反斜线 (
\\
)水平制表符 (
\t
)换行 (
\n
)回车 (
\r
)双引号 (
\"
)单引号 (
\'
)Unicode的标量字符 (\u{n}),这里n是0到8个十六进制字符
一个表达式用圆括号包裹起来放置在一个“\”之后,就可以插入字符串常量之中。
一个字符串字面值的默认推测类型是String
。更多内容可以参考 Strings and Characters 以及String Structure Reference。
用“+
” 连接的字符串字面值在编译时会真正被连接起来。
操作符
Swift标准库中定义了一系列操作符,很多已经在Base Operators 和 Advance Operators中说明了。现在这节内容用来说明哪些字符可以用来定义自定义操作符。
自定义操作符可以以如下ASCII字符(/,-,+,!,*,%,<,>,&,|,^,~
)、下面定义的Unicode字符中之一开始。第一个字符之后,组合Unicode字符也可以使用了。
符号: =,->,//,/*,*/,.
,前缀操作符:<,?
,中缀操作符:?
,后缀操作符:>,?
都是保留字。这些操作符不能被重载,也不能被用于自定义操作符。
符号周围的空白被用来判断一个操作符是否被当作前缀操作符,后缀操作符,还是一个二元操作符。具体的规则如下:
- 如果操作符前后都有空白,它会被当作一个二元操作符
- 如果操作符只在左侧有空白,它会被当作前缀一元操作符
- 如果操作符只在右侧有空白,它会被当作后缀一元操作符
- 如果操作符左侧没有空白而且紧跟了一个点号,它会被当作后缀一元操作符
依照这个规则,操作符前面的(,{
、之后的),and }
、 ,:
都会被当作空白处理。
对上述规则的特别说明:如果!
或者 ?
预定义操作符左侧没有空白,它会被当作后缀操作符处理,不管它的右侧是否有空白。当 ?
被当作可选链操作符使用时,它的左侧不能有空白。当作为三元操作符使用时,它的两侧都要有空白。
在特定的结构中,以<
或者 >
开头的操作符可能会被拆分为两个或更多的标记,剩余的部分会被以同样的规则再次拆分。结果就是不需要为了消除歧义在诸如Dictionary<String,Array<Int>>
的结构中给 >
而使用空白。这个例子中结束的(两个)>
不会被视为单一符号移位运算符 >>
。
更多的关于操作符的内容参考 Custom Operator和Operator Declaration 的内容。如何重载操作符的内容参见Operator Funcion。