Python中内置了多种序列,字符串是其中一种重要的序列。在Python中所有标准序列操作(索引、切片、乘法、成员资格检查等)都适用于字符串,但是在Python中字符串是不可变的,因此所有的元素赋值或者切片赋值都是非法的。
在前一节已经介绍过字符串的拼接,本节将不会再介绍,需要了解字符串拼接,可查看Python基础编程——字符串及字符串拼接章节。
访问字符串中的值
Python访问字符串可以使用方括号[]来截取字符串,其语法如下所示:
变量[索引]
通过索引的方式访问字符串,将返回字符串指定索引位置的元素值,其返回值虽然只有一个字符,但是其数据类型也是一个字符串,如下所示:
在Python序列中从左到右索引值从0开始依次递增,从右到左时;索引值从-1开始依次递减,即索引既可以是一个整数也可以是一个负数。当索引值为0时表示最左边的第一个元素,当索引值为-1时表示最右边的第一个元素。
字符串切片
前面介绍了字符串的索引,在Python中索引可以包括起始索引和结束索引,可以使用起始索引和结束索引对字符串进行切片。其语法如下:
变量[起始索引:结束索引]
当起始索引和结束索引均为整数时,字符串切片如下所示:
从上图中可以看出,字符串切片结果包括起始索引值对应的元素值,不包括结束索引对应的元素值;当且仅当指定起始索引时,切片的结果包括起始索引对应的元素值及其后面的所有元素值;当不指定起始索引和结束索引时,切片的结果即为字符串本身。
当起始索引和结束索引均为负数时,字符串切片如下所示:
由于使用负数作为索引不符合我们日常的使用习惯,因此不建议使用负数作为索引,在特殊情况下,可以使用负数索引,比如总是取最后一个元素值时。
前面介绍的字符串切片都是起始索引对应的元素值在结束索引对应的元素值的左边,当起始索引对应的元素值在结束索引对应的元素的右边时会出现什么情况呢?如下所示:
从上图中可以看出,当起始索引对应的元素值在结束索引对应的元素值的右边时返回的结果是一个空的字符串。
在进行切片时中括号除了起始索引和结束索引还可以加上第三个参数—步长,默认表示每次取数的间距,默认情况下步长为1,表示挨个取元素,当步长不为1时,按照指定的步长进行切片,如下所示:
字符串运算
在进行字符串运算时,常用的字符串运算有重复字符串、成员资格检查两种。
需要进行字符串重复运算时,使用*运算符,例如:'string'*2,表示将string字符串进行重复拼接两次并将结果返回,如下所示:
对字符串进行成员资格检查时,需要使用使用in和notin运算符,其返回一个布尔值(True或者False)主要检查给定的字符串是否在包含在目标字符串中,如下所示:
从上图中可以看出,当给定的字符串包含在目标字符串中时,返回True,否则返回False。
notin和in的用法相同,只是意思与in相反罢了。
字符串格式化
Python支持格式化字符串的输出,虽然这样可能会用到非常复杂的表达式,但最基本的用法是将一个值插入到一个有字符串格式符%s字符串中,也可以使用元组(如果要设置多个值),甚至可以使用字典,元组也是一种Python内置的数据类型,将在后面章节介绍。前面提到的%s称之为转换说明符,指出了要将值插入什么地方。更多转换说明符可以查阅Python的官方文档。
使用%s设置字符串的单个元素值,如下图所示:
使用元组设置字符串的多个元素值,如下图所示:
上面提到的格式化字符串的方法主要是用于早期Python版本开发的程序,在编写新代码时,应选择使用字符串方法format,它融合并强化了早期方法的优点。使用这种方法时,每个替换字段都用花括号括起,其中可能包含名称,还可能包含有关如何对相应的值进行转换和格式设置的信息。
在最简单的情况下,替换字段没有名称或将索引用作名称。
而且索引无需像上面这样按顺序排列,如下图所示:
字符串的格式化内容很多,也很复杂,上面介绍的是简单、基本的用户也是在实际编程中最常用的方法。更多复杂的格式化方法,请参考Python的官方文档。