Python 字符串类型
这节课我们来学习下 Python 基本数据类型中的字符串类型,字符串类型在实际的开发中是一个经常会用到的数据类型,比较重要。下面我们一起来看一下:
1. 简介
字符串类型的数据表示一段文本,使用单引号或者双引号创建:
单引号字符串 ‘hello’
双引号字符串 “world”
在 python 中使用字符串的例子如下:
>>> x = 'hello'>>> x'hello'>>> y = world>>> y'world'
在第 1 行,创建了使用单引号字符串 hello,并将值赋给变量 x
在第 2 行,显示变量 x 的值为 ‘hello’
在第 3 行,创建了使用双引号字符串 world,并将值赋给变量 y
在第 4 行,显示变量 y 的值为 ‘world’
使用单引号或者双引号创建的字符串只能在一行,而使用三引号允许一个跨多行的字符串。
使用 3 个单引号创建的多行字符串示例如下:
s = '''line 1line 2line 3'''print(s)
使用 3 个双引号创建的多行字符串示例如下:
s = line 1line 2line 3print(s)
以上程序的输出如下:
line 1line 2line 3
2. 常见运算操作
本节介绍对字符的最常见的几种运算操作,包括:
2.1 运算符 +
使用运算符 + 连接两个字符串,示例如下:
>>> 'Hello' + 'World'>>> 'HelloWorld'>>> 'Hello' + ' ' + 'World'>>> 'Hello World'
在第 1 行,使用运算符 + 连接两个字符串
在第 3 行,使用运算符 + 连接多个字符串
2.2 运算符 *
使用运算符 * 重复输出字符串,示例如下:
>>> 'hello' * 'hellohello'>>> 'hello' * 'hellohellohello'
在第 1 行,使用运算符 * 将字符串重复两次
在第 3 行,使用运算符 + 将字符串重复三次
2.3 函数 len
使用函数 len 获取字符串的长度,示例如下:
>>> len('abc')>>> len('imooc')
2.4 索引 []
通过索引 [] 获取字符串中指定位置的字符,示例如下:
>>> s = 'imooc'>>> s[]'i'>>> s[]'m'>>> s[]'o'>>> s[]'o'>>> s[]'c'
在 Python 中,单个字符也被当作字符串来处理,即该字符串只包含一个字符
在第 2 行,获取字符串 s 的第 0 个字符 ‘i’
在第 4 行,获取字符串 s 的第 1 个字符 ‘m’
2.5 索引 [:]
在 Python 中,使用语法 string [start:end],获取字符串 string 中在 [start, end) 范围的子字符串。注意范围 [start, end) 包含 start,不包含 end。举例如下:
>>> s = 'imooc'>>> s[]'m'>>> s[]'o'>>> s[]'o'>>> s[:]'moo'
在第 2 行,获取字符串 s 的第 1 个字符 ‘m’
在第 4 行,获取字符串 s 的第 2 个字符 ‘o’
在第 6 行,获取字符串 s 的第 3 个字符 ‘o’
在第 8 行,获取字符串 s 中从 1 开始、到 4 结束的字符串 ‘mooc’,使用 s [1:4] 表示该范围,注意该范围包括字符串的第 1 个字符、不包括第 4 个字符。
2.6 关键字 in
通过关键字 in 检查字符串中是否包含指定字符串,示例如下:
>>> 'mooc' in 'imooc'True>>> 'mook' not in 'imooc'True
在第 1 行,检测字符串 ‘mooc’ 在 字符串 ‘imooc’ 中
在第 3 行,检测字符串 ‘mook’ 不在 字符串 ‘imooc’ 中
3. 常用字符串方法
3.1 capitalize () 方法
capitalize () 方法把字符串的第一个字符大写,示例如下:
>>> text = 'abc'>>> text.capitalize()'Abc'
3.2 count () 方法
count () 方法统计字符串出现的次数,示例如下:
>>> text = 'abc abc'>>> text.count('abc')
3.3 startswith (target) 方法
startswith (target) 方法检查字符串是否是以字符串 target 开头,示例如下:
>>> text = 'abc'>>> text.startswith('ab')True>>> text.startswith('bb')False
3.4 endswith (target) 方法
endswith (target) 方法检查字符串是否是以字符串 target 结尾,示例如下:
>>> text = 'abc'>>> text.endsswith('bc')True>>> text.endsswith('cc')False
3.5 lower () 方法
lower () 方法将字符串中所有大写字符转换为小写,示例如下:
>>> text = 'ABC'>>> text.lower()'abc'
3.6 upper () 方法
upper () 方法将字符串中所有小写字符转换为大写,示例如下:
>>> text = 'abc'>>> text.upper()'ABC'
3.7 islower () 方法
如果字符串中所有字符是小写则为真,否则为假,示例如下:
>>> text = 'abc'>>> text.islower()True
3.8 isupper () 方法
如果字符串中所有字符是大写则为真,否则为假,示例如下:
>>> text = 'ABC'>>> text.isupper()True
3.9 find (target) 方法
检查是否包含指定字符串 target,如果包含字符串 target 则返回开始的索引值,否则返回 -1,示例如下:
>>> text = 'imooc'>>> text.find('oo')>>> text.find('oop')-
在第 2 行,查找字符串 ‘imooc’ 是否包含字符串 ‘oo’
在第 3 行,字符串 ‘oo’ 在字符串 ‘imooc’ 中的起始位置是 2,因此返回 2
在第 2 行,查找字符串 ‘imooc’ 是否包含字符串 ‘oop’
在第 5 行,字符串 ‘imooc’ 中不包含字符串 ‘oop’,因此返回 -1
3.10 split () 方法
使用空格将字符串分割为多个单词,返回一个列表,示例如下:
>>> text = 'hello world'>>> text.split()['hello', 'world']
缺省情况下,使用空格将字符串分割为多个单词,可以在 split () 方法中指定分隔符,示例如下:
>>> text = 'hello:world'>>> text.split(':')['hello', 'world']
4. 转义字符
在 Python 中使用反斜杠 \ 加字母的组合来表示一些特殊字符,例如:\n 表示换行,\ 之后的字符 n 的含义已经不再是原来 ASCII 字符的含义了,所以被称为转义字符。
常用的转义字符如下所示:
转义字符 | 描述 |
---|---|
\t | 制表 |
\n | 换行 |
\’ | ’ |
\ | |
\\ | \ |
使用 \t 的示例
>>> print('a\tb\tc')a b c>>> print('aa\tbb\tcc')aa bb cc
\t 表示跳到下一个制表符位置,可以使得输出纵向对齐。
使用 \n 的示例
>>> print('a\nb')ab
使用 \’ 的示例
>>> print('\'')'
在单引号字符串中使用 \’ 表示单引号
使用 \ 的示例
>>> print(\)
在双引号字符串中使用 \ 表示双引号
使用 \\ 的示例
>>> print('\\')\
在字符串中使用 ‘\’ 表示转义字符 \
5. 字符串格式化
5.1 什么是字符串格式化
通过使用字符串 + 连接运算可以将多个字符串拼接起来,例如:
>>> name = 'tom'>>> city = 'nanjing'>>> 'My name is ' + name + ', I live in ' + city + '.''My name is tom, I live in beijing.'
在第 3 行,使用字符串 + 将以下 5 个字符串拼接起来:
'My name is ’
name
', I live in ’
city
‘.’
最终得到字符串 ‘My name is tom, I live in beijing’,像这样将多个字符串拼接起来的表达式非常不直观,Python 提供了字符串格式化用于简化拼接多个字符串。
5.2 format 方法
使用字符串提供的 format 方法完成上述的拼接工作,如下所示:
>>> name = 'tom'>>> city = 'beijing'>>> text = 'My name is {}, I live in city {}.'>>> text.format(name, city)'My name is tom, I live in beijing.'
在第 1 行,创建变量 name
在第 2 行,创建变量 city
在第 3 行,创建字符串 text,字符串中 % s 被称为占位符,text 中有两个占位符
在第 4 行,调用字符串 text 的 format 方法,该方法有两个参数:name 和 city
在第 5 行,将 text 中的两个占位符 % s 替换为这两个参数,得到最终的结果 ‘My name is tom, I live in beijing.’
与上一节使用 + 运算连接相比,格式化字符串显著的提高了程序的可读性。
5.3 % 运算符
也可以使用运算符 % 完成上述的拼接工作,如下所示:
>>> name = 'tom'>>> city = 'beijing'>>> text = 'My name is %s, I live in city %s.'>>> text % (name, city)'My name is tom, I live in beijing.'
在第 1 行,创建变量 name
在第 2 行,创建变量 city
在第 3 行,创建字符串 text,字符串中 % s 被称为占位符,text 中有两个占位符
在第 4 行,使用运算符 % 进行字符串格式化。运算符 % 有两个操作数,左边的操作数是字符串变量 text,右边的操作数是一个元组,元组中包含两个参数:name 和 city
在第 5 行,将 text 中的两个占位符 % s 替换为这两个参数,得到最终的结果 ‘My name is tom, I live in beijing.’
在实践中,通常直接将字符串与参数使用运算符 % 格式化,如下所示:
>>> name = 'tom'>>> city = 'beijing'>>> 'My name is %s, I live in city %s.' % (name, city)'My name is tom, I live in beijing.'
如果有多个参数,需要将所有的参数保存在一个元组中;如果只有一个参数,可以不用保存在元组中,举例如下:
>>> name = 'tom'>>> 'My name is %s.' % name'My name is tom.'
在第 2 行,只有一个参数,可以不用将参数封装在元组中
5.4 占位符
% 是一个特殊的符号,后面跟着一个字符用于说明参数的类型:
% s 表示字符串
% d 表示整数
% f 表示浮点数
有多种类型的占位符,初学时需要掌握如下常用的占位符:
符号 | 描述 |
---|---|
%% | 用于表示 % |
%c | 格式化字符及其 ASCII 码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%f | 格式化浮点数 |
% s 用于格式化字符串
>>> name = 'tom'>>> 'name is %s' % name'name is tom'
% d 用于格式化整数
>>> integer = >>> 'integer is %d' % integer'integer is 123'
% f 用于格式化浮点数
>>> float = >>> 'float is %f' % float'float is 123.456000'
%% 用于表示字符 % 本身
>>> a = >>> b = >>> c = a % b>>> '%d %% %d = %d' % (a, b, c) % =
%% 是一个特殊的占位符,表示字符 % 本身。
5.5 print 方法
在实践中,通常使用 print 方法输出将格式化后的字符串,示例如下:
>>> name = 'tom'>>> city = 'beijing'>>> print('My name is %s' % name)My name is tom>>> print('My name is %s, I live in city %s.' % (name, city))My name is tom, I live in beijing.
6. 小结
字符串和数值一样,同样有基本的运算方式,但是最终得到的结果形式和数值却略有不同,大家在使用的时候要注意这一点。字符串的常用方法也需要大家多多练习和使用,可以把正文中的代码多敲几遍,一个好的程序员就是要多敲代码才能成长。