這篇文章主要介紹如何使用字元串來設置其他值的格式(比如便於列印),並大致瞭解使用字元串方法可完成的重要任務,如拆分、合併和查找等。 ...
在05python字元串基礎中我們已經大致介紹過字元串,知道如何創建字元串,以及如何使用索引和切片來訪問字元串中的字元。這篇文章主要介紹如何使用字元串來設置其他值的格式(比如便於列印),並大致瞭解使用字元串方法可完成的重要任務,如拆分、合併和查找等。
字元產基本操作
字元串是一種序列,所以所有的標準序列操作都適用於字元串
- 索引
- 切片
- 乘法
- 成員資格檢查
- 長度
- 最大值
- 最小值
同時,字元串是一種不可變序列,所以元素賦值和切片賦值都是非法的,這方面字元串的性質更類似於元組。
>>>
>>> website = 'http://www.python.org'
>>> website[-3:] = 'com'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'str' object does not support item assignment
>>>
設置字元串的格式
將值轉換為字元串並設置其格式是一個重要的操作,Python提供了多種字元串格式設置方法,即字元串格式化。
- 百分號
通過在%
左邊左邊指定一個字元串(格式字元串),併在右邊指定要設置的其格式的值,可以格式化字元串。指定要設置其格式的值時,可使用單個值(如字元串或數字),可以使用元組(如果要設置多個值格式),還可以使用字典,其中最常見的是元組。
>>>
>>> format = 'Hello, %s. %s enough for you?' # %s表示格式化字元串
>>> values = ('world', 'Hot')
>>> format % values
'Hello, world. Hot enough for you?'
>>>
>>> 'Hello %s. %s enough for you?' % ('world', 'Hot')
'Hello world. Hot enough for you?'
>>>
%s
稱為轉換說明符,指出了要將值插入在什麼地方。s表示要將值視為字元串驚醒格式設置。
- 模板字元串
模板字元串類似於UNIX shell中的語法,旨在簡化基本的格式設置機制。
>>>
>>> tmpl = Template('Hello, $who! $what enough for you?')
>>> tmpl.substitute(who='Mars', what='Dusty')
'Hello, Mars! Dusty enough for you?'
>>>
包含等好的參數稱為關鍵字參數,在字元串格式設置中,可將關鍵字參數視視作為一種向命名替換欄位提供值得方式。
- format——最常用的方法
在編寫新代碼時,應選擇使用字元串方法format,使用這種方法時,每個替換欄位都用{}
括起來,其中可能包含名稱,還可能包含有關如何應對相應的值進行轉換和格式設置的信息。
>>>
>>> '{}, {} and {}.'.format('first', 'second', 'third')
'first, second and third.'
>>> '{0}, {1} and {2}.'.format('first', 'second', 'third')
'first, second and third.'
>>>
>>> '{3} {0} {2} {1} {3} {0}'.format('be', 'not', 'or', 'to') # 索引無需按照順序排列,填入的值的索引與給定的參數元組索引對應即可
'to be or not to be'
>>>
>>> from math import pi
>>> '{name} is approximately {value:.2f}.'.format(value=pi, name='Π') # 大括弧中還可以使用關鍵字參數,排序無關緊要,對應即可
'Π is approximately 3.14.'
>>>
>>> from math import pi
>>> '{name} is approximately {value}.'.format(value=pi, name='Π') # 格式說明符.2f需要使用:與欄位名隔開。如果沒有格式說明符,會展示所有小數
'Π is approximately 3.141592653589793.'
f
格式化
在python3.6中,如果變數與替換欄位同名,還可以使用format的一種簡寫方式:使用f字元串——在字元串前面加上f
>>
>>> from math import e
>>> f"Euler's constant is roughly {e}."
"Euler's constant is roughly 2.718281828459045."
>>>
>>> "Euler's constant is roughly {e}.".format(e=e) # 與上面是等價的
"Euler's constant is roughly 2.718281828459045."
format格式化字元串
格式化字元串的內容很多,這一部分主要介紹對字元串調用方法format,並提供要設置其格式的值。基本原理就是給定每個值都被插入到字元串中,以替換用花括弧中的替換欄位。
如果要在最終結果中包含 {}
,可在格式字元串中使用兩個花括弧(即{{}})來指定。
>>>
>>> "{{ceci n'est pas une replacement field}}".format()
"{ceci n'est pas une replacement field}"
>>>
格式化字元串中,替換欄位由以下三部分組成:
- 欄位名:索引或標識符,指出要設置哪個值的格式並使用結果來替換該欄位。除指定值外,還可以指定值的特定部分,如列表元素。
- 轉換標誌:跟在嘆號後面的單個字元。當前支持的字元包括
r(表示repr)
、s(表示str)
和b
。如果使用了轉換標誌,將不使用對象本身的格式設置機制,而是使用指定的函數將對象轉換為字元串,再做進一步的格式設置。 - 格式說明符:跟在冒號後面的表達式(這種表達式是使用微型格式指定語言表示的)。格式說明符讓我們能夠詳細地指定最終的格式,包括格式類型(如字元串、浮點數或十六進位數),欄位寬度和數的精度,如何顯示符號和千位分隔符,以及各種對齊和填充方式。
替換欄位名
有3中方式設置替換欄位名
- 最簡單的就是向format提供要設置其格式的未命名參數
- 通過索引來指定要在哪個欄位種使用相應的未命名參數
- 通過訪問值的組成部分來使用
>>>
>>> '{foo} {} {bar} {}'.format(2, 4, bar=3, foo=1) # 第1種方式
'1 2 3 4'
>>>
>>> '{foo} {1} {bar} {0}'.format(2, 4, bar=3, foo=1) # 第2種方式
'1 4 3 2'
>>>
>>> fullname = ['Alex', 'Bob']
>>> 'Mr {name[1]}.'.format(name=fullname) # 第3種方式
'Mr Bob.'
>>>
>>> import math
>>> tmpl = 'The {mod.__name__} moudle defines the value {mod.pi} for Π.'
>>> tmpl.format(mod=math) # 第3種方式
'The math moudle defines the value 3.141592653589793 for Π.'
>>>
基本轉換
>>>
>>> print('{pi!s} {pi!r} {pi!a}'.format(pi='Π'))
Π 'Π' '\u03a0'
>>>
>>> 'The number is {num}'.format(num=42)
'The number is 42'
>>> 'The number is {num:.2f}'.format(num=42) # 整數轉換為小數
'The number is 42.00'
>>> 'The number is {num:b}'.format(num=42) # 二進位
'The number is 101010'
>>>
在指定了欄位中包含的值後, 就可以通過添加轉換標誌來設置格式。
s
-str轉換,函數str通常創建外觀普通的字元串版本(這裡沒有對輸入字元串做任何處理)r
-repr轉換,函數repr嘗試創建給定值的Python表示(這裡是一個字元串字面量)a
-ascii轉換,函數ascii創建只包含ASCII字元的表示,類似於Python 2中的repr
還可以指定要轉換的值是哪種類型,例如可以提供一個整數將其作為小數進行處理。類型說明符:
類型 | 含義 |
---|---|
b | 將整數表示為二進位數 |
c | 將整數解讀為Unicode碼點 |
d | 將整數視為十進位數進行處理,這是整數預設使用的說明符 |
e | 使用科學表示法來表示小數(用e來表示指數) |
E | 與e相同,但使用E來表示指數 |
f | 將小數表示為定點數 |
F | 與f相同,但對於特殊值( nan和inf),使用大寫表示 |
g | 自動在定點表示法和科學表示法之間做出選擇。這是預設用於小數的說明符,但在預設情況下至少有1位小數 |
G | 與g相同,但使用大寫來表示指數和特殊值 |
n | 與g相同,但插入隨區域而異的數字分隔符 |
o | 將整數表示為八進位數 |
s | 保持字元串的格式不變,這是預設用於字元串的說明符 |
x | 將整數表示為十六進位數並使用小寫字母 |
X | 與x相同,但使用大寫字母 |
% | 將數表示為百分比值(乘以100,按說明符f設置格式,再在後面加上%) |
寬度、精度和千位分隔符
設置浮點數或其他小數類型格式時,預設展示6位小數,大多數情況下都不需要這麼多小數位數,所以涉及到精度問題。
還可以根據需要設置欄位的寬度,而不進行任任何形式的填充。
可以使用逗號來設置要添加的千位分隔符。
>>>
>>> '{num:10}'.format(num=3) # 設置數字寬度
' 3'
>>> '{name:10}'.format(name='Bob') # 設置字元串寬度
'Bob '
>>>
>>> from math import pi
>>> 'Pi day is {pi:.2f}.'.format(pi=pi) # 設置精度
'Pi day is 3.14.'
>>>
>>> from math import pi
>>> '{pi:10.2f}.'.format(pi=pi) # 設置寬度和精度
' 3.14.'
>>>
>>> 'One google is {:,}'.format(10**100) # 設置分格符
'One google is 10,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000'
>>>
符號、對其和用0填充
設置完精度和寬度後,基本上就能滿足列印的需要,但是數字裡面有負號會打亂格式,所以需要對符號進行處理。
另外字元串和數字的預設對齊方式不同,也需要處理。
在指定寬度和精度的數據面前,可以添加一個標誌,可以是零、加號、減號、空格等,其中使用0來填充數字。
可以使用填充字元來擴充對齊說明符,而不是預設的空格。
等號指定將填充字元放在符號和數字之間。
給正數加上符號使用說明符+。
井號放在說明符和寬度之間會觸發一種轉換方式,進位會加上首碼。
>>>
>>> from math import pi
>>>
>>> '{:010.2f}.'.format(pi) # 指定 填充、長度、小數位數
'0000003.14.'
>>>
>>> '{0:<10.2f}.'.format(pi) # 左對齊
'3.14 .'
>>>
>>> '{0:>10.2f}.'.format(pi) # 右對齊
' 3.14.'
>>>
>>> '{0:^10.2f}.'.format(pi) # 居中對齊
' 3.14 .'
>>>
>>> '{:$^15}.'.format(' WIN BIG ') # 字元填充
'$$ WIN BIG $$.'
>>>
>>> print('{0:10.2f}\n{1:10.2f}'.format(pi, -pi))
3.14
-3.14
>>>
>>> print('{0:10.2f}\n{1:=10.2f}'.format(pi, -pi)) # 等號指定將填充字元放在符號和數字之間
3.14
- 3.14
>>>
>>>
>>> print('{0:-.2}\n{1:-.2}'.format(pi, -pi)) # 預設設置
3.1
-3.1
>>> print('{0:+.2}\n{1:+.2}'.format(pi, -pi)) # +放在說明符後面給正數加上符號
+3.1
-3.1
>>> print('{0: .2}\n{1: .2}'.format(pi, -pi)) # 說明符指定空格在正數前面加上空格
3.1
-3.1
>>>
>>>
>>> '{:b}'.format(42)
'101010'
>>> '{:#b}'.format(42) # #在進位轉換會加上首碼
'0b101010'
>>>
>>
>>> '{:g}'.format(42)
'42'
>>> '{:#g}'.format(42) # 對於各種十進位數,它要求必須包含小數點(對於類型g,它保留小數點後面的零)
'42.0000'
>>>
設置字元串格式示例:
# 根據指定的寬度列印格式良好的價格列表
width = int(input('PLease enter width: '))
prince_width = 10
item_width = width - prince_width
header_fmt = '{{:{}}}{{:>{}}}'.format(item_width, prince_width)
fmt = '{{:{}}}{{:>.2{}}}'.format(item_width, prince_width)
print('=' * width)
print(header_fmt.format('Item', 'Price'))
print('-' * width)
print(fmt.format('Apples', 0.4))
print(fmt.format('Pears', 0.5))
print(fmt.format('Cantaloupes', 1.92))
print(fmt.format('Dried Apricots (16 oz.)', 8.0))
print(fmt.format('Prunes (4 lbs.)', 12.2))
print('=' * width)
### Output
PLease enter width: 35
===================================
Item Price
-----------------------------------
Apples 0.40000000000000002220446049250313080847263336181640625
Pears 0.5
Cantaloupes 1.9199999999999999289457264239899814128875732421875
Dried Apricots (16 oz.) 8.0
Prunes (4 lbs.) 12.199999999999999289457264239899814128875732421875
===================================