Giới thiệu về phương thức của kiểu dữ liệu chuỗi trong Python
Kiểu dữ liệu của Python có khá nhiều các phương thức chuẩn (chưa tính đến các thư viện) để xử lí chuỗi.
Các phương thức này đều có giá trị trả về và không ảnh hưởng gì tới giá trị ban đầu. Tương tự như một số hàm mà các bạn đã biết: int, float, str
>>> k = ‘12’
>>> int(k)
12
>>> type(k) # k vẫn thuộc lớp str
<class ‘str’>12345
Các phương thức biến đổi
Phương thức capitalize
Cú pháp:
<chuỗi>.capitalize()
Công dụng:Trả về một chuỗi với kí tự đầu tiên được viết hoa và viết thường tất cả những kí tự còn lại.
>>> ‘kteaM’.capitalize()
‘Kteam’
>>> ‘hello, Howkteam!’.capitalize()
‘Hello, howkteam!’
>>> ‘ howKTEAM’.capitalize()
‘ howkteam’
1234567
Phương thức upper
Cú pháp:
<chuỗi>.upper()
Công dụng: Trả về một chuỗi với tất cả các kí tự được chuyển thành các kí tự viết hoa
>>> ‘kter’.upper()
‘KTER’
>>> 'HOW kteam'.upper()
'HOW KTEAM'
>>> ' python'.upper()
' PYTHON'123456
Phương thức lower
Cú pháp:
<chuỗi>.lower()
Công dụng: Trả về một chuỗi với tất cả các kí tự được chuyển thành các kí tự viết thường
>>> 'FREE education'.lower()
'free education'
>>> 'kteam'.lower()
'kteam'
>>> ' kTer'.lower()
' kter'123456
Phương thức swapcase
Cú pháp:
<chuỗi>.swapcase()
Công dụng: Trả về một chuỗi với các kí tự viết hoa được chuyển thành viết thường, các kí tự viết thường được chuyển thành viết hoa
>>> 'free EDUCATION'.swapcase()
'FREE education'
>>> 'HoW kTeAm'.swapcase()
'hOw KtEaM'1234
Phương thức title
Cú pháp:
<chuỗi>.title()
Công dụng: Trả về một chuỗi với định dạng tiêu đề, có nghĩa là các từ sẽ được viết hoa chữ cái đầu tiên, còn lại là viết thường
>>> 'share to be better'.title()
'Share To Be Better'
>>> 'FREE EDUCATION'.title()
'Free Education'1234
Các phương thức định dạng
Phương thức center
Cú pháp:
<chuỗi>.center(width, [fillchar])
Công dụng: Trả về một chuỗi được căn giữa với chiều rộng width.
- Nếu fillchar là None (không được nhập vào) thì sẽ dùng kí tự khoảng trắng để căn, không thì sẽ căn bằng kí tự fillchar.
- Một điều nữa là kí tự fillchar là một chuỗi có độ dài là 1.
>>> 'abc'.center(12)
' abc '
>>> 'abc'.center(12, '*')
'****abc*****'
>>> 'abc'.center(12, '*a')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: The fill character must be exactly one character long
>>> 'abc'.center(12, '')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: The fill character must be exactly one character long123456789101112
Phương thức rjust
Cú pháp:
<chuỗi>.rjust(width, [fillchar])
Công dụng: Cách hoạt động tương tự như phương thức center, có điều là căn lề phải
>>> 'kteam'.rjust(12)
' kteam'
>>> 'kteam'.rjust(12, '*')
'*******kteam'1234
Phương thức ljust
Cú pháp:
<chuỗi>.ljust(width, [fillchar])
Công dụng: Cách hoạt động tương tự phương thức center, nhưng căn lề trái.
>>> 'Kter'.ljust(12)
'Kter '
>>> 'kter'.ljust(12, '*')
'kter********'1234
Các phương thức xử lí
Phương thức encode
Cú pháp:
<chuỗi>.encode(encoding=’utf-8’, errors=’strict’)
Công dụng: Đây là phương thức dùng để encode một chuỗi với phương thức mã hóa mặc định là utf-8. Còn về errors mặc định sẽ là strict có nghĩa là sẽ có thông báo lỗi hiện lên nếu có vấn đề xuất hiện trong quá trình encode chuỗi. Một số giá trị ngoài strict là ignore, replace, xmlcharrefreplace. Vì phần này là phần nâng cao, Kteam xin phép không đi sâu.
>>> 'ố ồ'.encode()
b'\xe1\xbb\x91 \xe1\xbb\x93'12
Phương thức join
Cú pháp:
<kí tự nối>.join(<iterable>)
Công dụng: Trả về một chuỗi bằng cách nối các phần tử trong iterable bằng kí tự nối. Một iterable có thể là một tuple, list,… hoặc là một iterator (Kteam sẽ giải thích khái niệm này ở các bài sau).
- Một điểm lưu ý, các phần tử trong iterable buộc phải thuộc lớp str
>>> ' '.join(['1', '2', '3']) # iterable ở đây là list ['1', '2', '3']
'1 2 3'
>>> ' '.join(('1', '2', '3')) # iterable ở đây là tuple ('1', '2', '3')
'1 2 3'
>>> ' '.join([1, 2, 3]) # phần tử trong list không phải là chuỗi
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: sequence item 0: expected str instance, int found12345678
Phương thức replace
Cú pháp:
<chuỗi>.replace(old, new, [count])
Công dụng: Trả về một chuỗi với các chuỗi old nằm trong chuỗi ban đầu được thay thế bằng chuỗi new. Nếu count khác None (có nghĩa là ta cho thêm count) thì ta sẽ thay thế old bằng new với số lượng count từ trái qua phải.
- Nếu chuỗi old không nằm trong chuỗi ban đầu hoặc count là 0 thì sẽ trả về một chuỗi giống với chuỗi ban đầu
>>> 'abc how abc kteam'.replace('abc', 'aaa')
'aaa how aaa kteam'
>>> 'abc how abc kteam'.replace('a', 'AA')
'AAbc how AAbc kteam'
>>> 'abc how abc kteam'.replace('abcd', 'AA')
'abc how abc kteam'
>>> 'abc how abc kteam'.replace('abc', 'AA', 1)
'AA how abc kteam'
>>> 'abc how abc kteam'.replace('abc', 'BB', 0)
'abc how abc kteam'12345678910
Phương thức strip
Phương thức này hơi rắc rối một tẹo nếu bạn chưa hiểu rõ cách nó hoạt động.
Cú pháp:
<chuỗi>.strip([chars])
Công dụng: Trả về một chuỗi với phần đầu và phần đuôi của chuỗi được bỏ đi các kí tự chars. Nếu chars bị bỏ trống thì mặc định các kí tự bị bỏ đi là dấu khoảng trắng và các escape sequence. Một số escape sequence ngoại lệ như \a sẽ được encode utf-8. Tuy vậy, không có ảnh hưởng gì tới nội dung.
>>> ' Kter '.strip()
'Kter'
>>> '%%%%Kter%%%'.strip('%')
'Kter'
>>> 'cababHowbaaaca'.strip('abc')
'How'
>>> '\t\n\aKter\a\a\n\v'.strip() # các \a biến thành \x07
'\x07Kter\x07\x07'
>>> print('\x07Kter\x07\x07') # nhưng khi dùng print vẫn có kết quả tương tự123456789
Phương thức rstrip
Cú pháp:
<chuỗi>.rstrip()
Công dụng: Cách hoạt động hoàn toàn như phương thức strip, nhưng khác là chỉ bỏ đi ở phần đuôi (từ phải sang trái)
>>> ' Kter '.rstrip()
' Kter'
>>> '%%%%Share%%%'.rstrip('%')
'%%%%Share'
>>> 'cababKterbaaaca'.rstrip('abc')
'cababKter'123456
Phương thức lstrip
Cú pháp:
<chuỗi>.lstrip()
Công dụng: Cách hoạt động tương tự phương thức rstrip, khác ở chỗ rstrip lo phần đuôi, còn lstrip lo phần đầu (từ trái sang phải)
>>> ' Kter '.lstrip()
'Kter '
>>> '%%%%Kter%%%'.lstrip('%')
'Kter%%%'
>>> 'cababKterbaaaca'.lstrip('abc')
'Kterbaaaca'123456
Củng cố bài học
Nếu bạn rút gọn được từ 5 dòng trở xuống thì bạn đã giải được câu hỏi trên. Còn đây là cách rút gọn ngắn nhất
print('+ {:-<6} + {:-^15} + {:->10} +\n'.format('', '', '') + '| {:<6} | {:^15} | {:>10} |\n'.format('ID', 'Ho va ten', 'Noi sinh') + '| {:<6} | {:^15} | {:>10} |\n'.format('123', 'Yui Hatano', 'Japanese') + '| {:<6} | {:^15} | {:>10} |\n'.format('6969', 'Sunny Leone', 'Canada') + '+ {:-<6} + {:-^15} + {:->10} +'.format('', '', ''))1
Được cập nhật: 15 tháng 4 lúc 16:34:57 | Lượt xem: 732