Chapter 1 Pythonic Thinking

1. 确认自己所用的 Python 版本

PEP8

bytes 实例包含原始的 8 位字符值，str 实例包含 Unicode 字符；
前者转化为后者需要解码（decode），后者转化为前者需要编码（encode），结果由编解码方式决定；
Python 程序中要把编解码操作放在最外围，核心部分应当使用 Unicode 字符类型，不依赖于编码的形式；
bytes 和 str 都可以使用加法（连接）、比较大小、格式化字符串（%），但不同类型不可以：
- 不同类型可以使用 == 比较，但结果永远为 False；
- 可以在格式化 str 时使用 bytes，但会使用 __repr__ 的结果，不符合预期。
open 函数默认使用 UTF-8 编码格式操作文件，encoding='utf-8'，此时必须传入/读取包含 Unicode 字符的 str 实例。要使用二进制形式（bytes）读取/写入，必须采用二进制写入模式 'wb'；
可以使用 python3 -c 'import locale; print(locale.getpreferredencoding())' 来查看系统默认使用的编码方式。

最常见方法是 %，语法来自于 printf。同一变量必须在字符串与格式化元组中各指定一次，在调整打印变量的顺序时比较麻烦，用于格式化的变量元组可能因添加附加操作而变得过长，重复打印变量时也需要重复罗列；
% 操作符也支持使用字典而不是元组来格式化字符串，在字符串中使用类似 %(value).2f 的格式来指定变量名。仍存在格式化表达式过长的问题；
str.format 借助了 format 的结果，可以通过类似 {:<10.2f} 的形式指定格式。{} 的转义符为 { {}}。可以指定位置编号 {0}, {1}。也可以在 str.format 中使用关键字参数，并扩展格式字符串位置的表达式 {menu[oyster]}。不过也存在过长的问题；
f-string 中的格式字符串与上面相同 {key!r:<10}。其中的格式参数也可动态指定 {number:.{places}f}。更简洁，拆分多行更直观；
新的格式字符串句法：, 表示千位分隔符，^ 表示居中。{name!r} 表示使用 __repr__ 而非 __str__ 来翻译为字符串。