來源:網路
編碼原則
建議1: 理解 Pythonic 概念—-詳見 Python 中的【Python之禪】
建議2: 編寫 Pythonic 程式碼
(1)避免不規範程式碼,比如只用大小寫區分變量、使用容易混淆的變量名、害怕過長變量名等。有時候長的變量名會使程式碼更加具有可讀性。
(2)深入學習 Python 相關知識,比如語言特性、庫特性等,比如Python演變過程等。深入學習一兩個業內公認的 Pythonic 的程式碼庫,比如Flask等。
建議3: 理解 Python 與 C 的不同之處,比如縮排與 {},單引號雙引號,三元操作符?, Switch-Case 語句等。
建議4: 在程式碼中適當添加註釋
建議5: 適當添加空行使程式碼布局更加合理
建議6: 編寫函式的 4 個原則
(1)函式設計要盡量短小,巢狀層次不宜過深
(2)函式聲明應該做到合理、簡單、易用
(3)函式參數設計應該考慮向下相容
(4)一個函式只做一件事,盡量保證函式粒度的一致性
建議7: 將常量集中在一個檔,且常量名盡量使用全大寫字母
編程慣用法
建議8: 利用 assert 語句來發現問題,但要註意,斷言 assert 會影響效率
建議9: 數據交換值時不推薦使用臨時變量,而是直接 a, b = b, a
建議10: 充分利用惰性計算(Lazy evaluation)的特性,從而避免不必要的計算
建議11: 理解列舉替代實作的缺陷(最新版 Python 中已經加入了列舉特性)
建議12: 不推薦使用 type 來進行型別檢查,因為有些時候 type 的結果並不一定可靠。如果有需求,建議使用 isinstance 函式來代替
建議13: 盡量將變量轉化為浮點型別後再做除法(Python3 以後不用考慮)
建議14: 警惕eval()函式的安全漏洞,有點類似於 SQL 註入
建議15: 使用 enumerate() 同時獲取序列叠代的索引和值
建議16: 分清 == 和 is 的適用場景,特別是在比較字串等不可變型別變量時(詳見評論)
建議17: 盡量使用 Unicode。在 Python2 中編碼是很讓人頭痛的一件事,但 Python3 就不用過多考慮了
建議18: 構建合理的包層次來管理 Module
編程慣用法2
建議19: 有節制的使用 from…import 語句,防止汙染名稱空間
建議20: 優先使用 absolute import 來匯入模組(Python3中已經移除了relative import)
建議21: i+=1 不等於 ++i,在 Python 中,++i 前邊的加號僅表示正,不表示操作
建議22: 習慣使用 with 自動關閉資源,特別是在檔讀寫中
建議23: 使用 else 子句簡化迴圈(例外處理)
建議24: 遵循例外處理的幾點基本原則 (1)註意異常的粒度,try 塊中盡量少寫程式碼
(2)謹慎使用單獨的 except 語句,或 except Exception 語句,而是定位到具體異常
(3)註意異常捕獲的順序,在合適的層次處理異常
(4)使用更加友好的異常資訊,遵守異常參數的規範
建議25: 避免 finally 中可能發生的陷阱
建議26: 深入理解 None,正確判斷物件是否為空。
建議27: 連線字串應優先使用 join 函式,而不是+操作
建議28: 格式化字串時盡量使用 format 函式,而不是 % 形式
建議29: 區別對待可變物件和不可變物件,特別是作為函式參數時
建議30: [], {}和():一致的容器初始化形式。使用列表解析可以使程式碼更清晰,同時效率更高
建議31: 函式傳參數,既不是傳值也不是傳參照,而是傳物件或者說物件的參照
建議32: 警惕預設參數潛在的問題,特別是當預設參數為可變物件時
建議33: 函式中慎用變長參數 args 和 kargs
(1)這種使用太靈活,從而使得函式簽名不夠清晰,可讀性較差
(2)如果因為函式參數過多而是用變長參數簡化函式定義,那麽一般該函式可以重構
建議34: 深入理解 str()和 repr() 的區別
(1)兩者之間的目標不同:str 主要面向客戶,其目的是可讀性,返回形式為使用者友好性和可讀性都比較高的字串形式;而 repr 是面向 Python 直譯器或者說Python開發人員,其目的是準確性,其返回值表示 Python 直譯器內部的定義
(2)在直譯器中直接輸入變量,預設呼叫repr函式,而print(var)預設呼叫str函式
(3)repr函式的返回值一般可以用eval函式來還原物件
(4)兩者分別呼叫物件的內建函式 str ()和 repr ()
建議35: 分清靜態方法 staticmethod 和類方法 classmethod 的使用場景
庫的使用
建議36: 掌握字串的基本用法
建議37: 按需選擇 sort() 和 sorted() 函式
sort() 是列表在就地進行排序,所以不能排序元組等不可變型別。
sorted() 可以排序任意的可叠代型別,同時不改變原變量本身。
建議38: 使用copy模組深拷貝物件,區分淺拷貝(shallow copy)和深拷貝(deep copy)
建議39: 使用 Counter 進行計數統計,Counter 是字典類的子類別,在 collections 模組中
建議40: 深入掌握 ConfigParse
建議41: 使用 argparse 模組處理命令列參數
建議42: 使用 pandas 處理大型 CSV 檔
Python 本身提供一個CSV檔處理模組,並提供reader、writer等函式。
Pandas 可提供分塊、合並處理等,適用於數據量大的情況,且對二維數據操作更方便。
建議43: 使用 ElementTree解析XML
建議44: 理解模組 pickle 的優劣
優勢:介面簡單、各平台通用、支持的數據型別廣泛、擴充套件性強
劣勢:不保證數據操作的原子性、存在安全問題、不同語言之間不相容
建議45: 序列化的另一個選擇 JSON 模組:load 和 dump 操作
建議46: 使用 traceback 獲取棧資訊
建議47: 使用 logging 記錄日誌資訊
建議48: 使用 threading 模組編寫多執行緒程式
建議49: 使用 Queue 模組使多執行緒編程更安全
設計模式
建議50: 利用模組實作單例模式
建議51: 用 mixin 模式讓程式更加靈活
建議52: 用釋出-訂閱模式實作松耦合
建議53: 用狀態模式美化程式碼
內部機制
建議54: 理解 build-in 物件
建議55:
__init__ ()
不是構造方法,理解 new ()與它之間的區別
建議56: 理解變量的尋找機制,即作用域
局部作用域
全域作用域
巢狀作用域
內建作用域
建議57: 為什麽需要self參數
建議58: 理解 MRO(方法解析順序)與多繼承
建議59: 理解描述符機制
建議60: 區別 getattr ()與 getattribute ()方法之間的區別
建議61: 使用更安全的 property
建議62: 掌握元類 meta class
建議63: 熟悉 Python 物件協定
建議64: 利用操作符多載實作中綴語法
建議65: 熟悉 Python 的叠代器協定
建議66: 熟悉 Python 的生成器
建議67: 基於生成器的協程和 greenlet,理解協程、多執行緒、多行程之間的區別
建議68: 理解 GIL 的局限性
建議69: 物件的管理和垃圾回收
使用工具輔助計畫開發
建議70: 從 PyPI 安裝第三方包
建議71: 使用 pip 和 yolk 安裝、管理包
建議72: 做 paster 建立包
建議73: 理解單元測試的概念
建議74: 為包編寫單元測試
建議75: 用測試驅動開發(TDD)提高程式碼的可測性
建議76: 使用 Pylint 檢查程式碼風格
程式碼風格審查
程式碼錯誤檢查
發現重復以及不合理的程式碼,方便重構
高度的可配置化和可客製化
支持各種 IDE 和編輯器的整合
能夠基於 Python 程式碼生成 UML 圖
能夠與 Jenkins 等持續整合工具相結合,支持自動程式碼審查
建議77: 進行高效的程式碼審查
建議78: 將包釋出到 PyPI
效能剖析與最佳化
建議79: 了解程式碼最佳化的基本原則
建議80: 借助效能最佳化工具
建議81: 利用 cProfile 定位效能瓶頸
建議82: 使用 memory_profiler 和 objgraph 剖析記憶體使用
建議83: 努力降低演算法復雜度
建議84: 掌握迴圈最佳化的基本技巧
減少迴圈內部的計算
將顯式迴圈改為隱式迴圈,當然這會犧牲程式碼的可讀性
在迴圈中盡量參照局部變量
關註內層巢狀迴圈
建議85: 使用生成器提高效率
建議86: 使用不同的數據結構最佳化效能
建議87: 充分利用 set 的優勢
建議88: 使用 multiprocessing 模組克服 GIL 缺陷
建議89: 使用執行緒池提高效率
建議90: 使用 Cythonb 編寫擴充套件模組