當前位置: 妍妍網 > 碼農

DDD 學習與感悟 —— 向屎山沖鋒

2024-03-21碼農

軟體系統是透過軟體開發來解決某一個業務領域或問題單元而產生的一個交付物。而透過軟體設計可以幫助我們開發出更加健壯的軟體系統。因此,軟體設計是從業務領域到軟體開發之間的橋梁。而DDD是軟體設計中的其中一種思想,旨在提供一種大型復雜軟體的設計思路和規範。透過DDD思想可以讓我們的業務架構、系統架構、部署架構、數據架構、工程架構等都具備高擴充套件性、高維護性和高測試性。

但是落地DDD是一件很困難的事情。首先在思想認知層面就比較難以突破。

DDD本身是一種思想,不是某種具體的技術,因此在程式碼實作和系統架構層面沒有約束。而由於市面上成熟的ORM框架(比如hibernate、mybatis等),使得大部份軟體開發都是直接面向資料庫開發。在傳統開發中的套用分層架構又和DDD思想的分層架構很類似。從而導致很多人在初學DDD時有一定的理解偏差,從而導致無法落地DDD思想。

這篇文章記錄我對DDD的學習、感悟與計畫工程程式碼重構實戰心得!

一、Domin Primitive

領域「後設資料」的意思。主要是講解領域的基本準則。這也是使用DDD思想的基本準則。

1.隱性的概念顯性化

exp:電話號碼通常是由區號編碼+號碼組成。在實際的業務中會有很多需要電話號碼的業務。比如登入認證、導購分銷等業務;我們需要對電話號碼進行基礎性校驗;獲取區號編碼等;在常規操作下,會在每一個用到電話號碼的方法入口都會寫大量的這種校驗程式碼和判斷程式碼,盡管我們可以將它的校驗和獲取區號編碼抽離成util類(實際上大多數工程中都是這麽做的),但這種方式治標不治本。基於DDD思想可以發現這裏有一個隱性概念:區號編碼。

我們可以基於DDD思想,將電話號碼建立為一個擁有獨立概念和行為的值物件:PhoneNumber,將基礎性校驗和獲取編碼等無狀態行為封裝在值物件中。這樣在方法中就不需要再充斥著寫大量的校驗和判斷。

2.隱性的上下文顯性化

exp:在銀行轉賬場景中,通常我們會說A帳戶給B帳戶轉1000元。這裏的1000元實際上有兩層含義,數位1000,貨幣元。但我們通常會忽略貨幣單位元素。導致在實作轉賬功能時,沒有考慮到單位。一旦有國際轉賬時,就又會陷入到大量的if else中。

我們基於DDD思想,將錢建立為一個擁有獨立概念和行為的值物件:Money,這樣我們所說的錢才具備完整的概念。透過這種方式就可以將貨幣這個隱性上下文顯性化,從而避免當前未辨識到但是未來可能會爆雷的bug。

3.封裝多物件行為

exp:在跨境轉賬的場景中,需要轉換匯率,我們可以將轉換匯率封裝成一個值物件。透過封裝金額計算邏輯和各種校驗邏輯,使得整個方法極其簡單。

4.DP和值物件的區別

DP是阿裏大神提出來的概念;值物件是DDD思想中的概念。

學習之後,我個人認為DP是對值物件的進一步補充,使其擁有了更加完整的概念。在值物件【不變性】的基礎上補充了【可校驗性】和【獨立行為】。當然也是要求【無副作用】。所謂的無副作用就是【狀態不可變】。

5.DP和DTO的區別

6.使用DP VS 不使用DP

二、套用架構

1.DDD思想下的標準套用架構

傳統的MVC架構分為展現層、業務邏輯層和數據存取層,更加註重從展現層到數據存取層自上而下的互動,編寫出來的程式碼像是指令碼式程式碼。

而基於DDD原則,工程架構被分為套用層、領域層和基礎設施層。將工程中不同的功能和職責劃分到不同的層級中。核心的業務邏輯放在領域層中。

1)套用層

按照DDD的思想,套用層負責協調使用者介面和領域層之間的互動。可以通俗地認為是對領域服務的編排,其本身不包含任何業務邏輯。

2)領域層

領域層負責實作核心業務的邏輯和規則。按照DDD的思想,這一層包含實體模組、值物件模組、事件、領域服務。

3)基礎設施層

基礎設施層不處理任何業務邏輯,只包含基礎設施,通常包含資料庫、定時任務、MQ、南向閘道器、北向閘道器等。

2.我對演進出六邊形架構的理解

1)再談套用層

在實際業務邏輯當中,除了使用者介面層之外,還有其他外部系統會呼叫本服務,比如xxljob、MQ、或者提供給外部系統呼叫http或者rpc介面等。因此在實際當中,套用層應當是協調外部系統與領域層之間的互動。

按照標準架構層級依賴關系來看,套用層依賴了領域層和基礎設施層。由於依賴了基礎設施層,因此破壞了套用層本身的可維護性和測試性。因此我們需要基於介面進行依賴倒置。

為了防止領域概念外泄,需要對套用層進一步地抽象為外部服務和內部服務,所有外部服務必須透過內部服務呼叫領域層。這樣就可以防止領域模型的外泄。

2)再談領域層

同樣的,按照標準架構層級依賴關系,領域層依賴基礎設施層,但這也破壞了領域層本身的可維護性和可測試性。因此我們基於DDD中的資源庫思想,抽象repository層,透過介面實作依賴反轉。讓領域層不再依賴基礎設施層。從而提高領域層本身的可維護性和可測試性。

3)再談基礎設施層

對於基礎設施層而言,它主要作用是提供基礎設施的能力,比如資料庫、MQ、遠端服務呼叫等。進一步抽象可以發現它們就是埠和介面卡。透過埠實作與外部系統的互動,透過介面卡完成數據和概念的轉換。

4)演進出六邊形架構

透過依賴反轉,神奇的事情發生了。基礎設施層變成了最外層。

我們結合對套用層、領域層和基礎設施層進一步的理解再加上反轉後的套用架構,便可以得到六邊形架構:

3.工具類、配置類的程式碼應該放在哪裏?

在一個實際的工程當中,除了上面所說的三層之外,通常會使用到一些工具類(JSON解析工具類、字串工具類等)。各層可能都會使用到工具類。

從工具類的定位來看,它應當屬於基礎設施層,但是基礎設施層屬於最上層,如果放在基礎設施層,那麽就會破壞依賴順序。因此我們在邏輯劃分上可以把工具類歸類為基礎設施或者通用域,在具體的工程結構中,可以單獨一個模組放工具類。

在實際工程中還有一種型別的程式碼是配置相關的。從業務維度劃分的話可以分為業務類配置和基礎設施類配置。因此我們需要根據配置的型別將其放在對應的位置。比如為了靈活應對業務,我們通常會配置一個動態開關,來動態調整業務的邏輯,這種業務開關類的配置就應該放在領域層;再比如資料庫的配置屬於基礎設施配置,這類配置就應當放在基礎設施層。

4.我對於計畫的六邊形架構的實踐

我們團隊做的的職責是業務底座,包含一系列的基礎能力建設。其中對於IDaaS系統而言,基於六邊形架構實作出以下工程結構:

三、repository模式

1.什麽是repository模式?

在DDD思想中,repository表示資源庫的概念,用於區分數據模型和領域模型。它操作的物件是聚合根,因此它屬於領域層。

2.為什麽要使用repository模式?

repository模式有兩個非常重要的作用:1)與底層儲存進行解耦;2)為解決貧血模型提供了一種規範。

3.什麽是貧血模型?

由於過去ER模型以及主流ORM框架的發展,讓很多開發者對實體的概念還停留在與關系型資料庫對映這個層面。從而導致實體只有空洞的內容,而實體的業務邏輯散落各個service、util、helper、handler等各種角落中。這種現象就被稱為貧血模型現象。

如何判斷自己的工程是否有貧血模型現象?

大量的XxxDO或者Xxx:實體物件只包含與資料庫表對映的內容,沒有行為或者及其少量的行為;

業務邏輯在各種service、controller、util、helper、handler中:實體的業務邏輯散落在不同層級、不同類、不同方法中,相似場景有大量的重復程式碼。

4.為什麽貧血模型不好?

無法保證實體物件的完整性和一致性:貧血模型下,實體內容的狀態和值只能由呼叫方保證,但是內容的get和set是公開的,因此所有呼叫方都可以呼叫。所以無法保證物件的完整性和一致性。

操作實體物件的邊界很難發現:由於物件只有內容,內容的邊界值、呼叫範圍不受實體自身控制,各個地方都可以呼叫,邊界值和範圍也只能由呼叫方自行保障。如果實體的邊界值有所變化,那麽所有呼叫方都需要調整,這種情況下很容易導致bug的產生。

強依賴底層:貧血模型下的實體和資料庫模型對映、協定等。因此如果底層改變,那麽上層邏輯需要全部跟著改變。「軟體」變成了「固件」。

總結一句話:貧血模型下,軟體的可維護性、可延伸性、可測試性極差!

擴充套件:

軟體的可維護性 =底層基礎設施變化時,需要新增/修改的程式碼量是多少(越少可維護性越好)

軟體的可延伸性 =新增或變更業務邏輯時,需要新增/修改的程式碼量是多少(越少可延伸性越好)

軟體的可測試性 =每條TC執行的時長 * 新增或變更業務邏輯時產生的TC(時長越低/TC越少,測試性好)

5.實際情況中,為什麽貧血模型難以消滅?

1)資料庫思維

隨著ER和ORM框架的發展,讓多數開發者在剛入門的時候(自學、培訓等方式),就認為實體就是資料庫表對映;從而簡單的將面向業務領域開發轉變成了面向資料庫開發,漸漸地就認為軟體開發就是CRUD。

2)簡單

盡管有些架構師或者開發人員知道貧血模型不好,但是企業為了占領市場,需要快速推出產品。因此工期被壓縮地很厲害。而貧血模型恰好簡單,在軟體初期階段,可以快速實作業務邏輯。從而迫使開發人員不得不「先實作了再說」。這種現象也是行業的普遍現象。

3)指令碼思維

有些開發人員具備一定的抽象思維,將一些共性的程式碼寫成util、helper、handler等類。但寫程式碼依然是指令碼思維。比如一個方法中,先來個欄位校驗程式碼,再來個物件轉換程式碼,然後呼叫遠端服務,對遠端服務返回的結果再來個物件轉換,……最後呼叫Dao類的方法保存物件。這種程式碼在很多工程中太常見了。

基於這些因素,導致貧血模型難以消滅。

這些因素的根本原因是什麽?

根本原因就是,大部份的開發人員混淆了數據模型和領域模型這兩個概念。

  • 數據模型(Data Model): 數據模型解決的是數據如何持久化、如何傳輸的問題;

  • 領域模型(Domin Model): 領域指的是某一個獨立的業務領域或者問題空間,領域模型就是解決這個業務領域或者問題空間而設計的模型;解決的是業務領域的問題。

  • 在DDD中,repository就是用於區分數據模型和領域模型提出來的概念。

    6.使用repository之後,數據模型和領域模型如何轉換?

    使用repository之後,數據模型和領域模型都各司其職。透過Assembler和Converter進行模型之間的轉換。

    在程式碼中,動態轉換對映 VS 靜態轉換對映

    雖然Assembler/Converter是非常好用的物件,但是當業務復雜時,手寫Assembler/Converter是一件耗時且容易出bug的事情,所以業界會有多種Bean Mapping的解決方案,從本質上分為動態和靜態對映。

    動態對映方案包括比較原始的 BeanUtils.copyProperties、能透過xml配置的Dozer等,其核心是在執行時根據反射動態賦值。動態方案的缺陷在於大量的反射呼叫,效能比較差,記憶體占用多,不適合特別高並行的套用場景。而BeanUtils等copy類工具隱藏了內部copy的過程,很容易引發bug且不易排查。

    MapStruct透過註解,在編譯時靜態生成對映程式碼,其最終編譯出來的程式碼和手寫的程式碼在效能上完全一致,且有強大的註解等能力。會節省大量的成本。

    7.程式碼層面模型規範和比較

    8.程式碼層面repository規範

    1)介面名命名規範

    repository中的介面名不要使用底層儲存的名稱(insert、update、add、delete、query等),而是盡量使用具有業務含義的命名。比如save、remove、find等。

    2)介面的參數規範

    repository操作的物件是聚合根。因此只能操作聚合根或者實體。這樣才能遮蔽底層的數據模型,避免數據模型滲透到領域層。

    四、領域層設計規範

    1.實體類

    大多數DDD架構的核心都是實體類,實體類包含了一個領域裏的狀態、以及對狀態的直接操作。Entity最重要的設計原則是保證實體的不變性(Invariants),也就是說要確保無論外部怎麽操作,一個實體內部的內容都不能出現相互沖突,狀態不一致的情況。

    1)建立即一致

    constructor參數要包含所有必要內容,或者在constructor裏有合理的預設值。

    2)使用Factory模式來降低呼叫方復雜度

    由於建立即一致的原則,導致實體的構造方法可能會很復雜,因此可以使用Factory模式來快速地構造出一個新的實體。降低呼叫方的復雜度。

    3)盡量避免public setter

    一個最容易導致不一致性的原因是實體暴露了public的setter方法,特別是set單一參數會導致狀態不一致的情況。如果需要改變狀態,盡量語意化方法名稱。

    4)透過聚合根保證主子實體的一致性

    通常主實體會包含子實體,這時候主實體就需要起到聚合根的作用,即:

  • 子實體不能單獨存在,只能透過聚合根的方法獲取到。任何外部的物件都不能直接保留子實體的參照

  • 子實體沒有獨立的Repository,不可以單獨保存和取出,必須要透過聚合根的Repository例項化

  • 子實體可以單獨修改自身狀態,但是多個子實體之間的狀態一致性需要聚合根來保障

  • exp:常見的電商域中聚合的案例如主子訂單模型、商品/SKU模型、跨子訂單優惠、跨店優惠模型等。

    5)不可以強依賴其他聚合根實體或領域服務

    一個實體的原則是高內聚、低耦合,即一個實體類不能直接在內部直接依賴一個外部的實體或服務。

  • 對外部物件的依賴性會直接導致實體無法被單測;

  • 以及一個實體無法保證外部實體變更後不會影響本實體的一致性和正確性。

  • 正確依賴外部的方式:

    只保存外部實體的ID:這裏我再次強烈建議使用強型別的ID物件,而不是Long型ID。強型別的ID物件不單單能自我包含驗證程式碼,保證ID值的正確性,同時還能確保各種入參不會因為參數順序變化而出bug。

    針對於「無副作用」的外部依賴,透過方法入參的方式傳入。比如上文中的equip(Weapon,EquipmentService)方法。

    6)任何實體的行為只能直接影響到本實體(和其子實體)

    這個原則更多是一個確保程式碼可讀性、可理解的原則,即任何實體的行為不能有「直接」的」副作用「,即直接修改其他的實體類。這麽做的好處是程式碼讀下來不會產生意外。

    另一個遵守的原因是可以降低未知的變更的風險。在一個系統裏一個實體物件的所有變更操作應該都是預期內的,如果一個實體能隨意被外部直接修改的話,會增加程式碼bug的風險。

    7)可以利用enum來代替繼承關系,後續也可以利用Type Object設計模式來做到數據驅動

    2.領域服務

    當一個業務邏輯需要用到多個領域物件作為輸入,輸出結果是一個值物件時,就說明需要使用到領域服務。

    1)單物件策略型

    這種領域物件主要面向的是單個實體物件的變更,但涉及到多個領域物件或外部依賴的一些規則。

    在這種型別下,實體應該透過方法入參的方式傳入這種領域服務,然後透過Double Dispatch來反轉呼叫領域服務的方法。

    什麽是Double Dispatch

    exp:對於「玩家」實體而言,有一個「equip()」裝備武器的方法。按照常規思路,「玩家」實體需要註入一個EquipmentService,然而實體只能保留自己的狀態,除此之外的其他物件實體無法保證其完整性,因此我們不透過註入的方式使用EquipmentService;而是透過方法參數引入的方式來使用。即「玩家」實體的"equip()"方法定義為:public void equip(Weapon weapon, EquipmentService equipmentService) {if(equipmentService.canEquip(this, weapon)) {this.weaponId = weapon.getId(); }}這種方式就稱為Double Dispatch方式。Double Dispatch是一個使用Domain Service經常會用到的方法,類似於呼叫反轉。

    2)跨物件事務型

    當一個行為會直接修改多個實體時,不能再透過單一實體的方法作處理,而必須直接使用領域服務的方法來做操作。在這裏,領域服務更多地起到了跨物件事務的作用,確保多個實體的變更之間是有一致性的。

    3)通用元件型

    這種型別的領域服務提供了元件化的行為,但本身又不直接綁死在一種實體類上。他的好處是可以透過元件化服務降低程式碼的重復性。

    介面元件化來實作通用領域服務

    exp:在遊戲系統中,原價、NPC、怪物都是可移動的。因此可以設計一個Movable介面,讓玩家、NPC、怪物實體實作Movable介面。然後再實作一個MoveService,從而實作一個移動通用服務。

    3.策略物件(Domain Policy)

    Policy或者Strategy設計模式是一個通用的設計模式,但是在DDD架構中會經常出現,其核心就是封裝領域規則。

    一個Policy是一個無狀態的單例物件,通常需要至少2個方法:canApply 和 一個業務方法。

    canApply方法用來判斷一個Policy是否適用於當前的上下文,如果適用則呼叫方會去觸發業務方法。通常,為了降低一個Policy的可測試性和復雜度,Policy不應該直接操作物件,而是透過返回計算後的值,在Domain Service裏對物件進行操作。

    4.副作用的處理方法 - 領域事件

    什麽是副作用?

    「副作用」也是一種領域規則。一般的副作用發生在核心領域模型狀態變更後,同步或者異步對另一個物件的影響或行為。比如:當用於積分達到100時,會員等級升1級。

    在DDD中,解決「副作用」的手段是領域事件。透過EventBus事件匯流排可以實作領域事件的傳播。

    目前領域事件的缺陷和展望:

    由於實體需要保證完整性,因此不能夠直接依賴EventBus,所以EventBus只能保持全域singleton。但是全域singleton物件很難被單測,這就容易導致Entity物件很難被完整單測覆蓋全。

    五、寫在最後

    透過對於DDD的學習與實踐,越來越能夠體會到它作為一種軟體設計思想和指導,對於大型復雜軟體的建設十分有幫助。對於歷史遺留屎山工程的重構也提供了一個很好的指導方向。

    作者丨孫黎明

    來源丨公眾號:京東雲開發者(ID:JDT_Developers)

    dbaplus社群歡迎廣大技術人員投稿,投稿信箱: [email protected]