.NET 程式碼效能最佳化的總結

2024-02-24碼農

前言

同事發開中遇到了一個程式碼效能最佳化的問題，原本需求是：從一個資料庫中查詢某個表數據，存放到datatable中，然後遍歷datatable，看這些數據在另一個資料庫的表中是否存在，存在的話就要更新，不存在就要插入。

就這個需求本身來說很簡單，但是隨著數據量的增大，之前透過迴圈遍歷的方式就出現了效能問題。

在思索片刻後，給出的建議是分頁查詢和利用事務批次送出。

一、利用資料庫事務批次送出

using (SqlTransaction transaction = targetConnection.BeginTransaction()) { foreach (DataRow row in dataTable.Rows) { if (CheckIfDataExists(targetConnection, transaction, row)) { UpdateData(targetConnection, transaction, row); } else { InsertData(targetConnection, transaction, row); } } transaction.Commit(); } }

下面兩個方法都還可以最佳化，需要接收批次sql語句，所以可以修改成list< SqlCommand>，然後遍歷執行，此處能說明問題即可

privatevoidUpdateData(SqlConnection connection, SqlTransaction transaction, DataRow row) { using (SqlCommand command = new SqlCommand("UPDATE YourTable SET YourUpdateStatement WHERE YourCondition", connection, transaction)) { // Add parameters to your command here, based on your update statement and condition // command.Parameters.AddWithValue("@ParameterName", row["ColumnName"]); command.ExecuteNonQuery(); } } privatevoidInsertData(SqlConnection connection, SqlTransaction transaction, DataRow row) { using (SqlCommand command = new SqlCommand("INSERT INTO YourTable (YourColumns) VALUES (YourValues)", connection, transaction)) { // Add parameters to your command here, based on your columns and values // command.Parameters.AddWithValue("@ParameterName", row["ColumnName"]); command.ExecuteNonQuery(); } }

看到這裏的時候，大家可以考慮下，以上方案還有什麽最佳化的地方嗎？

當然是有的，如果數據量持續增大，datatable這樣直接載入到記憶體的方式恐怕會成為效能問題點吧，我們得考慮怎麽最佳化才能避免將大數據一次性載入到記憶體，大部份同學第一個想到的就是分頁，這個方案當然是沒有錯，但是還不夠高級，給大家提示一個關鍵字「yield」，或許從聰明的你已經悟到了，接著往下看。

二、流式處理法

什麽是流式處理法呢？

流式處理是一種處理數據的方式，它允許你在數據到達時立即處理，而不是等待所有數據都到達後再處理。

這種方式特別適合處理大量數據，因為它不需要一次性載入所有數據到記憶體中。

在C#中，你可以使用 yield return 關鍵字來建立一個返回 I Enumerable<T> 的方法，這個方法可以在每次叠代時返回一個元素，而不是一次性返回所有元素。

這就是一種流式處理的實作方式。

舉個例子：

private IEnumerable<DataRow> GetDataFromSource() { using (SqlConnection sourceConnection = new SqlConnection(sourceConnectionString)) { sourceConnection.Open(); using (SqlCommand command = new SqlCommand("SELECT * FROM YourTable", sourceConnection)) { using (SqlDataReader reader = command.ExecuteReader()) { DataTable dataTable = new DataTable(); while (reader.Read()) { dataTable.LoadDataRow(reader.GetValues(), LoadOption.Upsert); DataRow row = dataTable.Rows[dataTable.Rows.Count - 1]; yieldreturn row; dataTable.Clear(); } } } }