$4 blog: LeetCode

顯示具有 LeetCode 標籤的文章。顯示所有文章

2026年4月9日星期四

🚀 LeetCode 3653 解題解析：從暴力解到「根號分治 × 乘法差分陣列」

題目連結：3653. XOR After Range Multiplication Queries I

這道題目要求我們對一個陣列進行多次查詢：每次以固定的步伐 k，將區間 [l, r] 內（每隔 k 步）的元素乘上某個數字 v，最後求整個陣列的 XOR 總和。

如果測資很小，雙層 for 迴圈就能輕鬆解決；但如果陣列長度 N 和查詢次數 Q 都高達十萬呢？這時就需要拿出更高階的武器了！

🛑 第一步：為什麼原本的方法會慢？（痛點分析）

讓我們先回顧一下原本直覺的寫法：

for l, r, k, v in queries:
    for i in range(l, r + 1, k):
        nums[i] = (nums[i] * v) % MOD

  想像一下最壞的情況：

  假設陣列長度 N = 100,000，然後有一萬筆查詢，每一筆的步伐 k = 1（也就是每次都要修改整個陣列）。

  這時，內層迴圈每次都要跑十萬次，總共要跑 10,000 × 100,000 = 1,000,000,000（十億）次！程式絕對會跑到超時 (Time Limit Exceeded)。

💡 發現問題點： 當步伐 k 很小的時候，我們會浪費大量的時間在迴圈上。

⚔️ 第二步：降維打擊武器一 ——「根號分治」(分塊)

既然 k 很小的時候會出問題，那我們就根據 k 的大小來「分工合作」吧！這就是根號分治 (Square Root Decomposition) 的核心思想。

我們設定一個界線，通常是陣列長度的平方根，也就是 B = √N（當 N=100,000 時，B ≈ 316）。我們把查詢分成兩派：

🏃‍♂️ 大步伐派 (k > B)： 因為步伐很大（每次至少跳 316 格），就算跑完整個陣列，最多也只會跳 316 次。次數非常少！對於這類查詢，我們直接使用原本的 for 迴圈暴力更新，速度其實非常快。
🚶‍♂️ 小步伐派 (k ≤ B)： 步伐很小，每次查詢都要跳好幾萬次。對於這類查詢，我們絕對不能用迴圈慢慢跳，我們需要引入下一個武器來「批次處理」。

🛡️ 第三步：降維打擊武器二 ——「乘法差分陣列」

對於小步伐的查詢，我們怎麼批次處理呢？答案是 差分陣列 (Difference Array)。

想像一個情境：你要在 [l, r] 區間內的所有數字都乘上 v。

傳統做法： 一個一個乘。
差分做法： 我只在起點 l 做個記號「從這裡開始乘上 v」，然後在終點的下一格 r + 1 做個記號「從這裡開始取消乘上 v 的影響」。最後，我只要從頭走到尾掃描一次，就能把這些記號擴散到整個陣列！

⚠️ 致命的數學陷阱：如何取消乘法？
在普通的數學裡，要取消「乘以 v」，我們只要「除以 v」就好。
但是！我們的題目要求對 10**9 + 7 取餘數 (% MOD)。在有取餘數的世界裡，除法是會壞掉的！

這時，我們就要請出 Python 的內建魔法：模逆元 (Modular Multiplicative Inverse)。
簡單來說，模逆元就是一個神奇的數字，當你乘上這個數字時，效果就等同於「除以 v」。

在 Python 3.8 以後，計算模逆元只需要一行程式碼：

inv_v = pow(v, -1, MOD)  # 取得 v 的模逆元，完美代替除法！

💡 為什麼需要「差分陣列」？（用最簡單的話說）

先忘記乘法，想一下加法。如果我要把陣列中 [1] 到 [5] 的位置都 +10。
笨方法是：a[1]+=10, a[2]+=10, a[3]+=10, a[4]+=10, a[5]+=10。
聰明方法（差分）是：我只在起點做記號 diff[1] += 10，然後在終點的下一格做記號 diff[6] -= 10。
最後我只要「從左到右，把前一格的數字加到自己身上（前綴和）」，魔法就會發生：

i=1: 拿到 +10
i=2: 繼承前一格的 +10
... 一路繼承 ...
i=6: 繼承了 +10，但是遇到自己這格的 -10，互相抵銷變成 0！從這裡開始又恢復原狀。

🔄 從「加法」變成「乘法」

這題只是把加法變乘法：

加法的起點是 +v，乘法的起點就是 *v。
加法的終點抵銷是 -v，乘法的終點抵銷就是 /v（也就是乘上模逆元 v⁻¹）。

🦘 加入「步伐 k」的跳躍魔法

這題更進階的地方在於，我們不是連續修改，而是每隔 k 步修改一次。

假設操作是：從 l=1 開始，到 r=5 結束，步伐 k=2，乘上 v=10。
實際要修改的位置是：1, 3, 5。

第一步：做記號

起點：diff[1] *= 10
終點外：我們實際上跳了 3 次（1, 3, 5），下一次會跳到哪？1 + 3 * 2 = 7。所以在越界的第一個位置做抵銷記號：diff[7] *= 10⁻¹

第二步：跳躍式前綴積展開

以前是「加上前一格」，現在因為步伐是 k=2，我們改成「乘上自己往前退 k 格的數字」。我們來跑一次看看：

一開始的 diff: [1, 10, 1, 1,  1,  1,  1, 10⁻¹]
(index)         0   1  2  3   4   5   6   7

從左到右，每個數字乘上「往前 2 格」的數字：
i=0: 1
i=1: 10
i=2: 1 * (往前2格的 diff[0]=1) = 1
i=3: 1 * (往前2格的 diff[1]=10) = 10  ✅ 成功傳遞給 3 了！
i=4: 1 * (往前2格的 diff[2]=1) = 1
i=5: 1 * (往前2格的 diff[3]=10) = 10  ✅ 成功傳遞給 5 了！
i=6: 1 * (往前2格的 diff[4]=1) = 1
i=7: 10⁻¹ * (往前2格的 diff[5]=10) = 1 ✅ 10 和 10⁻¹ 抵銷，變回 1，停止傳遞！

最後展開的 diff 就變成了：[1, 10, 1, 10, 1, 10, 1, 1]。
只有 1, 3, 5 這三個位置變成了 10！然後我們再把這個展開後的 diff 乘回原本的 nums 陣列，就大功告成了！

⚡ 核心加速關鍵：為什麼要「依照步數 k」分組 (Grouping)？

差分陣列本身只是工具，「把相同步伐 k 的查詢合併處理」才是真正的加速引擎。

讓我們來算一筆帳，假設有 10,000 筆查詢，其中有 5,000 筆的步伐都是 k=2。

❌ 做法一：不分組（每來一筆查詢就做一次差分展開）

拿一筆 k=2 的查詢，在 diff 陣列做頭尾記號 (2次操作)。
掃描一次陣列進行「前綴積展開」，把記號擴散出去 (N 次操作，約 100,000 次)。
把這 5,000 筆 k=2 的查詢都這樣做...
總運算量： 5,000 × 100,000 = 500,000,000（五億次，還是會超時！）

✅ 做法二：依照步伐分組（批次處理）

我們先不急著展開。把這 5,000 筆 k=2 的查詢，全部先在同一個 diff 陣列上「做記號」。
做記號非常快，每筆查詢只要修改頭尾兩個數字。5,000 筆查詢做完記號，只需要 10,000 次操作。
等這 5,000 筆的記號都做完了，我們只做「一次」前綴積展開 (100,000 次操作)。
在這次展開中，5,000 個區間的病毒與解藥會「同時」互相疊加、傳染、抵銷。
總運算量： 10,000 (做記號) + 100,000 (一次展開) = 110,000（十一萬次，整整快了近 5000 倍！）

這就是為什麼要配合「根號分治」：
因為我們規定小步伐派的 k ≤ B (約 316)。這代表我們最多只需要展開 316 次！
無論有幾萬筆小步伐查詢，它們都會被分類到這 316 個桶子裡。每個桶子（每種 k）只要花 O(N) 的時間展開一次。
因此，處理所有小步伐查詢的總時間被嚴格限制在 316 × 100,000 ≈ 3千萬次 以內，這在 1 秒的時限內綽綽有餘！

🚧 為什麼不同的步數 (k) 不能共用同一個差分陣列？

這是一個非常敏銳的問題！答案藏在「展開（前綴積）的公式」裡。

讓我們回顧一下展開差分陣列的那行程式碼：

diff[i] = diff[i] * diff[i - k]

致命衝突：記號本身是「沒有記憶」的

假設我們硬把 k=2 和 k=3 的查詢，都做記號在同一個 diff 陣列裡：

查詢A (k=2)：在 diff[1] 標記了 *10
查詢B (k=3)：在 diff[2] 標記了 *99

現在陣列長這樣：diff = [1, 10, 99, 1, 1, 1...]

問題來了！當我們要掃描陣列把記號擴散出去時，我們該用哪種步伐 k 呢？

如果用 k=2 展開：diff[1] 的 10 會正確傳給 diff[3]。但是！diff[2] 上的 99（本來是 k=3 專用的），也會被當成 k=2，錯誤地傳給 diff[4]！
如果用 k=3 展開：diff[2] 的 99 會正確傳給 diff[5]。但是 diff[1] 上的 10 會被錯誤地傳給 diff[4]。

白話文比喻：

這就像是車站裡有「每 2 站停一次的區間車」和「每 3 站停一次的快車」。
你在第 1 站放了一個包裹 (記號)。如果沒有分開月台（不同的 diff 陣列），當列車進站時，包裹根本不知道自己該上哪一班車！它只是一個數字，無法告訴展開的迴圈：「嘿！我是屬於 k=2 的，請每隔 2 格複製我一次。」

結論：

因為擴散的步伐（傳染的方向）是由展開時的 k 決定的，所以：
👉 同一個 diff 陣列在展開時，只能服務一種 k。
這就是為什麼我們要在外層寫一個 for k in range(1, B + 1):，每次輪到一個新的 k，我們就把 diff 陣列清空重置，讓它專心只處理這批步伐為 k 的包裹！

🧩 第四步：將所有拼圖組合起來 (完整程式碼解析)

現在我們擁有了所有武器，來看看完整的高階寫法是如何運作的：

import math
from typing import List

class Solution:
    def xorAfterQueries(self, nums: List[int], queries: List[List[int]]) -> int:
        MOD = 10**9 + 7
        n = len(nums)
        
        # 【策略一：根號分治】計算閾值 B
        B = max(1, math.isqrt(n))
        
        # 準備空陣列，用來依照步長 k 分組存放小步伐查詢
        grouped_queries = [[] for _ in range(B + 1)]
        
        # 分流查詢
        for l, r, k, v in queries:
            if v == 1: continue  # 小優化：乘數為 1 不改變數字
            
            if k <= B:
                # 步伐小，存起來等一下批次處理
                grouped_queries[k].append((l, r, v))
            else:
                # 步伐大，直接暴力更新 (次數保證小於 B)
                for i in range(l, r + 1, k):
                    nums[i] = (nums[i] * v) % MOD
        
        # 【策略二：乘法差分】處理小步伐查詢
        diff = [1] * n
        for k in range(1, B + 1):
            if not grouped_queries[k]: continue
            
            # 每次換新的步長 k，重置差分陣列
            for i in range(n): diff[i] = 1
            
            for l, r, v in grouped_queries[k]:
                # 1. 區間起點：標記乘上 v
                diff[l] = (diff[l] * v) % MOD
                
                # 2. 區間終點外：計算越界的第一個位置
                num_steps = (r - l) // k
                next_idx = l + (num_steps + 1) * k
                
                if next_idx < n:
                    # 標記乘上 v 的反元素 (相當於除以 v，用來抵銷)
                    inv_v = pow(v, -1, MOD)
                    diff[next_idx] = (diff[next_idx] * inv_v) % MOD
            
            # 3. 前綴積展開：將記號擴散回原陣列
            for i in range(n):
                if i >= k:
                    diff[i] = (diff[i] * diff[i - k]) % MOD
                if diff[i] != 1:
                    nums[i] = (nums[i] * diff[i]) % MOD
                    
        # 【最終收尾】：計算 XOR 總和
        result = 0
        for num in nums:
            result ^= num
            
        return result

🚀 進階優化：極致的效能突破 (殘差類掃描)

如果把上述的「標準版根號分治」提交，已經能順利通過。但你會發現有些解法跑得快上數倍，這是因為標準寫法中仍有許多可以壓榨效能的空間。以下是四個極致優化的關鍵：

1. 只處理「真正出現」的步伐 k

標準版中，for k in range(1, B + 1) 會跑滿所有可能的 k 值（例如 316 次），即使某些 k 根本沒有出現在查詢中。進階版改用字典 (Dictionary)，只迭代有實際查詢的 k。

2. 捨棄 O(N) 的全域陣列重置

標準版每換一個 k，就要花 O(N) 把整個 diff 陣列清為 1。進階版不再使用全域 diff，而是只把「事件 (起點與終點)」存起來，省去了巨大的重置開銷。

3. 殘差類 (Residue Class) 獨立掃描

這是最核心的架構改變。我們把查詢按照起點 l % k 分組（稱為殘差類）。例如 k=2 時，分成了「奇數索引組」和「偶數索引組」。

每個殘差類內的事件各自排序。
掃描時，用雙指標 (Two Pointers) 順著步長 k 往前跳，中途遇到事件就即時套用乘數。
好處：如果某個殘差類完全沒有查詢，就可以直接跳過，連掃描都不用掃！

4. 延遲寫回 nums (Lazy Update)

標準版每處理完一種 k，就去更新一次 nums 陣列。進階版準備了一個 factors 陣列來累積所有小步伐的乘積，最後才統一更新到 nums 陣列，將記憶體寫入次數降到最低。

以下是融合了上述所有優化技巧的「極速版」程式碼：


from typing import List
import math
from collections import defaultdict

class Solution:
    def xorAfterQueries(self, nums: List[int], queries: List[List[int]]) -> int:
        MOD = 10**9 + 7
        n = len(nums)
        if n == 0: return 0
        
        # 【策略一：根號分治】
        B = int(math.sqrt(n)) + 1
        
        # 只記錄有出現的小步伐查詢
        small = defaultdict(list)
        
        # 處理大步伐 (直接暴力做)
        for l, r, k, v in queries:
            if k >= B:
                idx = l
                while idx <= r:
                    nums[idx] = (nums[idx] * v) % MOD
                    idx += k
            else:
                small[k].append((l, r, v))
                
        # factors 用來累積所有小步伐造成的最終乘數
        factors = [1] * n
        
        # 【策略二：殘差類掃描 (Residue Class Sweep)】
        for k, qlist in small.items():
            # 依照 l % k 分組記錄事件
            events = [[] for _ in range(k)]
            
            for l, r, v in qlist:
                res = l % k
                step = (r - l) // k
                last = l + step * k
                
                # 放入事件：(起點, 乘上 v)
                events[res].append((l, v))
                
                # 放入事件：(終點外, 乘上 v 的模逆元抵銷)
                end_idx = last + k
                if end_idx < n:
                    inv_v = pow(v, MOD - 2, MOD) # 費馬小定理求模逆元
                    events[res].append((end_idx, inv_v))
                    
            # 針對每個殘差類獨立掃描
            for res in range(k):
                ev = events[res]
                if not ev: continue
                
                ev.sort() # 依照 index 排序事件
                cur_multiplier = 1
                ptr = 0
                m = len(ev)
                
                # 順著步伐 k 跳躍掃描
                i = res
                while i < n:
                    # 如果走到事件觸發點，更新目前的乘數
                    while ptr < m and ev[ptr][0] == i:
                        cur_multiplier = (cur_multiplier * ev[ptr][1]) % MOD
                        ptr += 1
                        
                    factors[i] = (factors[i] * cur_multiplier) % MOD
                    i += k
                    
        # 【最終收尾】統一將累積的乘數寫回 nums，並計算 XOR
        ans = 0
        for i in range(n):
            nums[i] = (nums[i] * factors[i]) % MOD
            ans ^= nums[i]
            
        return ans

🌟 同場加映：極速版 C++ 實作

競技程式設計界最受歡迎的 C++ 實作版本。邏輯與上述 Python 極速版完全相同，加上了快速冪 (Binary Exponentiation) 來手動實作模逆元，在 LeetCode 上能達到極低的執行時間與記憶體消耗。

#include <vector>
#include <cmath>
#include <unordered_map>
#include <algorithm>

using namespace std;

class Solution {
public:
    int xorAfterQueries(vector<int>& nums, vector<vector<int>>& queries) {
        long long MOD = 1e9 + 7;
        int n = nums.size();
        if (n == 0) return 0;
        
        // 【策略一：根號分治】
        int B = sqrt(n) + 1;
        
        // 紀錄小步伐查詢
        unordered_map<int, vector<vector<int>>> small;
        
        // 處理大步伐
        for (const auto& q : queries) {
            int l = q[0], r = q[1], k = q[2], v = q[3];
            if (v == 1) continue; // 小優化：乘數為 1 不改變數字
            
            if (k >= B) {
                int idx = l;
                while (idx <= r) {
                    nums[idx] = (1LL * nums[idx] * v) % MOD;
                    idx += k;
                }
            } else {
                small[k].push_back({l, r, v});
            }
        }
        
        // factors 用來累積所有小步伐的乘數
        vector<long long> factors(n, 1);
        
        // 快速冪 (用於費馬小定理求模逆元)
        auto power = [&](long long base, long long exp) {
            long long res = 1;
            base %= MOD;
            while (exp > 0) {
                if (exp % 2 == 1) res = (res * base) % MOD;
                base = (base * base) % MOD;
                exp /= 2;
            }
            return res;
        };
        
        // 【策略二：殘差類掃描】
        for (const auto& [k, qlist] : small) {
            // events[res] 存放 (index, factor) 對
            vector<vector<pair<int, long long>>> events(k);
            
            for (const auto& q : qlist) {
                int l = q[0], r = q[1];
                long long v = q[2];
                
                int res = l % k;
                int step = (r - l) / k;
                int last = l + step * k;
                
                events[res].push_back({l, v});
                
                int end_idx = last + k;
                if (end_idx < n) {
                    long long inv_v = power(v, MOD - 2);
                    events[res].push_back({end_idx, inv_v});
                }
            }
            
            // 獨立掃描每個殘差類
            for (int res = 0; res < k; ++res) {
                auto& ev = events[res];
                if (ev.empty()) continue;
                
                sort(ev.begin(), ev.end());
                
                long long cur_multiplier = 1;
                int ptr = 0;
                int m = ev.size();
                
                // 順著步伐 k 往前跳
                for (int i = res; i < n; i += k) {
                    while (ptr < m && ev[ptr].first == i) {
                        cur_multiplier = (cur_multiplier * ev[ptr].second) % MOD;
                        ptr++;
                    }
                    factors[i] = (factors[i] * cur_multiplier) % MOD;
                }
            }
        }
        
        // 統一寫回 nums 並計算 XOR
        int ans = 0;
        for (int i = 0; i < n; ++i) {
            nums[i] = (1LL * nums[i] * factors[i]) % MOD;
            ans ^= nums[i];
        }
        
        return ans;
    }
};

🌍 走出競技場：這些技巧在工業界的真實身影

這道題目中用到的技巧，剝開數學的外衣後，其實就是工業界底層系統架構的核心哲學。我們來看看它們在真實世界中的對應：

1. 📷 影像處理 (Computer Vision)

積分圖 (Integral Image) = 二維前綴和/差分：
在早期非常著名的 Viola-Jones 人臉偵測演算法 中，需要瘋狂計算圖片中任意矩形區域的像素總和。如果每次都用雙層迴圈加總，相機根本無法做到即時偵測。解法就是建構一張「積分圖」（二維前綴和）。建好之後，不管矩形多大，只要查表 4 個頂點的座標做加減，O(1) 就能得到總和！這就是差分陣列的二維直系血親。
Bayer 濾色陣列與步伐 k：
相機感光元件 (CMOS) 上的像素排列通常是 RGGB（Bayer pattern）。如果你要對所有的綠色 (G) 像素做白平衡補償，你就必須在記憶體中進行「跨步 (Strided)」的陣列修改。這就是我們題目中 k=2 步伐操作的物理硬體展現。

2. 🧠 AI 與深度學習 (Deep Learning)

FlashAttention = 分塊處理 (Tiling / Block Decomposition)：
最近幾年大語言模型 (LLM) 最重要的突破之一就是 FlashAttention。當輸入文本很長時，Attention 矩陣會大到 GPU 記憶體塞不下。FlashAttention 的做法就是「分塊 (Tiling)」：把大矩陣切成一塊塊能塞進 GPU 超高速 SRAM 的小區塊，算完再合併。這與「根號分治 (把 N 切成 √N 的區塊)」在精神上完全一致：根據硬體的極限（閾值 B）來決定任務的切分方式。
空洞卷積 (Dilated Convolution) = 跳躍 k 步的修改：
在影像語意分割 (如 DeepLab) 中，為了在不增加計算量的情況下擴大 AI 的「視野 (Receptive Field)」，卷積核會「跳著」掃描像素（例如每隔 2 格、4 格取樣）。這與我們題目的跳躍步伐 k 概念如出一轍。
線性 RNN (如 Mamba, RWKV) = 前綴積的極致：
為了取代 Transformer 龐大的注意力機制，最新的架構利用「前綴和 / 前綴積 (Cumulative Sum/Prod)」的概念，把歷史的對話記憶壓縮成一個狀態向量（只跟前一時刻有關），這正是我們在差分陣列最後一步 diff[i] = diff[i] * diff[i-k] 所做的事情！

3. 🐧 Linux Kernel 與底層系統

差分陣列的靈魂 = 延遲計算 (Lazy Evaluation) & 批次寫入：
差分陣列的本質是「先記帳，最後再一次結帳」。這在 Linux 裡無處不在：
- Page Cache (Dirty Pages)： 寫入檔案時不會立刻動到硬碟，而是在記憶體標記 Dirty（像差分做記號），等到作業系統覺得夠多了，再一次 Flush 到磁碟（像前綴和展開）。
- CFS (完全公平排程器)： 在計算 CPU 任務的虛擬運行時間 (vruntime) 時，Kernel 也是累積時間的 Delta (差值)，而不是每個 CPU 時脈週期都去更新所有 Process 的樹狀結構。
大小任務分流 (Heavy/Light Routing)：
我們在演算法中把查詢分成「大步伐」和「小步伐」。在網路封包處理（如 Linux NAPI）或中斷處理 (Interrupt Handling) 中，如果封包量少（小任務），就觸發中斷；如果封包量如海嘯般湧來（大任務），網卡驅動會關閉中斷，改用「輪詢 (Polling)」把封包整批掃進來。這就是真實世界的根號分治：根據流量的閥值，切換兩種完全不同的處理策略！

總結：
你在這題看到的「差分陣列」，在系統工程裡叫做 Delta Tracking (差分追蹤) 或 Lazy Evaluation (延遲計算)。
你看到的「根號分治」，在系統工程裡叫做 Tiling (快取分塊) 或 Heavy/Light Routing (冷熱路徑分流)。
演算法題目，其實就是把這些複雜的系統瓶頸，抽象成了純粹的數學遊戲！

🎉 總結

透過「根號分治」，我們巧妙地避開了 k 極大或極小的極端情況；再透過「乘法差分」與 Python 的 pow(v, -1, MOD)，我們把複雜的多次區間操作，壓縮成了輕鬆的頭尾標記。這就是演算法之美！

喜歡這篇解析的話，也歡迎到 LeetCode 3653 實際挑戰看看！

2026年3月14日星期六

從 LeetCode 到 Linux Kernel 的工程智慧：解構「快樂字串」

在程式設計的領域中，有些題目表面上是排列組合的益智遊戲，但深挖其背後的邏輯，你會發現它觸及了計算機科學最核心的課題：如何在有限限制下，進行極致的資源調度與導航。

今天我們要聊的是 LeetCode 的「快樂字串」（Happy String）問題。

什麼是快樂字串？

一個長度為 n 的字串被稱為「快樂字串」，需滿足：

僅由 {'a', 'b', 'c'} 組成。
無連續重複：相鄰的字元不能相同（例如 "aba" 是快樂的，但 "aa" 不是）。

任務是：在所有按字典序排列的快樂字串中，找出第 k 個。

階段一：直覺的探索 —— 回溯法 (Backtracking)

最直覺的方法是透過深度優先搜尋（DFS）來模擬人類構思字串的過程。

程式碼實作

class Solution {
    bool solve(string& ans, int n, int& k) {
        if (ans.size() == n) {
            return --k == 0; // 找到第 k 個組合時停止
        }
        for (char c : {'a', 'b', 'c'}) {
            if (!ans.empty() && c == ans.back()) continue; // 核心約束
            
            ans.push_back(c);
            if (solve(ans, n, k)) return true; // 提早回傳
            ans.pop_back(); // 回溯
        }
        return false;
    }
public:
    string getHappyString(int n, int k) {
        string ans = "";
        return solve(ans, n, k) ? ans : "";
    }
};

工程思考

這種方法就像是在迷宮中探路。雖然直觀，但當 n 變大時，搜尋空間會呈指數級成長。在系統底層開發中，過深的遞迴會導致 Stack Overflow，這在核心（Kernel）環境中是絕對要避免的。

階段二：極致的跳轉 —— 數學定位法 (Mathematical Positioning)

如果我們能不透過「走迷宮」，而是直接「空降」到第 k 個字串呢？

觀察規律發現：第一個字元決定後，後續每個位置都只有 2 種選擇。這意味著這是一個變相的 二進位導航系統。

最佳化程式碼

class Solution {
public:
    string getHappyString(int n, int k) {
        int m = 1 << (n - 1); // 每個分支的組合數 (2^(n-1))
        if (3 * m < k) return ""; // 總數檢查

        string ans = "";
        k--; // 轉為 0-indexed 處理區間
        
        // 1. 確定首位字元
        ans.push_back('a' + k / m);
        k %= m;

        // 2. 數學跳轉確定後續字元
        for (int i = 1; i < n; ++i) {
            m >>= 1; // 剩餘組合數減半
            char next = 'a' + (k / m);
            if (next >= ans.back()) next++; // 巧妙排除重複，維持字典序
            
            ans.push_back(next);
            k %= m;
        }
        return ans;
    }
};

深入核心：Linux Kernel 中的精準對應

我們在上述數學解法中使用了兩個核心技巧：「基於 2 的冪次方的空間劃分」與「前置狀態的數學補償」。在 Linux 核心中，這兩個技巧有著極其精準的對應實例。

實例 A：二進位空間劃分 —— 夥伴系統 (Buddy System)

在快樂字串中，我們利用 m = 1 << (n - 1) 來確定區間，並用除法與餘數直接定位分支。在 Linux 的記憶體管理核心 mm/page_alloc.c 中，著名的**夥伴系統（Buddy Allocator）**使用了完全一樣的數學邏輯來分配實體記憶體。

當系統釋放一個大小為 2^order 的記憶體區塊時，它必須找到相鄰的「夥伴（Buddy）」來合併。核心絕對不會去遍歷記憶體，而是直接透過位元運算算出夥伴的精確位置：

/* Linux Kernel: mm/page_alloc.c 核心邏輯簡化 */
static inline unsigned long
__find_buddy_pfn(unsigned long page_pfn, unsigned int order)
{
    // 利用 XOR 和 1 << order 直接算出相鄰區塊的位置
    // 就像我們用 k / (1 << (n-1)) 定位分支一樣，純數學、零迴圈！
    return page_pfn ^ (1 << order);
}

精準對應：這與我們處理快樂字串時，依賴 $2$ 的冪次方（二進位樹狀結構）來進行 $O(1)$ 的空間跳轉與定位，在數學本質上完全一致。

實例 B：相鄰約束的 $O(1)$ 跳轉 —— 格雷碼 (Gray Code)

快樂字串的最核心限制是：相鄰元素不能重複。我們用了一行神來之筆 if (next >= ans.back()) next++，在 $O(1)$ 時間內算出第 $k$ 個符合約束的狀態。

在 Linux 驅動程式（特別是旋轉編碼器 drivers/input/misc/rotary_encoder.c 等硬體）中，也有一個嚴格的相鄰約束：相鄰的狀態只能有 1 個位元不同（避免硬體雜訊）。這稱為格雷碼（Gray Code）。

工程師如何找出第 $k$ 個符合約束的格雷碼？他們不會從 0 開始生成並檢查相鄰狀態，而是直接套用數學偏移公式：

/* Linux Kernel 中常見的格雷碼轉換邏輯 */
unsigned int binary_to_gray(unsigned int k)
{
    // 透過自己與自己右移一位的值做 XOR，直接計算出第 k 個合法狀態
    // 完美滿足「相鄰狀態約束」，且是 O(1) 的純數學計算
    return k ^ (k >> 1);
}

精準對應：快樂字串的約束是「相鄰字元不同」，格雷碼的約束是「相鄰位元僅一處不同」。兩者都放棄了狀態機遍歷（Backtracking），轉而發掘出**「將序號 $k$ 透過偏移/補償，直接對射到合法狀態空間」**的終極數學公式。

跨領域的共鳴：AI、遊戲生成與空間定位

這種「拒絕盲目搜尋，改用數學約束或狀態機直接算出解」的思想，不僅限於底層作業系統。在當今最前沿的領域中，它更是解決效能瓶頸的核心技術。

1. 大型語言模型 (LLM) 的受限解碼 (Constrained Decoding)

在 LLM 的推論過程中，生成文字的本質就是在「巨大的字彙庫中尋找下一個合法的 Token」。這與我們找快樂字串的字元非常相似。當我們要求 LLM 嚴格輸出特定格式（如 JSON）時，現代推論引擎（如 vLLM, Guidance）會使用有限狀態機 (FSM)。在生成每個 Token 前，系統會先「計算」出目前狀態下哪些字元是合法的（就像我們排除 ans.back()），並將不合法 Token 的機率強制歸零。這保證了模型一步到位生成完美格式，徹底避免了昂貴的回溯與重寫。

2. 電腦圖學與遊戲開發 (Procedural Generation)

在《Minecraft》這類擁有無限大世界的遊戲中，系統不可能把整個地圖存下來，也不可能在玩家移動時慢慢「搜尋」該生成什麼地形。開發者使用了 Perlin Noise 等純數學函數：只要給定一個座標 $(x, y)$（就像是我們題目中的 $k$），系統就能透過位元運算與雜湊，在 $O(1)$ 時間內直接「算出」這格的地形，且完美滿足相鄰區塊平滑過渡的約束條件。

3. 空間資料庫與希爾伯特曲線 (Hilbert Curve)

Google Maps 或外送平台需要在資料庫中快速找到目標。但地圖是 2D 的，而資料庫索引是 1D 的。科學家發明了空間填充曲線：給定一個 1D 序號 $k$，可以透過一系列精妙的位元運算，直接算出它在地圖上的 $(x, y)$ 座標，完全不需遍歷地圖。這與我們算出「第 $k$ 個快樂字串」的數學原理（空間劃分與位移）屬於同一個家族的工程魔法。

結語：從搜尋者進化為計算者

從回溯法進化到數學定位法，代表了程式設計師思維的轉變：從「一個個去試」的狀態搜尋，進化到「洞察規則」後的直接數學對射。

只要問題具備「狀態空間極大」與「明確的相鄰約束」兩大特徵，頂尖的工程師永遠會找出隱藏的數學規律，透過空間映射、位元運算與狀態掩碼，將複雜的搜尋問題降維打擊成常數時間的計算。這種對系統與數學的雙重敏銳度，正是頂尖架構師的標誌。

本文為「程式夥伴」專題系列，探討演算法與底層工程的連結。

2026年3月12日星期四

從 LeetCode 3600 看工程思維：極致效能 vs 萬用架構

在面對演算法挑戰時，我們常常會陷入「尋求最快解」的迷思。然而，在真實世界的軟體工程中，最快的演算法真的永遠是最好的選擇嗎？

今天我們透過 LeetCode 3600: Maximize Spanning Tree Stability with Upgrades 這道經典的圖論題，來看看兩種截然不同的解題思路，以及它們在現實工業界中各自稱霸的真實場景。

題目背景：尋找最穩定的生成樹

這道題目的核心目標是：在給定的一張圖中，挑選出 $N-1$ 條邊形成「生成樹 (Spanning Tree)」。其中有些邊是「必選的」，有些是「可選的」。我們手上有 $K$ 次升級機會，可以將可選邊的強度乘以 2。 目標：最大化這棵樹的「最弱連結 (最小邊緣強度)」。

面對這個「最大化最小值」的難題，我們有兩種截然不同的解題策略。

策略一：二分搜尋 + 貪心驗證 (Binary Search on Answer)

這是一個非常扎實且通用的工程思維：我們不知道答案是多少，但我們可以「猜」。

運作邏輯：

確定答案的上下界（例如強度從 $0$ 到 $100,000$）。
猜測一個目標值 mid，並寫一個 check(mid) 函數來驗證：「在 $K$ 次升級內，我們能不能讓所有挑選的邊，強度都 $\ge mid$？」
根據驗證結果，不斷縮小範圍，直到找到極限值。

💡 真實世界的應用場景：高擴充性的「萬用框架」

這個演算法雖然時間複雜度多了一個 $\log M$，但在真實的工程應用中，它卻具有壓倒性的擴充性 (Extensibility)！

電信網路的 SLA 保證與預算規劃 中華電信或 AWS 要牽線連接全球的資料中心，並保證最低可用頻寬。公司今年只給了預算購買 $K$ 台「訊號放大器」。網路架構師會透過這個演算法「二分猜測」保證頻寬，驗證預算是否足夠，藉此找出基礎建設的投資報酬率極限。
EDA (電子設計自動化) 與晶片佈線 晶片設計中，工程師可以在線路上插入 Buffer（緩衝器）來增強訊號，但 Buffer 非常耗電且最多只能放 $K$ 個。軟體會猜測最差的訊號延遲時間，去驗證這 $K$ 個 Buffer 該怎麼放。
為什麼它無可取代？ 真實世界的規則往往不講武德。如果今天老闆說：「A 線路升級加 500、B 線路升級乘以 1.5、C 線路升級需要消耗 2 次升級機會...」純數學推導會瞬間崩潰，但二分搜尋版完全不受影響！你只需要在 check() 函數裡加上幾行 if-else，這個演算法就能完美存活。

策略二：Kruskal 演算法變形 (Pure Greedy)

這是一個將圖論數學性質發揮到極致的 $O(E \log E)$ 神級解法。它捨棄了「猜答案」，直接在一次遍歷中找出答案。

運作邏輯：

將所有「可選邊」依照強度由大到小排序。
依序將邊加入圖中（使用並查集 DSU 避免迴圈）。
既然有 $K$ 次升級機會，為了讓「最小值」最大化，自然要把機會留給生成樹中最弱的那 $K$ 條邊。
透過追蹤 edgesUsed，精準攔截出「沒有被升級的最弱邊」和「有被升級的最弱邊」，最後比較瓶頸即可。

💡 真實世界的應用場景：極致效能的「特製手術刀」

當規則明確且不變時，這種純貪心演算法能提供無與倫比的效能，特別適合底層系統與即時運算。

Linux Kernel 的生成樹協定 (STP) 在網路橋接系統 (net/bridge/br_stp.c) 中，為了解決交換機之間的「廣播風暴」，Kernel 必須在極短時間內找出無迴圈的生成樹。Kruskal 演算法的底層邏輯正是這類網路防護機制的核心。
機器學習：層次分群 (Hierarchical Clustering) 在資料科學中 (例如 Single-linkage Clustering)，我們需要將特徵相近的資料點分群。背後運作完全依賴排序與並查集 (DSU)，能快速將距離最短的節點合併，達成自動分類。
電腦視覺：影像分割 (Image Segmentation) 讓電腦看懂照片中哪裡是人、哪裡是背景。演算法將像素當作節點，顏色差異當作邊，透過並查集在極短的 $O(1)$ 時間內將相似區塊合併，達成即時去背效果。

總結

LeetCode 3600 教會我們最重要的一課是：演算法沒有絕對的好壞，只有最適合的情境。

如果你面對的是一個規則單純、對效能要求極高的底層系統，請拿出 Kruskal 貪心法 這把特製手術刀。
如果你面對的是一個業務邏輯複雜、需求隨時會變更的商業系統，請架構好 二分搜尋驗證 這個萬用防護罩。

下次在解題時，不妨多想一步：這段程式碼如果放到真實世界，它會扮演什麼樣的角色呢？

2025年11月8日星期六

Gray code

今天練習的題目是 1611. Minimum One Bit Operations to Make Integers Zero，後來自己想出解法後去看官方解答才發現是在考 Gray code 的轉換。

我自己列出 16 轉換到 0 的所有 bits 的表現方式，然後仔細觀察後發現有某種規律，於是就猜想了一個方程式出來試試看，結果還真的可以解答，先聲明一下這不是最有效的方法，只是眾多解法中的其中一種而已。

設 $p_1, p_2, \dots, p_j$ 為 $n$ 的二進位中所有 1 的 0-based 索引，且 $p_1 > p_2 > \dots > p_j$ ($p_1$ 是 MSB)。
$$f(n) = \sum_{i=1}^{j} (-1)^{i-1} \cdot (2^{p_i+1} - 1)$$

這是我初始第一個版本

class Solution {
public:
    int minimumOneBitOperations(int n) {
        if (n == 0)
            return 0;
        int k = 32 - __builtin_clz(n);
        int ans = 0;
        bitset<30> arr(n);
        int sign = 1;
        for (int i = k; i > 0; --i) {
            if (arr[i - 1]) {
                ans += sign * ((1 << i) - 1);
                sign *= -1;
            }
        }
        return ans;
    }
};

簡化後的第二個版本

class Solution {
public:
    int minimumOneBitOperations(int n) {
        if (n == 0)
            return 0;
        int k = 32 - __builtin_clz(n);
        int ans = 0;
        int sign = 1;
        for (int i = k; i > 0; --i) {
            if (n & (1 << (i - 1))) {
                ans += sign * ((1 << i) - 1);
                sign *= -1;
            }
        }
        return ans;
    }
};

再進一步簡化後的第三個版本

class Solution {
public:
    int minimumOneBitOperations(int n) {
        if (n == 0)
            return 0;
        int ans = 0;
        int sign = 1;
        while (n) {
            int k = 32 - __builtin_clz(n);
            ans += sign * ((1 << k) - 1);
            sign *= -1;
            n ^= (1 << (k-1));
        }
        return ans;
    }
};

有用 Gemini AI 幫忙寫了一份解答分享在 LeetCode 上面 Using a Math Formula 這樣

2025年10月10日星期五

逐步優化 LeetCode 3494「巫師釀藥」問題的完整推導

***此篇文章由 Gemini AI 產生*** 演算法的魅力不僅在於解決問題，更在於追求極致的效率與優雅。本文將以 LeetCode 3494. Find the Minimum Amount of Time to Brew Potions 問題為例，記錄一次從初步正確解法到極致高效解法的完整優化歷程。我們將歷經三個關鍵的里程碑，程式碼的運行時間也從 **231ms**，途經 **183ms**，最終達到 **91ms**。 #### 奠定基石 — 問題的數學模型推導在分析任何程式碼之前，我們必須先從問題的第一性原理出發，建立一個準確的數學模型。這個模型將是我們後續判斷所有演算法正確性的「黃金標準」。 **1. 變數定義** * $n$: 巫師數量, $m$: 藥水數量 * $s_i$: `skill[i]` * $m_j$: `mana[j]` * `skill_prefix_sum[i]`: `skill` 的**標準前綴和**，即 $P[i] = \sum_{k=0}^{i-1} s_k$。特別地，$P[0]=0$。 * $S_j$: 第 $j$ 瓶藥水的**發車時間**（巫師0的開始時間）。 * $T_j(i)$: 第 $i$ 位巫師完成第 $j$ 瓶藥水的**完成時間點**。 **2. 核心約束與「剛性排程」** 問題的關鍵是「立即傳遞」。對於同一瓶藥水 `j`，巫師 `i` 的開始時間 $S_j(i)$ 和完成時間 $T_j(i)$ 與巫師0的開始時間 $S_j$ 之間，存在一個固定的相對關係： $$S_j(i) = S_j + \text{skill_prefix_sum}[i] \cdot m_j$$ $$T_j(i) = S_j(i) + s_i \cdot m_j = S_j + \text{skill_prefix_sum}[i+1] \cdot m_j$$ **3. 推導發車時間 $S_j$** 要計算下一瓶藥水 `j` 的發車時間 $S_j$，必須保證它不會與上一瓶藥水 `j-1` 的任何工作衝突。這意味著，對於**每一位**巫師 `i`，他開始處理藥水 `j` 的時間 $S_j(i)$，必須晚於或等於他完成藥水 `j-1` 的時間 $T_{j-1}(i)$。 $$S_j(i) \ge T_{j-1}(i) \quad (\text{對所有 } i \in [0, n-1] \text{ 恆成立})$$ 將 $S_j(i)$ 的表達式代入並移項： $$S_j \ge T_{j-1}(i) - \text{skill_prefix_sum}[i] \cdot m_j$$ $S_j$ 必須滿足所有巫師的約束，因此取所有約束中的最嚴格者（即下界的最大值）： $$S_j = \max_{0 \le i \lt; n} \left( T_{j-1}(i) - \text{skill_prefix_sum}[i] \cdot m_j \right)$$ 這就是我們計算每一輪發車時間的**核心公式**。 ----- ### 第一站：最初的起點 (231ms) — 隱晦但正確的實作 (與官方解答同構) 我們的探索始於一個能夠正確解決問題、但邏輯較為隱晦的實作版本。 #### 邏輯分析此版本的程式碼透過一個巧妙的順向和逆向迴圈，計算出了與我們上述基礎模型完全等價的結果。 **程式碼 (版本一：231ms)** ```cpp class Solution { public: long long minTime(vector<int>& skill, vector<int>& mana) { int n = skill.size(); // finish_times[i] 儲存第 i 巫師完成上一瓶藥水的時間點 T_{j-1}(i) array<long long, 5000> finish_times{}; for (long long mana_val : mana) { // rolling_max_term 是一個滾動計算的中間值，最終用於計算 S_j long long rolling_max_term = finish_times[0]; // 順向迴圈: 計算一個與 S_j 相關的中間值 for (int i = 1; i < n; ++i) { rolling_max_term = max(rolling_max_term + (long long)skill[i - 1] * mana_val, finish_times[i]); } // 更新最後一位巫師的完成時間 T_j(n-1) finish_times[n - 1] = rolling_max_term + (long long)skill[n - 1] * mana_val; // 逆向迴圈: 根據新的 T_j(n-1) 反向推導並更新整個狀態陣列 for (int i = n - 2; i >= 0; --i) { finish_times[i] = finish_times[i + 1] - (long long)skill[i + 1] * mana_val; } } return finish_times.empty() ? 0 : finish_times[n - 1]; } }; ``` * **效能瓶頸**：雖然邏輯正確，但對每一瓶藥水都需要進行兩次獨立的、遍歷 `N` 位巫師的迴圈，導致效能不佳。 ----- ### 第二站：清晰的力量 (151ms) — 導入前綴和的重構優化的第一步，是讓程式碼的邏輯變得更清晰。我們直接將基礎數學模型，用最直白的方式翻譯成程式碼。 #### 邏輯分析這個版本的程式碼是我們在「奠定基石」章節所推導出的數學模型的**直接實現**。它的正確性由基礎模型的正確性所保證。 **程式碼 (版本二：151ms)** ```cpp class Solution { public: long long minTime(vector<int>& skill, vector<int>& mana) { int n = skill.size(); if (n == 0) return 0; // 預計算 skill 的標準前綴和 array<long long, 5001> skill_prefix_sum{}; for (int i = 0; i < n; ++i) { skill_prefix_sum[i + 1] = skill_prefix_sum[i] + skill[i]; } // finish_times[i] 儲存第 i 巫師完成上一瓶藥水的時間點 T_{j-1}(i) array<long long, 5000> finish_times{}; for (long long mana_val : mana) { // 1. 直接根據公式計算發車時間 S_j long long earliest_start_time = 0; for (int i = 0; i < n; ++i) { earliest_start_time = max(earliest_start_time, finish_times[i] - skill_prefix_sum[i] * mana_val); } // 2. 直接根據公式更新所有巫師的完成時間 T_j(i) for (int i = 0; i < n; ++i) { finish_times[i] = earliest_start_time + skill_prefix_sum[i + 1] * mana_val; } } return finish_times.empty() ? 0 : finish_times[n - 1]; } }; ``` * **效能提升之謎 (231ms -\> 151ms)**：程式碼的結構現在完全對應數學公式，這種直接的轉換有時能幫助編譯器產生更優化的機器碼，同時更友好的記憶體存取模式也帶來了速度提升。 ----- ### 第三站：演算法的躍遷 (91ms) — O(1) 狀態轉移的數學魔法 #### 演算法推導 — 革命性的狀態壓縮最驚人的優化來自於對遞迴關係的根本性重構，將 `O(N)` 的狀態傳遞壓縮為 `O(1)`。 1. **建立關於最終答案的遞迴式** 令 $T_j$ 為處理完第 `j` 瓶藥水的最終答案，即 $T_j=T_j(n-1)$。我們可以推導出 $T_j$ 和 $T_{j-1}$ 的關係： $$T_j = T_{j-1} + \Delta_j + P[n] \cdot (m_j - m_{j-1})$$ 其中 $\Delta_j = \max_{i} ( P[i+1]m_{j-1} - P[i]m_j )$。 2. **從高效程式碼反向推導** 91ms 的程式碼使用了一個累加器 `timeSum`，其定義為 ${timeSum}_j = T_j - {sPrefix}[n-1] \cdot m_j$ 而它的遞迴式是 $\text{timeSum}_j = \text{timeSum}_{j-1} + \text{maxTime}_j$ 3. **證明等價性** 將 `timeSum` 的定義代入其遞迴式，我們可以得到一個關於 $T_{j}$ 的新遞迴式。將這個新遞迴式與我們在第 1 步中推導的遞迴式進行比較，經過代數化簡，最終可以證明兩者等價的充要條件是： $$\text{maxTime}_j = \max_{i} ( P[i+1]m_{j-1} - P[i]m_j ) + s_0m_j - s_0m_{j-1}$$ 而 91ms 程式碼中 `maxTime` 的計算方式，正是這個看似複雜的表達式經過巧妙化簡後的結果！這證明了其演算法的正確性。 #### 邏輯分析此演算法透過精妙的代數變換，證明了我們可以只用一個累加器 `time_accumulator` 來傳遞狀態，而無需儲存整個 `finish_times` 陣列。其詳細的數學推導過程，顯示了其與基礎模型在結果上的完全等價性。 **程式碼 (版本三：91ms)** ```cpp class Solution { public: long long minTime(vector<int>& skill, vector<int>& mana) { int n = skill.size(); int m = mana.size(); // 定義一個特殊的 "前綴和"，不包含 skill[0]，為數學簡化服務 array<long long, 5000> skill_prefix_sum_from_one{}; for (int i = 1; i < n; i++) { skill_prefix_sum_from_one[i] = skill_prefix_sum_from_one[i - 1] + skill[i]; } // 初始化 O(1) 狀態累加器 long long time_accumulator = (long long)skill[0] * mana[0]; // 每一輪，狀態轉移只依賴 time_accumulator 這個 O(1) 的值 for (int j = 1; j < m; j++) { long long prev_mana = mana[j - 1]; long long current_mana = mana[j]; // 計算用於更新累加器的核心項 long long max_term_for_sum = (long long)skill[0] * current_mana; for (int i = 1; i < n; i++) { long long time_diff_term = skill_prefix_sum_from_one[i] * prev_mana - skill_prefix_sum_from_one[i - 1] * current_mana; max_term_for_sum = max(max_term_for_sum, time_diff_term); } // 更新 O(1) 狀態 time_accumulator += max_term_for_sum; } // 根據最終的狀態值，還原出真正的答案 return time_accumulator + skill_prefix_sum_from_one[n - 1] * mana[m - 1]; } }; ``` * **效能提升的根源**： 1. **狀態壓縮**：將 `O(N)` 的狀態依賴（整個 `finish_times` 陣列）壓縮到 `O(1)` 的狀態依賴（僅 `time_accumulator` 一個值）。 2. **單一迴圈與資料局部性**：所有計算都在一個 `O(N)` 的內層迴圈中完成，且資料依賴性極小，極大地提升了 CPU 快取效率。 ----- ### 總結：我們的優化之旅從 231ms 到 91ms，我們經歷了從一個能工作的解法，到一個更清晰的重構，再到一個基於深刻數學洞察的根本性優化。這趟旅程清晰地展示了在追求極致效能的道路上，清晰的邏輯、直接的數學轉譯，以及對問題結構本身的顛覆性思考，都是不可或缺的關鍵步驟。

2025年10月7日星期二

解題筆記：運用 Union-Find 巧妙解決「避免洪水」問題

***此篇文章由 Gemini AI 產生*** 在解決演算法問題時，我們時常會發現一些經典的資料結構能夠以意想不到的方式被應用。今天，我想分享一個 LeetCode 上的問題「[Avoid Flood in The City](https://leetcode.com/problems/avoid-flood-in-the-city/)」，以及一個利用 Union-Find (併查集) 資料結構的巧妙解法。這個解法的第一眼可能讓人覺得有點困惑，但理解其核心思想後，便會讚嘆於其簡潔與高效。 #### **問題簡述** 我們得到一個整數陣列 `rains`，代表每日的天氣狀況。 * `rains[i] > 0`：表示第 `i` 天，`rains[i]` 號湖泊會下雨並且被裝滿。 * `rains[i] == 0`：表示第 `i` 天是晴天，你可以選擇**一個**滿的湖泊將其抽乾。如果某個湖泊在已經滿了的情況下再次下雨，就會導致洪水。你的任務是回傳一個陣列 `ans`，記錄你在每個晴天抽乾了哪個湖泊，以成功避免所有洪水。如果無法避免，則回傳空陣列。 #### **核心挑戰** 這個問題的挑戰在於「決策」。當你有好幾個晴天和好幾個滿的湖泊時，你應該在哪个晴天抽乾哪個湖泊？一個直觀的貪婪策略是：當一個湖泊即將第二次下雨時，我們必須回頭找一個在「上一次下雨」和「這一次下雨」之間的一個晴天，把它抽乾。為了盡可能保留後面的晴天給未來的緊急情況使用，我們應該選擇**最早的那個可用晴天**。問題來了：如何高效地「找到上一次下雨之後，最早的那個可用晴天」？如果每次都線性掃描，效率會很差。這就是 Union-Find 登場的時機。 #### **Union-Find 的變形與應用** 在這道題目中，Union-Find 的作用不是判斷連通性，而是作為一個「可用晴天」的查找器。它能以近乎 O(1) 的效率告訴我們：「從第 `x` 天開始，下一個可用的晴天是哪一天？」讓我們看看程式碼的實現： ```cpp class UnionFind { public: vector root; UnionFind(int n) : root(n + 1) { // 初始化，每個節點的根都是它自己 // root = {0, 1, 2, 3, ..., n} iota(root.begin(), root.end(), 0); } // 查找 x 的最終根，帶路徑壓縮優化 int Find(int x) { return (x == root[x]) ? x : root[x] = Find(root[x]); } // 將 x 合併到 x+1 的集合中，表示 x 已被使用 void UnionNext(int x) { root[x] = Find(x + 1); } }; ``` * **初始化**：`root[i] = i`，代表第 `i` 天的「下一個可用日」就是它自己。 * **Find(x)**：查找 `x` 的根。由於路徑壓縮，這會非常快。 * **UnionNext(x)**：這是精髓。當第 `x` 天被「使用」（無論是下雨，還是被安排抽水），我們就執行 `UnionNext(x)`。這會將 `root[x]` 指向 `x+1` 的根。它的效果就像在第 `x` 天立了一個牌子，上面寫著：「此路不通，請找下一天」。因此，下次再執行 `Find(x)` 時，它會自動跳過 `x`，去尋找 `x` 之後第一個可用的日子。 #### **演算法主體邏輯** 有了這個特製的 Union-Find 工具，主體的邏輯就變得清晰了。 ```cpp class Solution { public: vector<int> avoidFlood(vector<int>& rains) { const int n = rains.size(); UnionFind G(n); // 管理 0 到 n-1 天的可用性 unordered_map<int, int> rainDay; // 記錄湖泊最後的下雨日 vector<int> ans(n, 1); // 預設晴天都抽乾 1 號湖 for (int i = 0; i < n; i++) { const int lake = rains[i]; if (lake > 0) { // 如果是雨天 ans[i] = -1; // 雨天答案固定為 -1 // 無論如何，今天下雨了，所以今天也被使用了 G.UnionNext(i); // 檢查這個湖泊之前是否下過雨 auto it = rainDay.find(lake); if (it != rainDay.end()) { // 之前下過雨，必須找個晴天來抽水 int prev = it->second; // 上次下雨日 // 核心：從 prev+1 開始，找最早的可用晴天 int dry = G.Find(prev + 1); if (dry > i) { // 如果找到的晴天在今天之後，來不及了 return {}; // 洪水 } ans[dry] = lake; // 安排在 dry 這天抽乾 lake G.UnionNext(dry); // dry 這天也被使用了 it->second = i; // 更新 lake 的最後下雨日 } else { // 第一次下雨，記錄下來即可 rainDay[lake] = i; } } } return ans; } }; ``` 整個演算法的流程可以總結如下： 1. 遍歷每一天。 2. 如果是**雨天** (`lake > 0`)： * 首先檢查 `rainDay` map，看這個湖之前是否滿了。 * 如果是，就從上一次下雨的後一天 `prev + 1` 開始，呼叫 `G.Find(prev + 1)`。這會高效地返回我們需要的、最早的那個可用晴天。 * 如果返回的晴天 `dry` 比今天 `i` 還晚，表示沒有可用的晴天，洪水無法避免。 * 否則，我們就在 `ans[dry]` 記錄下抽乾 `lake` 的計畫，並用 `G.UnionNext(dry)` 將 `dry` 這天標記為已使用。 * 最後，更新 `rainDay` 中 `lake` 的紀錄，並將今天 `i` 也標記為已使用。 3. 如果是**晴天** (`lake == 0`)： * 我們在迴圈中不做任何事。晴天是一個被動的資源，只有在雨天需要時，才會被 `G.Find()` 找到並分配任務。如果一個晴天沒被用到，它就保留預設值 `ans[i] = 1`。 #### **結論** 這個解法最漂亮的地方在於它將「查找下一個可用空位」這個問題，抽象化為 Union-Find 資料結構的操作。通過 `UnionNext(x)` 將已使用的日期「跳過」，`Find(x)` 就能始終高效地定位到下一個可用的資源。它是一個很好的例子，展示了如何將一個我們熟悉的資料結構進行微小的改造，來解決一個看似不相關、但本質相通的問題。

2025年10月5日星期日

417. Pacific Atlantic Water Flow - C++ | Runtime 0ms | Beats 100% | 逆向雙 BFS 解法

***此篇文章由 Gemini AI 產生*** # Intuition (思路) 我第一個想法是去檢查每一個格子。從每個格子出發，我都可以做一次搜尋（例如 DFS 或 BFS），來看看是否存在一條路徑可以同時流到太平洋（頂部和左側邊界）和大西洋（底部和右側邊界）。然而，這種做法的效率會非常差，因為我會多次重複計算重疊子問題的路徑，最後很可能會導致「超時 (Time Limit Exceeded)」。一個好得多的方法是「逆向思考」。與其問「這個格子的水可以流到哪裡？」，不如反過來問「有哪些格子可以流到海洋裡？」。我可以從直接接觸海洋的格子開始，向內陸或「向上游」進行遍歷。任何從海洋邊界出發，只要往等高或更高的地方走就能到達的格子，都代表該格子的水可以「向下流」到那片海洋。所以，我可以先從所有太平洋邊界的格子開始進行一次搜尋，找出所有能流到太平洋的格子。接著，再從所有大西洋邊界的格子開始做第二次搜尋，找出所有能流到大西洋的格子。最後，兩次搜尋結果中都有出現的格子，就是我們的答案。 # Approach (解題方法) 核心思想是使用兩次獨立的廣度優先搜尋（BFS），來分別找出所有可以流入兩大洋的格子。 1. **從太平洋開始：** * 初始化一個佇列 (queue)，並將所有在第一列和第一行的格子（也就是太平洋邊界）加入佇列中。 * 使用一個 `weight` (權重) 矩陣來追蹤可達性。當我們從太平洋這邊訪問到一個格子時，我們就將它的權重加上 `1`。 * 執行 BFS。從佇列中取出格子並探索其相鄰的格子。我們只能從一個格子 `A` 移動到相鄰的格子 `B`，當且僅當 `height(B) >= height(A)`。這就模擬了從海洋的角度來看，水流「往上游」的情況。 * 第一次 BFS 將會把所有能流到太平洋的格子，其權重都標記為 `1`。 2. **移至大西洋：** * 重新初始化 `visited` 追蹤器（但不清空 `weight` 矩陣）。 * 將所有在最後一列和最後一行的格子（大西洋邊界）加入佇列中。 * 使用同樣的「往上游」邏輯，執行第二次 BFS。 * 這一次，當我們訪問到一個格子時，我們將它的權重加上 `2`。 3. **找出交集：** * 在兩次 BFS 遍歷都完成後，我們遍歷整個 `weight` 矩陣。 * 任何權重等於 `3` 的格子（代表來自太平洋 BFS 的 `1` + 來自大西洋 BFS 的 `2`），就是水可以同時流到兩大洋的格子。 * 我們收集所有這些格子的座標，組成最終的答案。這種方法透過高效地在單次遍歷中找到每個海洋的可達格子集合，避免了多餘的計算。 # Complexity (複雜度) - Time complexity (時間複雜度): 我們執行了兩次 BFS 遍歷。每一次 BFS 最多只會訪問每個格子和邊一次。最後收集結果的迴圈也會遍歷所有格子。因此，時間複雜度與網格中的格子總數成正比。 $$O(m \times n)$$ 其中 $m$ 是列數，$n$ 是行數。 - Space complexity (空間複雜度): 我們使用了一個 `weight` 矩陣、一個 `visited` 矩陣以及一個 BFS 用的佇列。這些資料結構所需的空間與網格中的格子總數成正比。 $$O(m \times n)$$ # Code (程式碼) ```cpp class Solution { int m, n; // weight[i][j] stores reachability: // 1: can reach Pacific // 2: can reach Atlantic // 3: can reach both array<array<int, 200>, 200> weight{}; array<array<bool, 200>, 200> visited{}; // Helper to add a cell to the queue and mark it inline void enqueue(queue<pair<int, int>>& q, int x, int y, int inc) { weight[x][y] += inc; visited[x][y] = true; q.push({x, y}); } // BFS to find all cells that can flow "down" to the initial set of cells in the queue void bfs(queue<pair<int, int>>& q, vector<vector<int>>& heights, int inc) { array<array<int, 2>, 4> dirs{{{0, 1}, {1, 0}, {0, -1}, {-1, 0}}}; while (!q.empty()) { auto [x, y] = q.front(); q.pop(); for (auto& d : dirs) { int nx = x + d[0]; int ny = y + d[1]; // Check bounds if (nx < 0 || nx >= m || ny < 0 || ny >= n) continue; // If already visited in this specific BFS or water can't flow "uphill" if (visited[nx][ny] || heights[x][y] > heights[nx][ny]) continue; // Enqueue the valid neighbor enqueue(q, nx, ny, inc); } } } public: vector<vector<int>> pacificAtlantic(vector<vector<int>>& heights) { m = heights.size(); n = heights[0].size(); queue<pair<int, int>> q; // 1. BFS from Pacific Ocean (top and left borders) for (int i = 0; i < m; ++i) enqueue(q, i, 0, 1); for (int i = 1; i < n; ++i) enqueue(q, 0, i, 1); bfs(q, heights, 1); // Reset visited grid for the second BFS visited = {}; // 2. BFS from Atlantic Ocean (bottom and right borders) for (int i = 0; i < m; ++i) enqueue(q, i, n - 1, 2); for (int i = 0; i < n - 1; ++i) enqueue(q, m - 1, i, 2); bfs(q, heights, 2); // 3. Collect all cells that can reach both oceans (weight == 3) vector<vector<int>> ans; ans.reserve(m + n); // Reserve memory as an optimization for (int i = 0; i < m; ++i) for (int j = 0; j < n; ++j) if (weight[i][j] == 3) ans.push_back({i, j}); return ans; } }; ```

訂閱：文章 (Atom)

網頁

2026年4月9日 星期四