$4 blog: 3月 2026

2026年3月14日星期六

從 LeetCode 到 Linux Kernel 的工程智慧：解構「快樂字串」

在程式設計的領域中，有些題目表面上是排列組合的益智遊戲，但深挖其背後的邏輯，你會發現它觸及了計算機科學最核心的課題：如何在有限限制下，進行極致的資源調度與導航。

今天我們要聊的是 LeetCode 的「快樂字串」（Happy String）問題。

什麼是快樂字串？

一個長度為 n 的字串被稱為「快樂字串」，需滿足：

僅由 {'a', 'b', 'c'} 組成。
無連續重複：相鄰的字元不能相同（例如 "aba" 是快樂的，但 "aa" 不是）。

任務是：在所有按字典序排列的快樂字串中，找出第 k 個。

階段一：直覺的探索 —— 回溯法 (Backtracking)

最直覺的方法是透過深度優先搜尋（DFS）來模擬人類構思字串的過程。

程式碼實作

class Solution {
    bool solve(string& ans, int n, int& k) {
        if (ans.size() == n) {
            return --k == 0; // 找到第 k 個組合時停止
        }
        for (char c : {'a', 'b', 'c'}) {
            if (!ans.empty() && c == ans.back()) continue; // 核心約束
            
            ans.push_back(c);
            if (solve(ans, n, k)) return true; // 提早回傳
            ans.pop_back(); // 回溯
        }
        return false;
    }
public:
    string getHappyString(int n, int k) {
        string ans = "";
        return solve(ans, n, k) ? ans : "";
    }
};

工程思考

這種方法就像是在迷宮中探路。雖然直觀，但當 n 變大時，搜尋空間會呈指數級成長。在系統底層開發中，過深的遞迴會導致 Stack Overflow，這在核心（Kernel）環境中是絕對要避免的。

階段二：極致的跳轉 —— 數學定位法 (Mathematical Positioning)

如果我們能不透過「走迷宮」，而是直接「空降」到第 k 個字串呢？

觀察規律發現：第一個字元決定後，後續每個位置都只有 2 種選擇。這意味著這是一個變相的 二進位導航系統。

最佳化程式碼

class Solution {
public:
    string getHappyString(int n, int k) {
        int m = 1 << (n - 1); // 每個分支的組合數 (2^(n-1))
        if (3 * m < k) return ""; // 總數檢查

        string ans = "";
        k--; // 轉為 0-indexed 處理區間
        
        // 1. 確定首位字元
        ans.push_back('a' + k / m);
        k %= m;

        // 2. 數學跳轉確定後續字元
        for (int i = 1; i < n; ++i) {
            m >>= 1; // 剩餘組合數減半
            char next = 'a' + (k / m);
            if (next >= ans.back()) next++; // 巧妙排除重複，維持字典序
            
            ans.push_back(next);
            k %= m;
        }
        return ans;
    }
};

深入核心：Linux Kernel 中的精準對應

我們在上述數學解法中使用了兩個核心技巧：「基於 2 的冪次方的空間劃分」與「前置狀態的數學補償」。在 Linux 核心中，這兩個技巧有著極其精準的對應實例。

實例 A：二進位空間劃分 —— 夥伴系統 (Buddy System)

在快樂字串中，我們利用 m = 1 << (n - 1) 來確定區間，並用除法與餘數直接定位分支。在 Linux 的記憶體管理核心 mm/page_alloc.c 中，著名的**夥伴系統（Buddy Allocator）**使用了完全一樣的數學邏輯來分配實體記憶體。

當系統釋放一個大小為 2^order 的記憶體區塊時，它必須找到相鄰的「夥伴（Buddy）」來合併。核心絕對不會去遍歷記憶體，而是直接透過位元運算算出夥伴的精確位置：

/* Linux Kernel: mm/page_alloc.c 核心邏輯簡化 */
static inline unsigned long
__find_buddy_pfn(unsigned long page_pfn, unsigned int order)
{
    // 利用 XOR 和 1 << order 直接算出相鄰區塊的位置
    // 就像我們用 k / (1 << (n-1)) 定位分支一樣，純數學、零迴圈！
    return page_pfn ^ (1 << order);
}

精準對應：這與我們處理快樂字串時，依賴 $2$ 的冪次方（二進位樹狀結構）來進行 $O(1)$ 的空間跳轉與定位，在數學本質上完全一致。

實例 B：相鄰約束的 $O(1)$ 跳轉 —— 格雷碼 (Gray Code)

快樂字串的最核心限制是：相鄰元素不能重複。我們用了一行神來之筆 if (next >= ans.back()) next++，在 $O(1)$ 時間內算出第 $k$ 個符合約束的狀態。

在 Linux 驅動程式（特別是旋轉編碼器 drivers/input/misc/rotary_encoder.c 等硬體）中，也有一個嚴格的相鄰約束：相鄰的狀態只能有 1 個位元不同（避免硬體雜訊）。這稱為格雷碼（Gray Code）。

工程師如何找出第 $k$ 個符合約束的格雷碼？他們不會從 0 開始生成並檢查相鄰狀態，而是直接套用數學偏移公式：

/* Linux Kernel 中常見的格雷碼轉換邏輯 */
unsigned int binary_to_gray(unsigned int k)
{
    // 透過自己與自己右移一位的值做 XOR，直接計算出第 k 個合法狀態
    // 完美滿足「相鄰狀態約束」，且是 O(1) 的純數學計算
    return k ^ (k >> 1);
}

精準對應：快樂字串的約束是「相鄰字元不同」，格雷碼的約束是「相鄰位元僅一處不同」。兩者都放棄了狀態機遍歷（Backtracking），轉而發掘出**「將序號 $k$ 透過偏移/補償，直接對射到合法狀態空間」**的終極數學公式。

跨領域的共鳴：AI、遊戲生成與空間定位

這種「拒絕盲目搜尋，改用數學約束或狀態機直接算出解」的思想，不僅限於底層作業系統。在當今最前沿的領域中，它更是解決效能瓶頸的核心技術。

1. 大型語言模型 (LLM) 的受限解碼 (Constrained Decoding)

在 LLM 的推論過程中，生成文字的本質就是在「巨大的字彙庫中尋找下一個合法的 Token」。這與我們找快樂字串的字元非常相似。當我們要求 LLM 嚴格輸出特定格式（如 JSON）時，現代推論引擎（如 vLLM, Guidance）會使用有限狀態機 (FSM)。在生成每個 Token 前，系統會先「計算」出目前狀態下哪些字元是合法的（就像我們排除 ans.back()），並將不合法 Token 的機率強制歸零。這保證了模型一步到位生成完美格式，徹底避免了昂貴的回溯與重寫。

2. 電腦圖學與遊戲開發 (Procedural Generation)

在《Minecraft》這類擁有無限大世界的遊戲中，系統不可能把整個地圖存下來，也不可能在玩家移動時慢慢「搜尋」該生成什麼地形。開發者使用了 Perlin Noise 等純數學函數：只要給定一個座標 $(x, y)$（就像是我們題目中的 $k$），系統就能透過位元運算與雜湊，在 $O(1)$ 時間內直接「算出」這格的地形，且完美滿足相鄰區塊平滑過渡的約束條件。

3. 空間資料庫與希爾伯特曲線 (Hilbert Curve)

Google Maps 或外送平台需要在資料庫中快速找到目標。但地圖是 2D 的，而資料庫索引是 1D 的。科學家發明了空間填充曲線：給定一個 1D 序號 $k$，可以透過一系列精妙的位元運算，直接算出它在地圖上的 $(x, y)$ 座標，完全不需遍歷地圖。這與我們算出「第 $k$ 個快樂字串」的數學原理（空間劃分與位移）屬於同一個家族的工程魔法。

結語：從搜尋者進化為計算者

從回溯法進化到數學定位法，代表了程式設計師思維的轉變：從「一個個去試」的狀態搜尋，進化到「洞察規則」後的直接數學對射。

只要問題具備「狀態空間極大」與「明確的相鄰約束」兩大特徵，頂尖的工程師永遠會找出隱藏的數學規律，透過空間映射、位元運算與狀態掩碼，將複雜的搜尋問題降維打擊成常數時間的計算。這種對系統與數學的雙重敏銳度，正是頂尖架構師的標誌。

本文為「程式夥伴」專題系列，探討演算法與底層工程的連結。

2026年3月12日星期四

從 LeetCode 3600 看工程思維：極致效能 vs 萬用架構

在面對演算法挑戰時，我們常常會陷入「尋求最快解」的迷思。然而，在真實世界的軟體工程中，最快的演算法真的永遠是最好的選擇嗎？

今天我們透過 LeetCode 3600: Maximize Spanning Tree Stability with Upgrades 這道經典的圖論題，來看看兩種截然不同的解題思路，以及它們在現實工業界中各自稱霸的真實場景。

題目背景：尋找最穩定的生成樹

這道題目的核心目標是：在給定的一張圖中，挑選出 $N-1$ 條邊形成「生成樹 (Spanning Tree)」。其中有些邊是「必選的」，有些是「可選的」。我們手上有 $K$ 次升級機會，可以將可選邊的強度乘以 2。 目標：最大化這棵樹的「最弱連結 (最小邊緣強度)」。

面對這個「最大化最小值」的難題，我們有兩種截然不同的解題策略。

策略一：二分搜尋 + 貪心驗證 (Binary Search on Answer)

這是一個非常扎實且通用的工程思維：我們不知道答案是多少，但我們可以「猜」。

運作邏輯：

確定答案的上下界（例如強度從 $0$ 到 $100,000$）。
猜測一個目標值 mid，並寫一個 check(mid) 函數來驗證：「在 $K$ 次升級內，我們能不能讓所有挑選的邊，強度都 $\ge mid$？」
根據驗證結果，不斷縮小範圍，直到找到極限值。

💡 真實世界的應用場景：高擴充性的「萬用框架」

這個演算法雖然時間複雜度多了一個 $\log M$，但在真實的工程應用中，它卻具有壓倒性的擴充性 (Extensibility)！

電信網路的 SLA 保證與預算規劃 中華電信或 AWS 要牽線連接全球的資料中心，並保證最低可用頻寬。公司今年只給了預算購買 $K$ 台「訊號放大器」。網路架構師會透過這個演算法「二分猜測」保證頻寬，驗證預算是否足夠，藉此找出基礎建設的投資報酬率極限。
EDA (電子設計自動化) 與晶片佈線 晶片設計中，工程師可以在線路上插入 Buffer（緩衝器）來增強訊號，但 Buffer 非常耗電且最多只能放 $K$ 個。軟體會猜測最差的訊號延遲時間，去驗證這 $K$ 個 Buffer 該怎麼放。
為什麼它無可取代？ 真實世界的規則往往不講武德。如果今天老闆說：「A 線路升級加 500、B 線路升級乘以 1.5、C 線路升級需要消耗 2 次升級機會...」純數學推導會瞬間崩潰，但二分搜尋版完全不受影響！你只需要在 check() 函數裡加上幾行 if-else，這個演算法就能完美存活。

策略二：Kruskal 演算法變形 (Pure Greedy)

這是一個將圖論數學性質發揮到極致的 $O(E \log E)$ 神級解法。它捨棄了「猜答案」，直接在一次遍歷中找出答案。