$4 blog: 從 LeetCode 到 Linux Kernel 的工程智慧：解構「快樂字串」

在程式設計的領域中，有些題目表面上是排列組合的益智遊戲，但深挖其背後的邏輯，你會發現它觸及了計算機科學最核心的課題：如何在有限限制下，進行極致的資源調度與導航。

今天我們要聊的是 LeetCode 的「快樂字串」（Happy String）問題。

什麼是快樂字串？

一個長度為 n 的字串被稱為「快樂字串」，需滿足：

僅由 {'a', 'b', 'c'} 組成。
無連續重複：相鄰的字元不能相同（例如 "aba" 是快樂的，但 "aa" 不是）。

任務是：在所有按字典序排列的快樂字串中，找出第 k 個。

階段一：直覺的探索 —— 回溯法 (Backtracking)

最直覺的方法是透過深度優先搜尋（DFS）來模擬人類構思字串的過程。

程式碼實作

class Solution {
    bool solve(string& ans, int n, int& k) {
        if (ans.size() == n) {
            return --k == 0; // 找到第 k 個組合時停止
        }
        for (char c : {'a', 'b', 'c'}) {
            if (!ans.empty() && c == ans.back()) continue; // 核心約束
            
            ans.push_back(c);
            if (solve(ans, n, k)) return true; // 提早回傳
            ans.pop_back(); // 回溯
        }
        return false;
    }
public:
    string getHappyString(int n, int k) {
        string ans = "";
        return solve(ans, n, k) ? ans : "";
    }
};

工程思考

這種方法就像是在迷宮中探路。雖然直觀，但當 n 變大時，搜尋空間會呈指數級成長。在系統底層開發中，過深的遞迴會導致 Stack Overflow，這在核心（Kernel）環境中是絕對要避免的。

階段二：極致的跳轉 —— 數學定位法 (Mathematical Positioning)

如果我們能不透過「走迷宮」，而是直接「空降」到第 k 個字串呢？

觀察規律發現：第一個字元決定後，後續每個位置都只有 2 種選擇。這意味著這是一個變相的 二進位導航系統。

最佳化程式碼

class Solution {
public:
    string getHappyString(int n, int k) {
        int m = 1 << (n - 1); // 每個分支的組合數 (2^(n-1))
        if (3 * m < k) return ""; // 總數檢查

        string ans = "";
        k--; // 轉為 0-indexed 處理區間
        
        // 1. 確定首位字元
        ans.push_back('a' + k / m);
        k %= m;

        // 2. 數學跳轉確定後續字元
        for (int i = 1; i < n; ++i) {
            m >>= 1; // 剩餘組合數減半
            char next = 'a' + (k / m);
            if (next >= ans.back()) next++; // 巧妙排除重複，維持字典序
            
            ans.push_back(next);
            k %= m;
        }
        return ans;
    }
};

深入核心：Linux Kernel 中的精準對應

我們在上述數學解法中使用了兩個核心技巧：「基於 2 的冪次方的空間劃分」與「前置狀態的數學補償」。在 Linux 核心中，這兩個技巧有著極其精準的對應實例。

實例 A：二進位空間劃分 —— 夥伴系統 (Buddy System)

在快樂字串中，我們利用 m = 1 << (n - 1) 來確定區間，並用除法與餘數直接定位分支。在 Linux 的記憶體管理核心 mm/page_alloc.c 中，著名的**夥伴系統（Buddy Allocator）**使用了完全一樣的數學邏輯來分配實體記憶體。

當系統釋放一個大小為 2^order 的記憶體區塊時，它必須找到相鄰的「夥伴（Buddy）」來合併。核心絕對不會去遍歷記憶體，而是直接透過位元運算算出夥伴的精確位置：

/* Linux Kernel: mm/page_alloc.c 核心邏輯簡化 */
static inline unsigned long
__find_buddy_pfn(unsigned long page_pfn, unsigned int order)
{
    // 利用 XOR 和 1 << order 直接算出相鄰區塊的位置
    // 就像我們用 k / (1 << (n-1)) 定位分支一樣，純數學、零迴圈！
    return page_pfn ^ (1 << order);
}

精準對應：這與我們處理快樂字串時，依賴 $2$ 的冪次方（二進位樹狀結構）來進行 $O(1)$ 的空間跳轉與定位，在數學本質上完全一致。

實例 B：相鄰約束的 $O(1)$ 跳轉 —— 格雷碼 (Gray Code)

快樂字串的最核心限制是：相鄰元素不能重複。我們用了一行神來之筆 if (next >= ans.back()) next++，在 $O(1)$ 時間內算出第 $k$ 個符合約束的狀態。

在 Linux 驅動程式（特別是旋轉編碼器 drivers/input/misc/rotary_encoder.c 等硬體）中，也有一個嚴格的相鄰約束：相鄰的狀態只能有 1 個位元不同（避免硬體雜訊）。這稱為格雷碼（Gray Code）。

工程師如何找出第 $k$ 個符合約束的格雷碼？他們不會從 0 開始生成並檢查相鄰狀態，而是直接套用數學偏移公式：

/* Linux Kernel 中常見的格雷碼轉換邏輯 */
unsigned int binary_to_gray(unsigned int k)
{
    // 透過自己與自己右移一位的值做 XOR，直接計算出第 k 個合法狀態
    // 完美滿足「相鄰狀態約束」，且是 O(1) 的純數學計算
    return k ^ (k >> 1);
}

精準對應：快樂字串的約束是「相鄰字元不同」，格雷碼的約束是「相鄰位元僅一處不同」。兩者都放棄了狀態機遍歷（Backtracking），轉而發掘出**「將序號 $k$ 透過偏移/補償，直接對射到合法狀態空間」**的終極數學公式。

跨領域的共鳴：AI、遊戲生成與空間定位

這種「拒絕盲目搜尋，改用數學約束或狀態機直接算出解」的思想，不僅限於底層作業系統。在當今最前沿的領域中，它更是解決效能瓶頸的核心技術。

1. 大型語言模型 (LLM) 的受限解碼 (Constrained Decoding)

在 LLM 的推論過程中，生成文字的本質就是在「巨大的字彙庫中尋找下一個合法的 Token」。這與我們找快樂字串的字元非常相似。當我們要求 LLM 嚴格輸出特定格式（如 JSON）時，現代推論引擎（如 vLLM, Guidance）會使用有限狀態機 (FSM)。在生成每個 Token 前，系統會先「計算」出目前狀態下哪些字元是合法的（就像我們排除 ans.back()），並將不合法 Token 的機率強制歸零。這保證了模型一步到位生成完美格式，徹底避免了昂貴的回溯與重寫。

2. 電腦圖學與遊戲開發 (Procedural Generation)

在《Minecraft》這類擁有無限大世界的遊戲中，系統不可能把整個地圖存下來，也不可能在玩家移動時慢慢「搜尋」該生成什麼地形。開發者使用了 Perlin Noise 等純數學函數：只要給定一個座標 $(x, y)$（就像是我們題目中的 $k$），系統就能透過位元運算與雜湊，在 $O(1)$ 時間內直接「算出」這格的地形，且完美滿足相鄰區塊平滑過渡的約束條件。

3. 空間資料庫與希爾伯特曲線 (Hilbert Curve)

Google Maps 或外送平台需要在資料庫中快速找到目標。但地圖是 2D 的，而資料庫索引是 1D 的。科學家發明了空間填充曲線：給定一個 1D 序號 $k$，可以透過一系列精妙的位元運算，直接算出它在地圖上的 $(x, y)$ 座標，完全不需遍歷地圖。這與我們算出「第 $k$ 個快樂字串」的數學原理（空間劃分與位移）屬於同一個家族的工程魔法。

結語：從搜尋者進化為計算者

從回溯法進化到數學定位法，代表了程式設計師思維的轉變：從「一個個去試」的狀態搜尋，進化到「洞察規則」後的直接數學對射。

只要問題具備「狀態空間極大」與「明確的相鄰約束」兩大特徵，頂尖的工程師永遠會找出隱藏的數學規律，透過空間映射、位元運算與狀態掩碼，將複雜的搜尋問題降維打擊成常數時間的計算。這種對系統與數學的雙重敏銳度，正是頂尖架構師的標誌。

本文為「程式夥伴」專題系列，探討演算法與底層工程的連結。

$4 blog

網頁

2026年3月14日星期六

從 LeetCode 到 Linux Kernel 的工程智慧：解構「快樂字串」

什麼是快樂字串？

階段一：直覺的探索 —— 回溯法 (Backtracking)

程式碼實作

工程思考

階段二：極致的跳轉 —— 數學定位法 (Mathematical Positioning)

最佳化程式碼

深入核心：Linux Kernel 中的精準對應

實例 A：二進位空間劃分 —— 夥伴系統 (Buddy System)

實例 B：相鄰約束的 $O(1)$ 跳轉 —— 格雷碼 (Gray Code)

跨領域的共鳴：AI、遊戲生成與空間定位

1. 大型語言模型 (LLM) 的受限解碼 (Constrained Decoding)

2. 電腦圖學與遊戲開發 (Procedural Generation)

3. 空間資料庫與希爾伯特曲線 (Hilbert Curve)

結語：從搜尋者進化為計算者

沒有留言:

網頁

2026年3月14日 星期六

從 LeetCode 到 Linux Kernel 的工程智慧：解構「快樂字串」

什麼是快樂字串？

階段一：直覺的探索 —— 回溯法 (Backtracking)

程式碼實作

工程思考

階段二：極致的跳轉 —— 數學定位法 (Mathematical Positioning)

最佳化程式碼

深入核心：Linux Kernel 中的精準對應

實例 A：二進位空間劃分 —— 夥伴系統 (Buddy System)

實例 B：相鄰約束的 $O(1)$ 跳轉 —— 格雷碼 (Gray Code)

跨領域的共鳴：AI、遊戲生成與空間定位

1. 大型語言模型 (LLM) 的受限解碼 (Constrained Decoding)

2. 電腦圖學與遊戲開發 (Procedural Generation)

3. 空間資料庫與希爾伯特曲線 (Hilbert Curve)

結語：從搜尋者進化為計算者

沒有留言:

2026年3月14日星期六