小朋友才『寫』測試，成熟的大人都 Property-Based Testing

October 05, 2021

什麼是 `Property-Based Testing`？

Property-Based Testing 起源於 2000 年由 Koen Claessen 及 John Hughes 兩位教授所寫的 QuickCheck: a lightweight tool for random testing of Haskell programs 論文中所介紹的 QuickCheck 此 Haskell 的 testing framework。此後，也啟發各個語言的 Property-Based Testing framework，例如： Python 的 Hypothesis、Erlang 的 PropEr、Rust 的 quickcheck、JS/TS 的 fast-check 等等。

而 Property-Based Testing 有什麼優缺點呢？為什麼各語言都爭相做出該語言的 Property-Based Testing 框架呢？

本文將簡介 Property-Based Testing 有哪些特性，並透過範例來解釋 Property-Based Testing 與傳統的 Example-Based Testing 有什麼不同。

※ 本文將使用 JS/TS 的 Property-Based Testing 框架 fast-check 做範例來介紹如何透過 Property-Based Testing 做測試。

在開始介紹前，我們先討論一下，「傳統的 Example-Based Testing」指的是什麼以及他有什麼問題。

Don’t write tests!

John Hughes 在 Curry On! 2017 給了一場演講名為 Don't Write Tests!。為什麼他會下這種標題呢？讓我們來舉例並逐步了解。

假設今天有兩個 function reverse 以及 sort，我們必須針對他們寫測試，在 Example-Based Testing 中，你的測試可能會這樣寫

describe(`Test ${reverse.name}`, () => {
  it('should reverse the array', () => {
    expect(reverse([1, 2, 3])).toEqual([3, 2, 1]);
    expect(reverse([1, 2, 3, 4, 5])).toEqual([5, 4, 3, 2, 1]);
  });
});

describe(`Test ${sort.name}`, () => {
  it('should sort the array in ascending order', () => {
    expect(sort([1, 3, 5, 4, 2])).toEqual([1, 2, 3, 4, 5]);
    expect(sort([2, 1, 3, 4])).toEqual([1, 2, 3, 4]);
    expect(sort([5, 4, 3, 2, 1])).toEqual([1, 2, 3, 4, 5]);
  });
});

這樣可以簡單的測試 reverse 是否正確地反轉給定的 array 或是 sort 是否正確地排序給定的 array，但這樣有什麼問題或是缺點呢？

Example-Based Testing 的問題是什麼？

在以上測試中，可以看到我們必須手刻 input array 並寫好他的 expected output array。也就是說，我們只會測到既定的 input 以及 output，這樣導致我們可能會錯過不少案例。

為了不要手刻 input array，我們可以將測試（以下只舉 sort 為例）改為

function range(n: number): Array<number> {
  return Array.from({ length: n }).map((_, i) => i + 1);
}

describe(`Test ${sort.name}`, () => {
  it('should sort the array in ascending order', () => {
    expect(sort(range(3).reverse())).toEqual(range(3));
    expect(sort(range(5).reverse())).toEqual(range(5));
    expect(sort(range(10).reverse())).toEqual(range(10));
  });
});

range function 可以產生一個由 1 到 N 的陣列，但由於他已經是一個排序好的陣列，我們必須先透過一些方法（此範例使用 .reverse）來打亂陣列順序後，再透過執行 sort function 來確認是否已經排序好了。這樣的優點是，我們已經可以透過產生出的陣列來測試，並打亂它後再確認是否已經排序，但是，這樣我們還是只有測了「長度為 3 且內容物為 1 到 3 的陣列」、「長度為 5 且內容物為 1 到 5 的陣列」以及「長度為 10 且內容物為 1 到 10 的陣列」。

因此，為了讓測試涵蓋更多情況，我們可以再把測試改為

function range(n: number): Array<number> {
  return Array.from({ length: n }).map((_, i) => i + 1);
}

function genReversedArr(n: number): Array<number> {
  return range(n).reverse();
}

describe(`Test ${sort.name}`, () => {
  it('should sort the array in ascending order', () => {
    for (let n = 1; n < 100; n++) {
      expect(sort(genReversedArr(n))).toEqual(range(n));
    }
  });
});

這樣我們已經能測到從長度為 1 至長度為 100 的陣列，但透過 range 產生之陣列的數字間隔都只為 1（ex. [1,2,3] 或是 [1,2,3,4,5]），如果在 sort 的實作中只有處理到間隔為 1 的情況，那有可能在 input array 為 [3,5,7,9,0] 時就發生錯誤了。

但由上列範例可以看到，透過自動產生的方式，可以減少我們手刻 input 及 output 的情形，但產生之 input 的涵蓋範圍可能還是不夠廣泛，那到底該怎麼辦呢？

接下來，讓我們看看在 Property-Based Testing 中又會如何測試 reverse 及 sort。

Don’t write tests! Generate them!

在上一段落可以看到，透過自動產生之方式，可以避免我們在手刻 input 及 output 時寫錯且可以讓我們更輕鬆的測試更多 test cases，因此 John Hughes 在 Curry On! 2017 的 Don't Write Tests! 一演講中提到的是，我們不應該「寫」測試，而是要「自動產生」他們。

Property-Based Testing 會針對定義好的每個 property 透過 property-based testing 框架提供的 generator 任意產生出 100 個 test cases（通常預設為 100 個 test cases），這也是 Property-Based Testing 與 Example-Based Testing 最大的不同。

因為我們不再是只有 reverse([1,2,3]) == [3,2,1]，所以我們必須去思考，到底什麼是 property 呢？

何謂 `Property`？

一個測試代表著對該測試對象的證明。因此，一個 property 可視為該測試對象的「標準」（invariants）或是「規格」（specification）。

`Property-Based Testing` 的核心概念

在 Property-Based Testing 中，最為重要的就是他有以下三樣東西

Arbitrary（亂數產生器）
Generator（測試產生器）
Shrinker（誤區識別器）

`Arbitrary`（亂數產生器）

arbitrary 是用來告訴 pbt framework 要如何針對某 type 產生他的值，例如 fast-check 提供了 fc.boolean()，由 boolean type 可知，他可能會是 true 或是 false，通常 framework 會提供 primitive types 的 arbitrary（例如：fast-check 提供了 fc.string()、fc.integer() 等等），當然根據自定義的 type 去定義他的 arbitrary 也是可以的。

例如：

// in types.ts
export type User = Readonly<{
  name: string;
  address: string;
  age: number;
}>;

export const Color = {
  Red: null,
  Blue: null,
  Green: null,
};

export type Color = keyof typeof Color;

// in arbitraries.ts
export const user = fc.record<User>({
  name: fc.string(),
  address: fc.string(),
  age: fc.nat(), // nat 代表 natural number（自然數），畢竟人的歲數不會是負的 ^__^
});

export const color = fc.oneof(Object.keys(Color));

`Generator`（測試產生器）

Generator 則是 pbt framework 會透過 random 的方式從該 property 給的 arbitrary 中去隨機產生出 N 個 test cases（通常 N 預設為 100）。隨機方式可能依據每個 framework 而不同。

`Shrinker`（誤區識別器）

Shrinker 則是 pbt framework 在發現 failure test case 時，會透過 shrinker 找到 minimal failure test case。但不是每個 pbt framework 都支援 shrinker。

所以我們該如何透過 `Property-Based Testing` 測試 `reverse` 及 `sort` 呢？

對 reverse function 而言，reverse 的 property 就是：

一個 array 反轉兩次必須等同於原本的 array。
反轉一次的 array 的第一個 element 必須等於原 array 的最後一個 element（例如：reversed[0] === original[n - 1]、reversed[1] === original[n - 2] 等），依序遞增檢查。

透過 fast-check 的 pbt test 如下 👇

const fc = require('fast-check');

test(`Test ${reverse.name}`, () => {
  fc.assert(
    // 透過 `fc.array(fc.string())` 定義 input 為 Array<string>
    fc.property(fc.array(fc.string()), arr => {
      // 測試 invariant 1
      expect(reverse(reverse(arr))).toEqual(arr);

      // 測試 invariant 2
      const reversed = reverse(arr);
      for (let i = 0; i < arr.length; i++) {
        expect(reversed[i]).toEqual(arr[arr.length - i - 1]);
      }
    })
  );
});

而對 sort function 而言， sort 的 property 則是：

排序完的 array 必須與原 array 等長
排序後的 array 的 sorted[i - 1] 都必須 <= sorted[i]

透過 fast-check 的 pbt test 如下 👇

const fc = require('fast-check');

test(`Test ${sort.name}`, () => {
  fc.assert(
    // 透過 `fc.array(fc.integer())` 定義 input 為 Array<number>
    fc.property(fc.array(fc.integer()), arr => {
      const sorted = sort(arr);

      // 測試 invariant 1
      expect(sorted.length).toEqual(arr.length);

      // 測試 invariant 2
      for (let idx = 1; idx < sorted.length; ++idx) {
        expect(sorted[idx - 1]).toBeLessThanOrEqual(sorted[idx]);
      }
    })
  );
});

測試結果如下：

但如果我們不小心記成 sorting 時是 sorted[i - 1] < sorted[i] 使用了 toBeLessThan 而非 <=，那 shrinker 則會幫助我們找出這項錯誤，但由於 input 每次都是亂數產生的，所以不是每次都可以抓出此錯誤，可是 shrinker 可以幫助我們快速理解為何有誤：

總結

透過 Property-Based Testing 的方式，可以讓我們能夠重新思考我們的 testing target 擁有哪些 invariant 並重新檢視我們的實作是否符合這些規則。此外，支援 shrinker 的 framework 更可以透過 shrinker 來幫助我們更容易理解最小可能有誤的 case 為何。

λ. Thoughts -> Text

小朋友才『寫』測試，成熟的大人都 Property-Based Testing

什麼是 `Property-Based Testing`？

Don’t write tests!

Example-Based Testing 的問題是什麼？

Don’t write tests! Generate them!

何謂 `Property`？

`Property-Based Testing` 的核心概念

`Arbitrary`（亂數產生器）

`Generator`（測試產生器）

`Shrinker`（誤區識別器）

所以我們該如何透過 `Property-Based Testing` 測試 `reverse` 及 `sort` 呢？

總結

延伸閱讀

小朋友才『寫』測試，成熟的大人都 Property-Based Testing

什麼是 Property-Based Testing？

Don’t write tests!

Example-Based Testing 的問題是什麼？

Don’t write tests! Generate them!

何謂 Property？

Property-Based Testing 的核心概念

Arbitrary（亂數產生器）

Generator（測試產生器）

Shrinker（誤區識別器）

所以我們該如何透過 Property-Based Testing 測試 reverse 及 sort 呢？

總結

延伸閱讀

什麼是 `Property-Based Testing`？

何謂 `Property`？

`Property-Based Testing` 的核心概念

`Arbitrary`（亂數產生器）

`Generator`（測試產生器）

`Shrinker`（誤區識別器）

所以我們該如何透過 `Property-Based Testing` 測試 `reverse` 及 `sort` 呢？