module plfa.part1.Naturals where

夜空中的星星不计其数,但只有不到五千颗是肉眼可见的。 可观测宇宙中则包含大约 7*10^22 颗恒星。

星星虽多,但却是有限的,而自然数是无限的。就算用自然数把所有的星星都数尽了, 剩下的自然数也和开始的一样多。

自然数是一种归纳数据类型(Inductive Datatype)

大家都熟悉自然数,例如:

0
1
2
3
...

等等。我们将自然数的类型(Type)记作 ,并称 0123 等数 是类型 值(Value),表示为 0 : ℕ1 : ℕ2 : ℕ3 : ℕ 等等。

自然数集是无限的,然而其定义只需寥寥几行即可写出。下面是用两条推导规则(Inference Rules)定义的自然数:

--------
zero : ℕ

m : ℕ
---------
suc m : ℕ

以及用 Agda 定义的自然数:

data  : Set where
  zero : 
  suc  :   

其中 是我们定义的数据类型(Datatype)的名字,而 zero(零)和 suc后继,即 Successor 的简写)是该数据类型的构造子(Constructor)

这两种定义说的是同一件事:

  • 起始步骤(Base Case)zero 是一个自然数。
  • 归纳步骤(Inductive Case):如果 m 是一个自然数,那么 suc m 也是。

此外,这两条规则给出了产生自然数唯一的方法。因此,可能的自然数包括:

zero
suc zero
suc (suc zero)
suc (suc (suc zero))
...

我们将 zero 简写为 0;将 suc zero,零的后继数, 也就是排在零之后的自然数,简写为 1;将 suc (suc zero),也就是 suc 1, 即一的后继数,简写为 2;将二的后继数简写为 3;以此类推。

练习 seven(实践)

请写出 7 的完整定义。

-- 请将代码写在此处。

你需要为 seven 给出类型签名以及定义。在 Emacs 中使用 C-c C-l 来让 Agda 重新加载。

推导规则分析

我们来分析一下刚才的两条推导规则。每条推导规则包含写在一条水平直线上的 零条或多条判断(Judgment),称之为假设(Hypothesis);以及写在 直线下的一条判断,称之为结论(Conclusion)。第一条规则是起始步骤:它没 有任何假设,其结论断言 zero 是一个自然数。第二条规则是归纳步骤:它有 一条假设,即 m 是自然数,而结论断言 suc m 也是一个自然数。

Agda 定义分析

现在分析一下 Agda 的定义。关键字 data 表示这是一个归纳定义, 也就是用构造子定义一个新的数据类型。

ℕ : Set

表示 是新的数据类型的名字,它是一个 Set,也就是在 Agda 中对类型的称呼。 关键字 where 用于分隔数据类型的声明和构造子的声明。 每个构造子的声明独占一行,用缩进来指明它所属的 data 声明。

zero : ℕ
suc  : ℕ → ℕ

这两行给出了构造子 zerosuc 的类型签名(Signature)。 它们表示 zero 是一个自然数,suc 则取一个自然数作为参数,返回另一个自然数。

读者可能注意到 在键盘上没有对应的按键。它们是 Unicode(统一码)中的符号。每一章的结尾都会有本章节引入的 Unicode 符号列表,以及在 Emacs 编辑器中输入它们的方法。

创世故事

我们再看一下自然数的定义规则:

  • 起始步骤(Base Case)zero 是一个自然数。
  • 归纳步骤(Inductive Case):如果 m 是一个自然数,那么 suc m 也是。

等等!第二行用自然数定义了自然数,这怎么能行?这个定义难道 不会像「脱欧即是脱欧」一样无用吗?

【译注:「脱欧即是脱欧」是英国首相特蕾莎·梅提出的一句口号。】

实际上,不必通过自我指涉,我们的自然数定义也是可以被赋予意义的。 我们甚至只需要处理有限的集合,而不必涉及无限的自然数集。

我们可以将这个过程比作一个创世故事。起初,我们对自然数一无所知:

-- 起初,世上没有自然数。

现在,我们对所有已知的自然数应用之前的规则。起始步骤告诉我们 zero 是 一个自然数,所以我们将它加入已知自然数的集合中。归纳步骤告诉我们如果 「昨天的」m 是一个自然数,那么「今天的」suc m 也是一个自然数。我们在 今天之前并不知道任何自然数,所以归纳步骤在此处不适用。

-- 第一天,世上有了一个自然数。
zero : ℕ

然后我们重复此过程。今天我们知道昨天的所有自然数,以及任何 通过规则添加的数。起始步骤依然告诉我们 zero 是一个自然数,我们 已经知道这件事了。而如今归纳步骤告诉我们,由于 zero 在昨天是自然数, 那么 suc zero 在今天也是自然数:

-- 第二天,世上有了两个自然数。
zero : ℕ
suc zero : ℕ

我们再次重复此过程。现在归纳步骤告诉我们,由于 zerosuc zero 都是自然 数,因此 suc zerosuc (suc zero) 也是自然数。我们已经知道 suc zero 是自然数了,而后者 suc (suc zero) 是新加入的。

-- 第三天,世上有了三个自然数。
zero : ℕ
suc zero : ℕ
suc (suc zero) : ℕ

此时规律已经很明显了。

-- 第四天,世上有了四个自然数。
zero : ℕ
suc zero : ℕ
suc (suc zero) : ℕ
suc (suc (suc zero)) : ℕ

此过程可以继续下去。在第 n 天会有 n 个不同的自然数。每个自然数都会在 某一天出现。具体来说,自然数 n 在第 n+1 天首次出现。至此,我们并没有使 用自然数集来定义其自身,而是根据第 n 天的数集定义了第 n+1 天的数集。

像这样的过程被称作是归纳的(Inductive)。我们从一无所有开始,通过应用将 一个有限集合转换到另一个有限集合的规则,逐步生成潜在无限的集合。

定义了零的规则之所以被称作起始步骤,是因为它在我们还不知道其它自然数时 就引入了一个自然数。定义了后继数的规则之所以被称作归纳步骤,则是因为它在 已知自然数的基础上引入了更多自然数。其中,起始步骤的重要性不可小觑。如果 只有归纳步骤,那么第一天就没有任何自然数。第二天,第三天,无论多久也依旧没有。 一个没有起始步骤的归纳定义是无用的,就像「脱欧即是脱欧」一样。

哲学和历史

哲学家发现,我们对「第一天」「第二天」等说法的使用暗含了对自然数的理解。 在这个层面上,我们对自然数的定义也许某种程度上可以说是循环的,但我们不必为此烦恼。 每个人对自然数都有良好的非形式化的理解,而我们可以将它作为形式化描述自然数的基础。

尽管从人类开始计数起,自然数就被人所认知,然而其归纳定义却是近代的事情。 这可以追溯到理查德·戴德金(Richard Dedekind)于 1888 年发表的论文 Was sind und was sollen die Zahlen?”(《数是什么,应该是什么?》), 以及朱塞佩·皮亚诺(Giuseppe Peano)于次年发表的著作 “Arithmetices principia, nova methodo exposita”(《算术原理:用一种新方法呈现》)。

编译指令

在 Agda 中,任何跟在 -- 之后或者由 {--} 包裹的文字都会被视为 注释(Comment)。一般的注释对代码没有任何作用,但有一种例外, 这种注释被称作编译指令(Pragma),由 {-##-} 包裹。

{-# BUILTIN NATURAL  #-}

这一行告诉 Agda 数据类型 对应了自然数,然后编写者就可以将 zero 简写 为 0,将 suc zero 简写为 1,将 suc (suc zero) 简写为 2 了,以此类推。 必须要向编译指令给出之前声明的类型(本例中为 ),该类型有且只有两个构造子, 其中一个没有参数(本例中为 zero),另一个只接受一个所给定类型的参数(本例中为 suc)。

在启用上述简写的同时,这条编译指令也会用 Haskell 的任意精度整数类型 来提供更高效的自然数内部表示。用 zerosuc 表示自然数 n 要占用正比 于 n 的空间,而将其表示为 Haskell 中的任意精度整数只会占用正比于 n 的对数的空间。

导入模块

我们很快就能写一些包含自然数的等式了。在此之前,我们需要从 Agda 标准库 中导入相等性(Equality)的定义和用于等式推理的记法:

import Relation.Binary.PropositionalEquality as Eq
open Eq using (_≡_; refl)
open Eq.≡-Reasoning using (begin_; _≡⟨⟩_; _∎)

第一行代码将标准库中定义了相等性的模块导入到当前作用域(Scope)中, 并将其命名为 Eq。第二行打开了这个模块,也就是将所有在 using 从句中指定的名称添加到当前作用域中。此处添加的名称有相等性运算符 _≡_ 和两个项相等的证据 refl。第三行选取的模块提供了用于等价关系推理的运算符,并将 using 从句中指定的名称添加到当前作用域。此处添加的名称有 begin__≡⟨⟩__∎。我们后面会看到这些运算符的使用方法。现在暂且把它们当作现成的 工具来使用,不深究其细节。但我们会在相等性一章中 学习它们的具体定义。

Agda 用下划线来标注项(Term)在中缀(Infix)或混缀(Mixfix)运算符中项出现的位置。 因此,_≡__≡⟨⟩_ 是中缀的(运算符写在两个项之间),而 begin_ 是前缀的 (运算符写在项之前),_∎ 则是后缀的(运算符写在项之后)。

括号和分号是少有的几个不能在名称中出现的的字符,于是我们在 using 列表中不需要额外的空格来消除歧义。

自然数的运算是递归函数

既然我们有了自然数,那么可以用它们做什么呢?比如,我们能定义 加法和乘法之类的算术运算吗?

我儿时曾花费了大量的时间来记忆加法表和乘法表。最开始,运算规则看起来很 复杂,我也经常犯错。在发现递归(Recursion)时,我如同醍醐灌顶。 有了这种简单的技巧,无数的加法和乘法运算只用几行就能概括。

这是用 Agda 编写的加法定义:

_+_ :     
zero + n = n
(suc m) + n = suc (m + n)

我们来分析一下它的定义。加法是一种中缀运算符,其名为 _+_,其中参数的 位置用下划线表示。第一行指定了运算符的类型签名。类型 ℕ → ℕ → ℕ 表示 加法接受两个自然数作为参数,并返回一个自然数。中缀记法只是函数应用的简写, m + n_+_ m n 这两个项是等价的。

它的定义包含一个起始步骤和一个归纳步骤,与自然数的定义对应。起始步骤说明 零加上一个数仍返回这个数,即 zero + n 等于 n。归纳步骤说明一个数的后继数 加上另一个数返回两数之和的后继数,即 (suc m) + n 等于 suc (m + n)。在加法的 定义中,构造子出现在了等式左边,我们称之为模式匹配(Pattern Matching)

如果我们将 zero 写作 0,将 suc m 写作 1 + m,上面的定义就变成了 两个熟悉的等式。

 0       + n  ≡  n
 (1 + m) + n  ≡  1 + (m + n)

因为零是加法的幺元,所以第一个等式成立。又因为加法满足结合律,所以 第二个等式也成立。加法结合律的一般形式如下,说明运算结果与括号位置无关。

 (m + n) + p  ≡  m + (n + p)

将上面第三个等式中的 m 换成 1n 换成 mp 换成 n,我们就 得到了第二个等式。我们用等号 = 表示定义,用 断言两个已定义的事物相等。

加法的定义是递归(Recursive)的,因为在最后一行我们用加法定义了加法。 与自然数的归纳定义类似,这种表面上的循环性并不会造成问题,因为较大 的数相加是用较小的数相加定义的。这样的定义被称作是良基的(Well founded)

例如,我们来计算二加三:

_ : 2 + 3  5
_ =
  begin
    2 + 3
  ≡⟨⟩    -- 展开为
    (suc (suc zero)) + (suc (suc (suc zero)))
  ≡⟨⟩    -- 归纳步骤
    suc ((suc zero) + (suc (suc (suc zero))))
  ≡⟨⟩    -- 归纳步骤
    suc (suc (zero + (suc (suc (suc zero)))))
  ≡⟨⟩    -- 起始步骤
    suc (suc (suc (suc (suc zero))))
  ≡⟨⟩    -- 简写为
    5
  

我们可以按需展开简写,把同样的推导过程写得更加紧凑。

_ : 2 + 3  5
_ =
  begin
    2 + 3
  ≡⟨⟩
    suc (1 + 3)
  ≡⟨⟩
    suc (suc (0 + 3))
  ≡⟨⟩
    suc (suc 3)
  ≡⟨⟩
    5
  

第一行取 m = 1n = 3 匹配了归纳步骤,第二行取 m = 0n = 3 匹配了归纳步骤,第三行取 n = 3 匹配了起始步骤。

以上两个推导过程都由一个类型签名(包含冒号 : 的一行)和一个提供对应类型 的项的绑定(Binding)(包含等号 = 的一行及之后的部分)组成。在编写代码时 我们用了虚设名称 _。虚设名称可以被重复使用,在举例时非常方便。除了 _ 之外 的名称在一个模块里只能被定义一次。

这里的类型是 2 + 3 ≡ 5,而该等式写成列表形式的等式链的项,提供了类型中表示 等式成立的证据(Evidence)。该等式链由 begin 开始,以 结束( 可读作「qed(证毕)」或「tombstone(墓碑符号)」,后者来自于其外观), 并由一系列 ≡⟨⟩ 分隔的项组成。

注意,上面的证明以彩色显示,表示 Agda 已经处理并接受了这些代码, 因此可以保证它们没有类型错误。在 Agda 中处理后,Emacs 源文件中会以同样的颜色显示。 在 Emacs 中,右键单击任何彩色的符号,例如 +suc,就会跳转到该符号的定义。

其实,以上两种证明都比实际所需的要长,下面的证明就足以让 Agda 满意了。

_ : 2 + 3  5
_ = refl

Agda 知道如何计算 2 + 3 的值,也可以立刻确定这个值和 5 是一样的。如果一个 二元关系(Binary Relation)中每个值都和自己相关,我们称这个二元关系满足 自反性(Reflexivity)。在 Agda 中,一个值等于其自身的证据写作 refl

在等式链中,Agda 只检查每个项是否都能化简为相同的值。如果我们打乱等式顺序, 省略或者加入一些额外的步骤,证明仍然会被接受。我们需要自己来保证等式的顺序 便于理解。

在这里,2 + 3 ≡ 5 是一个类型,等式链(以及 refl)都是这个类型的项。 换言之,我们也可以把每个项都看作断言 2 + 3 ≡ 5证据。这种解释的 对偶性——类型即命题,项即证据——是我们在 Agda 中形式化各种概念的核心, 也是贯穿本书的主题。

注意,当我们使用证据这个词时不容一点含糊。这里的证据确凿不移, 不像法庭上的证词一样必须被反复权衡以决定证人是否可信。 我们也会使用证明一词表达相同的意思,在本书中这两个词可以互换使用。

练习 +-example(实践)

计算 3 + 4,将你的推导过程写成等式链,为 + 使用等式。

-- 请将代码写在此处。

乘法

一旦我们定义了加法,我们就可以将乘法定义为重复的加法。

_*_ :     
zero    * n  =  zero
(suc m) * n  =  n + (m * n)

计算 m * n 返回的结果是 mn 之和。

重写定义再一次给出了两个熟悉的等式:

0       * n  ≡  0
(1 + m) * n  ≡  n + (m * n)

因为零乘任何数都是零,所以第一个等式成立。因为乘法对加法有分配律,所以 第二个等式也成立。乘法对加法的分配律的一般形式如下:

(m + n) * p  ≡  (m * p) + (n * p)

将上面第三个等式中的 m 换成 1n 换成 mp 换成 n,再根据 一是乘法的幺元,也就是 1 * n ≡ n,我们就得到了第二个等式。

这个定义也是良基的,因为较大的数相乘是用较小的数相乘定义的。

例如,我们来计算二乘三:

_ =
  begin
    2 * 3
  ≡⟨⟩    -- 归纳步骤
    3 + (1 * 3)
  ≡⟨⟩    -- 归纳步骤
    3 + (3 + (0 * 3))
  ≡⟨⟩    -- 起始步骤
    3 + (3 + 0)
  ≡⟨⟩    -- 化简
    6
  

第一行取 m = 1n = 3 匹配了归纳步骤,第二行取 m = 0n = 3 匹配了归纳步骤,最后第三行取 n = 3 匹配了起始步骤。在这里我们省略了 _ : 2 * 3 ≡ 6 的签名,因为它很容易从对应的项推导出来。

练习 *-example(实践)

计算 3 * 4,将你的推导过程写成等式链,为 * 使用等式。 (不必写出 + 求值的每一步。)

-- 请将代码写在此处。

练习 _^_(推荐)

根据以下等式写出乘方的定义。

m ^ 0        =  1
m ^ (1 + n)  =  m * (m ^ n)

检查 3 ^ 4 是否等于 81

-- 请将代码写在此处。

饱和减法

我们也可以定义减法。由于没有负的自然数,如果被减数比减数小, 我们就将结果取零。这种针对自然数的减法变种称作饱和减法(Monus,由 minus 修改而来)

饱和减法是我们首次在定义中对两个参数都使用模式匹配:

_∸_ :     
m      zero   =  m
zero   suc n  =  zero
suc m  suc n  =  m  n

我们可以通过简单的分析来说明所有的情况都被考虑了。

  • 考虑第二个参数。
    • 如果它是 zero,应用第一个等式。
    • 如果它是 suc n,考虑第一个参数。
      • 如果它是 zero,应用第二个等式。
      • 如果它是 suc m,应用第三个等式。

Agda will raise an error if all the cases are not covered. As with addition and multiplication, the recursive definition is well founded because monus on bigger numbers is defined in terms of monus on smaller numbers.

例如,我们来计算三减二:

_ =
  begin
    3  2
  ≡⟨⟩
    2  1
  ≡⟨⟩
    1  0
  ≡⟨⟩
    1
  

我们没有使用第二个等式,但是如果被减数比减数小,我们还是会用到它。

_ =
  begin
    2  3
  ≡⟨⟩
    1  2
  ≡⟨⟩
    0  1
  ≡⟨⟩
    0
  

我们对饱和减法的定义确保了只有一条等式可以应用。 假设我们将第二条以下文取而代之

zero  ∸ n  =  zero

那样就不清楚 Agda 应该使用第一条或者第二条来简化 zero ∸ zero。 在这样的情况下,两者都可以相同的答案 zero,但这不一定是普遍的情况。 将

{-# OPTIONS --exact-split #-}

写在文件的开始可以让 Agda 在不同情况相互重叠时产生一个错误, 有些时候这会有帮助。我们会在逻辑连接符部分 展示一个这样的例子。

练习 ∸-example₁∸-example₂(推荐)

计算 5 ∸ 33 ∸ 5,将你的推导过程写成等式链。

-- 请将代码写在此处。

优先级

我们经常使用优先级(Precedence)来避免书写大量的括号。 函数应用比其它任何运算符都结合得更紧密(即有更高的优先级),所以我们 可以用 suc m + n 来表示 (suc m) + n。另一个例子是,我们说乘法比 加法结合得更紧密,所以可以用 n + m * n 来表示 n + (m * n)。我们有 时候也说加法是左结合的,所以可以用 m + n + p 来表示 (m + n) + p

在 Agda 中,中缀运算符的优先级和结合性需要被声明:

infixl 6  _+_  _∸_
infixl 7  _*_

它声明了运算符 _+__∸_ 的优先级为 6,运算符 _*_ 的优先级 为 7。因为加法和饱和减法的优先级更低,所以它们结合得不如乘法紧密。 infixl 意味着三个运算符都是左结合的。编写者也可以用 infixr 来表示 某个运算符是右结合的,或者用 infix 来表示总是需要括号来消除歧义。

柯里化

我们曾将接受两个参数的函数表示成「接受第一个参数,返回接受第二个 参数的函数」的函数。这种技巧叫做柯里化(Currying)

与 Haskell 和 ML 等函数式语言类似,Agda 在设计时就考虑了让柯里化更加易用。 函数箭头是右结合的,而函数应用是左结合的。

比如

ℕ → ℕ → ℕ 表示 ℕ → (ℕ → ℕ)

_+_ 2 3 表示 (_+_ 2) 3

_+_ 2 这个项表示一个「将参数加二」的函数,因此将它应用到三就得到了五。

柯里化是以哈斯凯尔·柯里(Haskell Curry)的名字命名的,编程语言 Haskell 也是。 柯里的工作可以追溯到 19 世纪 30 年代。当我第一次了解到柯里化时, 有人告诉我柯里化的命名是个归因错误,因为在 20 年代同样的想法就已经被 Moses Schönfinkel 提出了。我也听说过这样一个笑话:「(柯里化)本来该命名成 Schönfinkel 化的,但是咖喱(Curry)更好吃」。直到之后我才了解到, 这个归因错误的解释本身也是个归因错误。柯里化的概念早在戈特洛布·弗雷格 (Gottlob Frege)发表于 1879 年的 “Begriffsschrift”(《概念文字》)中就出现了。

又一个创世故事

和归纳定义中用自然数定义了自然数一样,递归定义也用加法定义了加法。

同理,无需利用循环性,我们的加法定义也是可以被赋予意义的。 为此,我们需要将加法的定义归约到用于判断相等性的等价的推导规则上来。

n : ℕ
--------------
zero + n  =  n

m + n  =  p
---------------------
(suc m) + n  =  suc p

假设我们已经定义了自然数的无限集合,指定了判断 n : ℕ 的意义。 第一条推导规则是起始步骤。它断言如果 n 是一个自然数,那么零加上它得 n。 第二条推导规则是归纳步骤。它断言如果 m 加上 np,那么 suc m 加 上 nsuc p

我们同样借创世故事来帮助理解,不过这次关注的是关于加法的判断。

-- 起初,我们对加法一无所知。

现在对所有已知的判断应用之前的规则。起始步骤告诉我们,对于 每个自然数 n 都有 zero + n = n,因此我们添加所有的这类等式。 归纳步骤告诉我们,如果「昨天」有 m + n = p,那么「今天」 就有 suc m + n = suc p。在今天之前,我们不知道任何关于加法的等式, 因此这条规则不会给我们任何新的等式。

-- 第一天,我们知道了 0 为被加数的加法。
0 + 0 = 0     0 + 1 = 1    0 + 2 = 2     ...

然后我们重复这个过程。今天我们知道来自昨天的所有等式,以及任何通过 规则添加的等式。起始步骤没有告诉我们任何新东西,但是归纳步骤添加了更多的等式。

-- 第二天,我们知道了 0,1 为被加数的加法。
0 + 0 = 0     0 + 1 = 1     0 + 2 = 2     0 + 3 = 3     ...
1 + 0 = 1     1 + 1 = 2     1 + 2 = 3     1 + 3 = 4     ...

我们再次重复这个过程:

-- 第三天,我们知道了 0,1,2 为被加数的加法。
0 + 0 = 0     0 + 1 = 1     0 + 2 = 2     0 + 3 = 3     ...
1 + 0 = 1     1 + 1 = 2     1 + 2 = 3     1 + 3 = 4     ...
2 + 0 = 2     2 + 1 = 3     2 + 2 = 4     2 + 3 = 5     ...

此时规律已经很明显了:

-- 第四天,我们知道了 0,1,2,3 为被加数的加法。
0 + 0 = 0     0 + 1 = 1     0 + 2 = 2     0 + 3 = 3     ...
1 + 0 = 1     1 + 1 = 2     1 + 2 = 3     1 + 3 = 4     ...
2 + 0 = 2     2 + 1 = 3     2 + 2 = 4     2 + 3 = 5     ...
3 + 0 = 3     3 + 1 = 4     3 + 2 = 5     3 + 3 = 6     ...

此过程可以继续下去。在第 m 天我们将知道所有被加数小于 m 的等式。

如上所示,归纳定义和递归定义的的推导过程十分相似。它们就像一枚硬币的两面。

有限的创世故事

前面的创世故事是用分层的方式讲述的。首先,我们创造了自然数的无限集合。 然后,我们构造加法的实例时把自然数集视为现成的,所以即使在第一天我 们也有一个无限的实例集合。

然而,我们也可以选择同时构造自然数集和加法的实例。这样在任何一天都只会有 一个有限的实例集合。

-- 起初,我们一无所知。

现在,对我们已知的所有判断应用之前的规则。只有自然数的起始步骤适用:

-- 第一天,我们知道了零。
0 : ℕ

我们再次应用所有的规则。这次我们有了一个新自然数,和加法的第一个等式。

-- 第二天,我们知道了一和所有和为零的加法算式。
0 : ℕ
1 : ℕ    0 + 0 = 0

然后我们重复这个过程。我们通过加法的起始步骤得到了一个等式,也通过在前一天 的等式上应用加法的归纳步骤得到了一个等式:

-- 第三天,我们知道了二和所有和为一的加法算式。
0 : ℕ
1 : ℕ    0 + 0 = 0
2 : ℕ    0 + 1 = 1   1 + 0 = 1

此时规律已经很明显了:

-- 第四天,我们知道了三和所有和为二的加法算式。
0 : ℕ
1 : ℕ    0 + 0 = 0
2 : ℕ    0 + 1 = 1   1 + 0 = 1
3 : ℕ    0 + 2 = 2   1 + 1 = 2    2 + 0 = 2

在第 n 天会有 n 个不同的自然数和 n × (n-1) / 2 个加法等式。 数字 n 和所有和小于 n 的加法等式在第 n+1 天首次出现。这提供了 一种无限的数据集合及与之相关的等式的有限主义视角。

交互式地编写定义

Agda 被设计为使用 Emacs 作为文本编辑器,二者一同提供了很多能帮助 用户交互式地创建定义和证明的功能。

我们从输入以下代码开始:

_+_ : ℕ → ℕ → ℕ
m + n = ?

问号表示你希望 Agda 帮助你填入这部分代码。如果按下组合键 C-c C-l (按住 Control 键的同时先按 c 键再按 l 键,l 键代表载入 load),这个问号会被替换:

_+_ : ℕ → ℕ → ℕ
m + n = { }0

这对花括号被称作一个洞(Hole),0 是这个洞的编号。洞将会被高亮显示为 绿色(或蓝色)。同时,Emacs 会创建一个窗口显示如下文字:

?0 : ℕ

这表示 0 号洞需要填入一个类型为 的项。按组合键 C-c C-ff 键代表向前 forward)会移动到下一个洞。

我们希望在第一个参数上递归来定义加法。 将光标移至 0 号洞并按 C-c C-cc 键代表分情况讨论 case),你将看见如下提示:

pattern variables to case (empty for split on result):

即「用于分项的模式变量(留空以对结果分项):」。

键入 m 会对名为 m 的变量分项(即自动模式匹配),并将代码更新为:

_+_ : ℕ → ℕ → ℕ
zero + n = { }0
suc m + n = { }1

现在有两个洞了。底部的窗口会告诉你每个洞所需的类型:

?0 : ℕ
?1 : ℕ

移动至 0 号洞,按下 C-c C-, 会显示当前洞所需类型的具体信息,以及 可用的自由变量:

Goal: ℕ
————————————————————————————————————————————————————————————
n : ℕ

这些信息强烈建议了用 n 填入该洞。填入内容后,你可以按下 C-c C-空格 来移除这个洞。

_+_ : ℕ → ℕ → ℕ
zero + n = n
suc m + n = { }1

同理,移动到 1 号洞并按下 C-c C-, 会显示当前洞所需类型的具体信息, 以及可用的自由变量:

Goal: ℕ
————————————————————————————————————————————————————————————
n : ℕ
m : ℕ

移动到一个洞并按下 C-c C-rr 键表示细分 refine)会将一个构造子填入这个洞(如果有唯一的选择的话), 或者告诉你有哪些可用的构造子以供选择。在当前情况下,编辑器会显示如下内容:

Don't know which constructor to introduce of zero or suc

即「不知道在 zerosuc 中该引入哪一个构造子」。

我们将 suc ? 填入并按下 C-c C-空格,它会将代码更新为:

_+_ : ℕ → ℕ → ℕ
zero + n = n
suc m + n = suc { }1

移动到新的洞并按下 C-c C-, 给出了和之前类似的信息:

Goal: ℕ
————————————————————————————————————————————————————————————
n : ℕ
m : ℕ

我们可以用 m + n 填入该洞并按 C-c C-空格 来完成程序:

_+_ : ℕ → ℕ → ℕ
zero + n = n
suc m + n = suc (m + n)

在如此简单的程序上频繁使用交互操作可能帮助不大, 但是同样的技巧能够帮助你构建更复杂的程序。甚至对于加法定义这么简单的程序,使用 C-c C-c 来分项仍然是有用的。

更多编译指令

{-# BUILTIN NATPLUS _+_ #-}
{-# BUILTIN NATTIMES _*_ #-}
{-# BUILTIN NATMINUS _∸_ #-}

以上几行告诉 Agda 这几个运算符和数学中常用的运算符相对应, 以便让它在计算时使用相应的,可处理任意精度整数类型的 Haskell 运算符。 计算 mn 时,用 zerosuc 表示的自然数需要正比于 m 的时间, 而用 Haskell 整数表示的情况下只需要正比于 mn 中较大者的对数的时间。 类似地,计算 mn 时,用 zerosuc 表示的自然数需要正比于 mn 的 时间,而用 Haskell 整数表示的情况下只需要正比于 mn 的对数之和的时间。

练习 Bin(拓展)

使用二进制系统能提供比一进制系统更高效的自然数表示。我们可以用一个比特串来表示一个数:

data Bin : Set where
  ⟨⟩ : Bin
  _O : Bin  Bin
  _I : Bin  Bin

例如,以下比特串

1011

代表数字十一被编码为了

⟨⟩ I O I I

由于前导零的存在,表示并不是唯一的。因此,十一同样可以 表示成 001011,编码为:

⟨⟩ O O I O I I

定义这样一个函数

inc : Bin → Bin

将一个比特串转换成下一个数的比特串。比如,1100 编码了十二,我们就应该有:

inc (⟨⟩ I O I I) ≡ ⟨⟩ I I O O

实现这个函数,并验证它对于表示零到四的比特串都能给出正确结果。

使用以上的定义,再定义一对函数用于在两种表示间转换。

to   : ℕ → Bin
from : Bin → ℕ

对于前者,用没有前导零的比特串来表示正数,并用 ⟨⟩ O 表示零。 验证这两个函数都能对零到四给出正确结果。

-- 请将代码写在此处。

标准库

在每一章的结尾,我们将展示如何在标准库中找到相关的定义。 自然数,它们的构造子,以及用于自然数的基本运算符,都在标准库模块 Data.Nat 中定义:

-- import Data.Nat using (ℕ; zero; suc; _+_; _*_; _^_; _∸_)

正常情况下,我们会以运行代码的形式展示一个导入语句, 这样如果我们尝试导入一个不可用的定义,Agda 就会报错。 不过现在,我们只在注释里展示了这个导入语句。这一章和标准库 都调用了 NATURAL 编译指令。我们是在 上使用,而标准库是在 等价的类型 Data.Nat.ℕ 上使用。这样的编译指令只能被调用一次,因为 重复调用会导致 2 到底是类型 的值还是类型 Data.Nat.ℕ 的 值这样的困惑。重复调用其它的编译指令也会导致同样的问题。基于这个原因, 我们在后续章节中通常会避免使用编译指令。更多关于编译指令的信息可在 Agda 文档中找到。

Unicode

这一章使用了如下的 Unicode 符号:

ℕ  U+2115  双线体大写 N (\bN)
→  U+2192  右箭头 (\to, \r, \->)
∸  U+2238  点减 (\.-)
≡  U+2261  等价于 (\==)
⟨  U+27E8  数学左尖括号 (\<)
⟩  U+27E9  数学右尖括号 (\>)
∎  U+220E  证毕 (\qed)

以上的每一行均包含 Unicode 符号(如 ),对应的 Unicode 码点(如 U+2115), 符号的名称(如 双线体大写 N),以及用于在 Emacs 中键入该符号的按键序列(如 \bN)。

通过 \r 命令可以查看多种右箭头符号。在输入 \r 后,你可以 按左、右、上、下键来查看或选择可用的箭头符号。这个命令会记住你上一次选择的位置, 并在下一次使用时从该字符开始。用于输入左箭头的 \l 命令的用法与此类似。

除了在输入箭头的命令中使用左、右、上、下键以外,以下按键也可以起到相同的作用:

C-b  左(后退一个字符)
C-f  右(前进一个字符)
C-p  上(到上一行)
C-n  下(到下一行)

C-b 表示按 Control + b,其余同理。你也可以直接输入显示的列表中的数字编号来选择。

要查看所支持字符的完整列表,请执行 agda-input-show-translations 命令:

M-x agda-input-show-translations

这样会显示出 agda-mode 中所有支持的字符。我们用 M-x 表示按下 ESC 后再按下 x

如果你想知道如何在 agda 文件中输入一个特定的 Unicode 字符,请将光标移至该字符上, 然后执行 quail-show-key 命令:

M-x quail-show-key

你会在迷你缓冲区中看到输入该字符所需的按键序列。 例如,如果你在 上执行 M-x quail-show-key,就会看到该字符的按键序列为 \.-