再谈函数和一等公民

本文首发自本人博客 eczn.github.io/blog/cc2509… 以下是原文:

写篇文章再谈谈函数和一等公民,因为我发现了些有趣的东西。

先前想在自己的 函数式方言解释器 里实现 元组 这种数据结构,但是没有什么方向,就去看了下 Scheme 的语法,看了下 Wiki,然后不知不觉间,看到了用 Lisp 实现 Pair。

Lisp 你可能听过,这里我们不需要它,但后面的 Pair 是啥,它其实是一种很简单的数据结构,类似这样,用 TyepScript 表示就是这样:

// 创建一个 pair
function cons(l: number, r: number) {
    return [l, r]
}

// 取出 pair 的左边 
function car(my_pair: number[]) {
    return my_pair[0]; 
}

// 取出右边 
function cdr(my_pair: number[]) {
    return my_pair[1]; 
}
复制代码

闲话一下,scheme 里创建 pair 的函数名就是 cons,还有它的两个操作 car 和 cdr 也是这个名字,因此本文也都用这个名字。

好吧,进入正题,形如上面这种样子的数据结构,叫做 Pair,在很多 js 库里也有它的存在,比如 React.useState 返回的是左边是值,右边是 dispatcher 的 pair。

但我们这里讨论的是利用了数组去实现的,有没有别的方法去实现这种数据结构呢?答案当然是有的啦,下文将会给出仅利用函数的方式来实现这种数据结构,以及仅用函数去实现链表、二叉树。

Pair 的函数式实现

因为本人一开始是想在自己写的的一个函数式方言的解释器里加上 pair 这个类型的,因此看了 Pair 的函数式实现,如下:

;; 代码从 Wiki 摘录
;; https://en.wikipedia.org/wiki/Cons

(define (cons x y)
    (lambda (m) (m x y)))

(define (car z)
    (z (lambda (p q) p)))

(define (cdr z)
    (z (lambda (p q) q)))
复制代码

翻译成 TypeScript 就是这样:

// 姑且把 Pair 这种数据结构类型定义为函数
type Pair = Function; 

// 创建一个 cons
function cons(x: number, y: number): Pair {
    return (how_to_do_it: Function) => {
        return how_to_do_it(x, y); 
    }
}

// 取出 pair 的左值
function car(pair: Pair) {
    return pair((l, r) => l)
}

// 取出 pair 的右值
function cdr(pair: Pair) {
    return pair((l, r) => r)
}

const xy = cons(1, 2); 
// 调用 cons 返回一个函数

const x = car(xy); 
// => 1 

const y = cdr(xy); 
// => 2
复制代码

以上代码完美的体现了函数是一等公民这个概念,因为我们仅利用了函数去实现数据结构,这才是一等公民背后的意义。

挑战:函数式链表

现在,我们有了 Pair,它有两个值,此外,这两个值也是有序的,它可以用来构造链表吗?

扫描二维码关注公众号,回复: 5023650 查看本文章

当然可以,因为我们没有考虑到它有两个值里的值是啥。Pair 里的左值右值,既可以是数字,也可以是另一个 Pair,也就是说,Pair 里可以嵌套 Pair,据此可以递归地定义链表:

Pair(number, number | Pair | null) 当且仅当右值为 null 的时候,我们才认为链表到达了尽头

由上面的讨论可以很容易的利用 Pair 递归地构造出链表,也就是说,可以仅用函数实现链表。

或许你还没理解所谓递归地定义链表是啥意思,你可以看看下面的代码形式,便一目了然:

cons(1, cons(2, cons(3))) 1 -> 2 -> 3

根据上面的讨论,其 TypeScript 实现如下:

type Pair = Function;

function cons(x: number, y?: number | Pair): Pair {
    return (how_to_do_it: Function) => {
        return how_to_do_it(x, y); 
    }
}

function car(pair: Pair) {
    return pair((l, r) => l)
}

function cdr(pair: Pair) {
    return pair((l, r) => r)
}

// 取出链表的第 n 个
function nth(pair: Pair, n: number) {
    if (n === 0) {
        return car(pair); 
    } else {
        return nth(cdr(pair), n - 1); 
    }
}

const lst = cons(1, cons(2, cons(3)))
// 1 -> 2 -> 3 

const number = nth(lst, 0); 
// => 1 
复制代码

可以看到,cons 的 y 可以为空或者也是一个 pair 了,这里存在递归,因此取链表的时候用递归实现比较容易。

挑战:函数式二叉树

上面的讨论已经实现了链表,而链表里一个最特殊的地方便是引用,如果引用变成两个,链表就可以推广成二叉树。

以下是我的实现:

// 在把函数作为一等公民的语言里,
// 函数是一种数据类型/结构
type Tree = Function;

// 函数式二叉树
// 如果不指定范型,则认为树上存的值是数字; 
function Tree<T = number>(v: T, l?: Tree, r?: Tree): Tree {
    return (how_to_do_it: Function) => {
        return how_to_do_it(v, l, r); 
    }
}

// 取左子树
function lchild(tree: Tree) {
    return tree((v, l, r) => l);
}

// 取右子树
function rchild(tree: Tree) {
    return tree((v, l, r) => r); 
}

// 取值 
function valOf(tree: Tree) {
    return tree((v, l, r) => v); 
}

// 函数式二叉树的前序遍历
function traversal(t?: Tree) {
    if (!t) return;

    const l = lchild(t); 
    const r = rchild(t); 
    const v = valOf(t); 

    console.log(v); 
    
    traversal(l); 
    traversal(r); 
}

// 创建一棵树。。。
// 虽然有点绕... 
const t = 
               Tree(1,
    Tree(2, 
Tree(3), Tree(4)), Tree(5, Tree(6)))
// 结构如下: 
//        1
//     /    \
//   2       5 
//  / \     /
// 3   4   6 


// 先序遍历结果
traversal(t); 
// => 打印:123456
复制代码

上面的代码实现了二叉树的表示,并给出了二叉树的先序遍历方式。

那么,什么是函数呢?

我还不知道 233,不过时断时续的学习函数式语言,每次都有不同的收获是真。

上面的说明里可以窥见,所谓函数是一等公民,其实意味着函数可以实现编程语言里的其他事物,如数据结构。

这部分涉及到了 Lambda Calculus 这方面我学习的不深。。。。不展开了。

猜你喜欢

转载自juejin.im/post/5c46be83f265da6151150b14