Eric 今日美政
从今天开始, 我们进入了本书的第二章节。这一章节的题目叫 “物质变成了智能”,题目下一行小字引用了美国天体物理学家 Edward Harrison 的一句名言,“给氢原子足够的时间,它们就变成了人类。” Hydrogen … given enough time, turns into people。相比之下,我更喜欢Harrison 教授的另一个表达,他说 :“只要给氢原子足够的时间,氢原子就开始问‘我从哪里来,我要到哪里去’”。两句话表达的是同样的意思,都是说宇宙从最简单的原子结构,在时间的长河里发育出了智慧生命。只是后一句的表达更加精妙一些。
我们人类的想象力在面对宇宙这种尺度的时候,往往会显得不够用了。这其实表现在两个方面,一是空间方面,我们无法想象原子有多么小,而太阳系有多么大,我们和其他星系之间有多远。一个科学计数法展现在我们面前的数字往往我们都难以去想象它们到底代表了多大的尺度。比如说,我们已经知道原子非常小了。但实际上,最前沿的弦理论说,构成原子的基本单位是一根震动着的能量弦。弦有多小呢?如果弦的尺寸是一个足球的话,那么一个质子的尺寸就差不多有小半个银河系那么大。这种大和这种小,都超过了我们人类的想象力。时间上也是一样。至今很多人不相信进化论。因为我们很难想象物种在漫长的几百万,数十亿年内的逐渐演变。但时间确实可以创造奇迹,从最简单的氢原子,137 亿年之后,发育出了智慧生命。
当然,对时空的久远浩瀚的感叹,并非本章的重点。本章主要讨论了四个最基本的概念。分别是,什么智能,什么是记忆,什么是计算,和什么是学习。我们今天就来介绍前两个问题。什么是智能,什么是记忆。
作者托克马克回忆了一次在瑞典召开的人工智能研讨会,非常有趣的是,那些顶尖的人工智能研究者们,无法在什么叫 “智能” 这个问题上达成一致。最后,托克马克试图采取一种最广义的定义,即智能就是可以完成复杂目标的能力。他承认这是一个非常模糊的概念,比如说一个可以完成吞噬细菌的人体白细胞,它们有智能吗?这很难说。但智能高低还是有比较的方式的,比如说一台计算机能下象棋,而另一台计算机不但能下象棋,还同时能帮我们写文章,那么后者的智能就比前者要来的高。
托克马克认为,目前计算机甚至普通机器,都可以算有一定智能,但和人类智能相比,最大的区别在于通用度上,或者说智能的广度上。一台可以下赢国际象棋大师的计算机,你不能说它没有智能。但是,计算机的智能非常狭窄,深蓝只会下象棋,一句话都不会说,更不可能识别人脸。但一个普通人类孩子,经过简单培训,不但会下象棋(也许没有深蓝下得好),还能学会很多其他东西,识别人脸更是几乎是本能。机器能够完成的任务面非常狭窄,但却在不断增多。我们最感兴趣的其实是具有和人类一样,并且超越人类的,广泛的任务完成和学习进步能力的计算机。这就是我们所说的 “人工智能,AGI。目前的情况是,计算机胜出的领域相对狭窄,但正在不断地扩大。书中举了一个形象的比喻,说人类擅长的智能部分好像地球上的一座座高山。但是人工智能目前就像不断上涨的海平面。海平面只要继续涨下去,那么必然覆盖人类所有的智能高峰。而且人工智能很快也不再需要人类的设计和训练,它们将会自己设计自己,自己生产自己,自己提高自己。理解到这里,大家都不会有太大问题。
接下来托克马克要谈的,其实是一个很重要的问题,但经常被我们读者给忽略了。能明白这个问题,对于接下来的托克马克要谈的对人工智能的控制,非常关键。
托克马克不是说,只要是有能够完成复杂目标能力的东西,都算是有智能的吗?那么,如果一只海狸砸碎一块石头,然后用碎石头阻塞一条小溪流,这种能力当然是被理解为智能。但是,如果是地球重力从山上偶然拉下来一块大石头,大石头摔碎了,成为小石块,掉入山涧,阻塞了这条小溪流,这是不是智能的表现?
你可能会说,这是一个抬杠的问题。自然掉下来的石头虽然完成了同样复杂的任务,但那是没有事先希望要达成的目标的。没错,接下来托克马克要说的是,目标这个东西,应该人类才有的,不是机器具有的。一个为你做早餐的机器人,它要完成的,并非是自己的目标,而是人类的目标。那么这是不是说机器人没有智能,和重力拉石头下山一样呢?当然不是。因为机器人会把你给他的目标进行拆分,形成各种分目标。比如说,他要去冰箱里找食材,他要把炉子启动,要让食物变熟,甚至还要付账单等等。这些目标可是机器人自己建立的,是根据你 “给我做早餐” 的总目标自行拆分出来的。所以,既然机器人自己产生了目标,而且去完成目标,那么机器人就是一种智能生物。
请注意,这里是重点中的重点,甚至可以说是全书的核心。即我们要关心的,不是机器人或者人工智能是不是 “觉醒了”,意识到自己存在了,因此要来消灭人类了。这种情况的本质,是机器产生了自己的独立的目标。这是否可能发生,我们并不知道;但是,更可能发生的情况是,我们自己给了机器人或者人工智能一个总的目标,比如说做早饭,但是人工智能为了达到这个总目标,而将之拆解成了各种分目标。这些分目标,可是实实在在由机器自己产生的,也是最可能出问题的部分。这个问题,托克马克在后面的讲述中,还会多次强调,每次都更加具体,更加接近真实生活中,我们将会遇到的人工智能的安全性问题。
第二个问题,什么叫记忆?在本书中,记忆的本质其实就是可以被保存的信息。而且这种信息和现实存在对应关系。比如说现实中有一座山,你画了幅画,画里有这个山;而且画作被保留下来了。那么这幅画,就可以被看作是关于这座山的记忆。
这里的重点是,记忆只是信息,和代表这些信息的基础物质没有关系。关于这座山的记忆,可以是一幅画,也可以是一篇小说,也可以是一张光盘,甚至也可以是口头传说。记忆的本质,只是信息。可以说,是无形的东西。由于智能必须和记忆向结合,所以我们也可以说智能的核心是无形的,智能只是对信息的处理。
一个好消息是,我们记录信息的成本现在是越来越低了。计算机内存每 20 年就要便宜 1000 倍。这是一个惊人的速度。我到现在还记得我在中国上大学的时候,大约 1990 年前后,全校引起轰动的一件事,是我们的一台小型机主机上,装上了 64K 的内存。我们都竞相到主机房去参观,看 64 k 的内存长什么样。事实上,这个传说中的大内存比今天很多计算机的主板都宽大。而现在,我电脑的内存是 32 个 G,记忆信息的量大了 50 万倍,而价格比那个 64 K的大内存要便宜得多。
但是与此相对的,生物的记忆也在进步,但进步的速度就要慢太多了。生物最早是靠 RNA 来记忆生物性状的。我们已知的最早的生物可能是一种细菌,它的 RNA 记忆了大概 40 K字节的信息。后来生物演化出了 DNA。因为 RNA 是单链的,而 DNA 是一种双链螺旋结构,因此 DNA 比 RNA 要稳定很多,也就成了生物遗传记忆的主流。我们人类 DNA 大概能存储 1.6 GB 的信息和一部普通清晰度的电影的信息量差不多。
接下来托克马克谈到一件很有趣的事情,就是我们人类的记忆方式和计算机的记忆方式是不同的。计算机的记忆是按地址去记忆。有基础计算机知识的朋友们都知道,所谓读取记忆,就是程序规定了,下面这个数据来自哪个地址的记忆内容。计算机里每一个地址都有编号。按地址去提取数据,提取记忆。但人类不是。人类的记忆更像是搜索引擎,按相似度去搜寻记忆内容。
人的大脑的记忆机制到目前为止我们还不完全清楚,比较主流的猜测是这样的。信息进入大脑之后,引起大脑局部的一些结构性改变。比如说一个神经元受到刺激,和另一个神经元产生了一次新的连接。这种连接改变了神经元连接的拓扑结构。一种固定的拓扑结构可能就对应着一个记忆的信息源。同时也构成了一种消耗能量最小的通路(因为有直接的连接)。我们在回忆一件事情,或者试图提取自己的某个记忆的时候,大脑自动去找这些能量最低点,就会逐渐引导我们的注意力点最终注意到这个产生了直接连接的能量消耗最低点。当然这目前只是一种假说,没有被完全证明。但这确实很好地解释了我们人类的很多记忆现象。我们的记忆是一种联想式的记忆,我们不知道某个记忆到底在大脑的哪一个地址上,但我们根据能量消耗最低原则,去找那个和我们概念里最接近的那个结构在哪里,这些结构也就对应着我们的记忆。所以我们会出现记忆错误,张冠李戴。或者反过来,记忆自动被纠正现象。比如我好像记得我小时候某次演出穿的是蓝色裤子,因为那时候小学演出经常要求大家穿白衬衫蓝裤子。但是很快我会发现,不对,那一次演出的时候,有人嘲笑过我我穿的裤子是女孩子裤子的颜色,然后我又想起了,对了,那次演出我穿的其实是红色的裤子,所以才被其他同学笑。整个这个回忆的过程,大家可以看出,是一种联想的模式,逐渐从一些外围的相似的信息,去逼近最终的那个记忆。那么这种人类和机器的记忆模式的不同,未来会不会影响人工智能模式的修改呢?这个我们以后再讲。
好,今天的介绍就到这里,下周我们再介绍另外两个问题:什么是计算,什么是学习。这一章的主体,其实是让我们更直观地去理解,人工智能到底包括那些构成。
Eric