计算(学)的反历史
Counterhistories of Computing
发言人:Rodrigo Ochigame(罗德里戈·落亀)
编译:张铎瀚
校对:黄孙权,崔雨,卢睿洋,久久
编者注:本演讲原配图几乎均为演讲者在研究过程中收集或拍摄的一手图片,由于未经版权方/当事人授权,故演讲者决定不在发表演讲文稿时使用它们。所以本文配图由编者搜集自网络。
引言
感谢大家的光临,感谢主办方的邀请和接待。你们的热情好客以及你们在此建立的宝贵的知识联系令我印象深刻。
计算(学)的历史通常是以这样的方式被讲述的:在大都市中心强大机构的支持下,有影响力的参与者会享有特权。主流历史侧重于已成为主流的计算模型。有些计算模型在当下是如此占有主导地位,以至于它们甚至常常被视为普世模型。今天,我想向大家展示的是,即使是最基础的计算模型也不具有普遍性,它们可以以完全不同的方式重新被想象。为此,我将提供计算机计算的反历史。我将重点关注那些想象并开发出非正统计算模型的外围参与者,这些模型曾被忽视、压制或边缘化。
我将考虑四种主要计算模型的反历史,所有这些模型都被无处不在的数字技术所采用。最基本的是数理逻辑。每个计算机程序或算法都是由一系列逻辑运算组成的。另一种是图灵机(Turing machine),即用 0 和 1 进行二进制计算的抽象模型,它是所有现代数字计算的基础。我还将考虑信息模型,特别是信息检索领域的模型,这是所有现代搜索引擎(如谷歌或百度)的基础。最后是语言模型,例如用于机器翻译或是像 ChatGPT 这样的对话自动机(conversational automata)。这些模型都基于一定的假设。数理逻辑倾向于假设绝对的一致性:一则语句非真即假。图灵机是为绝对确定性而设计的:每个算法都有确定的输出,即 0 或 1。信息检索系统追求一种中立性,它们不想被视为政治党派之物。而语言的计算模型历来试图将语言的诗意层面搁置一旁。即使模型的输出结果可以用诗意的方式来解读,诗意也不会被明确纳入模型之中。
因此,我将向大家介绍四段计算(学的)反历史,它们分别对上述假设提出了挑战。
1.巴西
我的第一个故事是关于非经典逻辑系统在巴西的涌现。
这位是牛顿·达·科斯塔(Newton da Costa),巴西数学家,非经典逻辑领域的先驱。这一领域研究的数理逻辑体系挑战了对“绝对一致”和“真假二元”划分的经典承诺。达·科斯塔发展了一种著名的非经典逻辑,称为次协调逻辑(paraconsistent logic)。次协调逻辑是“那些允许以非平凡(non-trival)方式从不一致信息中进行推理的逻辑”。
在一个次协调系统中,命题 P 和它的否定 P 可以同时为真。但不是任何命题都适应这种情况,因为如果是这种情况,逻辑系统就会是平凡的。因此,次协调逻辑是一种只有某些命题而非所有命题可以不一致的逻辑。简而言之,次协调逻辑允许部分矛盾。
这很抽象。但我想知道这个部分矛盾的观念是从何而来。
几年前,我采访了牛顿·达·科斯塔。他当时已经 90 岁了,可以说仍然是拉丁美洲最有影响力的逻辑学家。采访持续了数日。
我们见面的第一天,他给了我一本葡萄牙语诗集,书名是“Paraconsistência”(即paraconsistency:次协调性),署名是一位名叫拉斯(Lars)的作者。他告诉我,拉斯想见我,但不能亲自来。
书中的诗歌通过部分矛盾的视角,触及了从爱与死亡到上帝的存在等内在话题。拉斯在书的背面写道,他的灵感来源之一是次协调逻辑:“在我们这片荒芜之地(wild land)上,有人想出了一种能够处理矛盾、混沌和超复杂(the ultra-complex)的方法。”
随着时间的推移,尤其是在研究了牛顿的个人档案之后,我开始怀疑这些诗歌是牛顿自己写的,拉斯是他的化名。当我向他询问此事时,他笑了笑,但既没有证实也没有否认。从那以后,在我们的通信中,我请牛顿代我向拉斯问好。我从他们二人那里都得到了消息。
将世界视为“矛盾的”、“混乱的”和“超复杂的”,或将巴西视为矛盾尤为突出的“荒芜之地”,达·科斯塔并非孤例。
事实上,这些都是巴西现代主义艺术、文学和哲学的常见套路。达·科斯塔和他的同事深受巴西现代主义运动的影响,我追踪了数学家小组与现代主义艺术家、作家和哲学家之间的许多联系和互动。巴西现代主义者经常认为,形式逻辑不适用于巴西矛盾的社会现实。例如,1928 年的“the Manifesto Antropófago”(即《食人者宣言》)声称:“我们从未允许逻辑在我们之中诞生。”塔尔西拉·多·阿马拉尔(Tarsila do Amaral)的这幅画与宣言相呼应,画中的人物头部很小,代表了对逻辑的拒绝,是一种反殖民主义的声明。达·科斯塔和其他数学家一致认为,形式逻辑,至少是西方古典形式的形式逻辑,与社会现实的矛盾是不相容的。因此,他们希望将允许矛盾的数理逻辑形式化。
这种逻辑对人工智能项目产生了影响。巴西的研究人员意识到,如果不超越经典逻辑,可能就无法模拟人类智能。对于提出次协调概念的逻辑学家来说,经典逻辑不是普遍的,而是非常特殊的。它只是无限多种可能的逻辑形式之一。此外,古典逻辑并不反映任何人的推理模式。无论主体是科学家还是普通人,是欧洲人还是美洲印第安人,实际存在的理性都是次协调的。从这个意义上说,次协调逻辑学家们提出了自己的另一种普遍主义计划。他们坚持实证主义的假设,即逻辑形式主义以某种方式可以把握理性的基础。但他们超越了最初的计划,从绝对一致性的规范性理想转向对人类理性倾向,人类推理的无尽多元表现的彻底包容的描述。
并不是只有巴西数学家们想象出了非二元的逻辑与计算形式。现在,让我们将目光投向另一个来自世界另一边的故事:后殖民时期印度对非二元图灵机的想象。
2.印度
印度摆脱英国殖民统治正式独立后,计算机成为贾瓦哈拉尔·尼赫鲁(Jawaharlal Nehru)眼中对理性的后殖民国家的愿景的一部分。位于加尔各答的印度统计研究所是数字计算机的主要项目中心,该研究所由孟加拉统计学家P. C. 马哈拉诺比斯(P. C. Mahalanobis) 创建并长期领导。
20 世纪 50 年代初,马哈拉诺比斯和他的员工开始寻求进口或制造印度的第一台计算机。到 1953 年,印度统计研究所设计出了一台模拟机,它可以求解多达十个变量的联立线性方程,其材料是从第二次世界大战剩余物资的废料堆中抢救出来的。
尼赫鲁来看了这台机器,马哈拉诺比斯强调说“我们自己制造了它”。马哈拉诺比斯立即开始研究通用数字计算机的可能性,同时向美国和苏联寻求帮助。历史学家尼基尔·梅农(Nikhil Menon)发现的机密文件显示,由于美国国务院认为马哈拉诺比斯同情苏联,因此努力阻止他获得技术援助。在此期间,马哈拉诺比斯从印度哲学中寻找逻辑和统计的替代模型,这些模型后来激发了人们对不同类型计算机的想象。
在 1953 年的一次统计学研讨会上,马哈拉诺比斯提出了“印度-耆那教 syādvāda 理论中的一些观点,引起了与会者的极大兴趣”。
什么是 syadvada?根据哲学家乔纳尔登·加内里(Jonardon Ganeri)的观点,syadvada 可以理解为一种断言条件化的理论(a theory of the conditionalization of assertion)。该理论建议在任何陈述中使用小品词“syat”作为其条件,加内里将其翻译为“somehow”(以某种方式),马哈拉诺比斯将其翻译为“may be”(或然)。古梵文典籍中对该理论有多种说法。有些说法包括对陈述类型或谓词模式(saptabhangi)的“七重划分”(sevenfold division),这是马哈拉诺比斯分析的重点。他将其称为“逻辑”或 “辩证法”,并将其七个类别翻译如下:
马哈拉诺比斯指出,前三个范畴“符合经典逻辑的范畴”:“明确肯定”(assertion)、“明确否定”(negation)和“既明确肯定又明确否定”(both)。请注意,马哈拉诺比斯在将耆那教理论(称为 syadvada)与西方的”逻辑”范畴进行类比,以及将语义谓词(称为 bhangi)与真值进行类比时,做了大量的解释工作。这两种类比都不是不证自明的,都有一定程度的简化。无论如何,第四个类别 avakta 是更难翻译的。马哈拉诺比斯选择将其翻译为“不确定的”(indeterminate),并指出其他作者也使用了“不可描述的(indescribable)”、”、“不可表达的(inexpressible)”或“不确定的(indefinite)”。马哈拉诺比斯认为 avakta 类似于数学概率的概念。
几年后,对“syadvada”理论的重新诠释激发了人们对非二进制计算模型的想象,用七重谓词系统取代了二进制逻辑。由马哈拉诺比斯发起的这一研究方向是与英国生物学家 J. B. S. 霍尔丹(J. B. S. Haldane)合作推进的。
印度独立后,许多西方科学家访问了印度,特别是印度统计研究所(Indian Statistical Institute)。其中诺伯特·维纳(Norbert Wiener)是控制论的创始人之一,他认为印度可以成为科学先进、技术自动化的未来之地,因为尼赫鲁可以通过“尽早引进自动化工厂”,走一条 “工业化的另路”。
但霍尔丹走得更远。他不仅在印度访问了一个学期或一年,他永久性地迁居印度,成为印度统计学院的教授,并最终成为印度公民。这一举动与他个人的反殖民主义政治有关。1956 年,英国、法国和以色列进攻埃及,企图夺取苏伊士运河的控制权,几天后,霍尔丹辞去了伦敦大学学院的职务。他对《泰晤士报》说:“我不想再做这里的公民,因为英国是一个犯罪国家。”于是,他移居印度,学习梵文,并与马哈拉诺比斯一起通过耆那教的视角重新认识计算机。
现存的数字计算机,无论是英国的还是苏联的,都是基于二进制逻辑的。从最早的数字计算机(如 1945 年完成的 ENIAC)开始,情况就一直如此。阿兰·图灵的计算数学模型——后来被称为图灵机(Turing machine)——也是基于二进制运算。它由一个存储带组成,存储带分为离散的单元格,每个单元格可以包含 0 或 1 两个符号中的一个。
霍尔丹设想了一种除了 0 和 1 之外还支持 avakta 的机器。他写道:“这样一台机器可以给出 7 个反馈中的任何一个,7个反馈即即:0、1、avakta、0或1、0或avakta、1或avakta、0 或 1或 avakta。实际上,这就是一台非二进制图灵机。”
这种抽象模型从未变成实际的计算机,今天的计算机几乎无一例外地基于二进制逻辑。导致二进制模式占据主导地位的原因有很多,但原则上,非二进制计算机,甚至基于不同哲学的计算机都是可能的。
我已经介绍了非常理论和抽象的计算领域的案例。现在,我将讲述第三个故事,一个更加实际和应用的领域——信息学——这一独特领域在革命后的古巴的发展。
3.古巴
1959 年古巴革命后,菲德尔·卡斯特罗(Fidel Castro)任命图书管理员玛丽亚·特雷莎·弗雷尔·德·安德拉德(María Teresa Freyre de Andrade)为哈瓦那何塞·马蒂国家图书馆的新馆长。她是一名女同性恋,长期持不同政见者,曾被前政权流放和监禁,长期关注图书馆学的政治。
革命后,弗雷尔·德·安德拉德认为古巴人不能简单地“照搬英国人在图书馆的做法”。用她的话说,这样做会令“我们拥有一个宏伟的图书馆,对图书馆进行很好的分类,为许多人提供良好的服务,但不会让我们积极参与到革命当中去”。
那么她是什么意思呢?图书管理员如何积极参与革命?答案之一是:收集革命前图书馆收藏的、被排除或抑制的资料,并将之编辑索引,如 20 世纪 50 年代秘密革命报刊的出版物。不过,图书馆管理员也参与了更广泛的革命项目: 古巴建设自己的计算机产业和信息基础设施的努力。这一项目最终形成了信息科学中的一个独特的新领域,它继承了古巴图书馆学的革命理想。
革命者和他们的敌人都认识到,信息技术将是新古巴的战略重点。1962 年,IBM 关闭了古巴分公司,美国政府实施贸易禁运,阻止古巴购买任何计算机设备。这意味着古巴不得不在苏联领导的经济互助委员会(Council for Mutual Economic Assistance,简称 Comecon)中其他社会主义国家的帮助下,发展自己的计算机产业。
1970 年,哈瓦那大学的一个团队创造出了数字计算机原型 CID-201,以及一种名为 LEAL 的编程语言,LEAL 是 “Lenguaje Algorítmico” (算法语言)的缩写,这个缩写词也有“忠诚”的意思。由于美国实施的贸易禁运,该团队无法在欧洲购买必要的电子元件,但在一位从商于东京的日裔古巴人的帮助下,他们最终成功地从日本带回了藏在公文包里的元件。
古巴信息学的非凡之处在于它发展出不同于美国和苏联信息学的新理论和数学模型,古巴信息科学家试图将他们的政治理想融入图书馆活动的数学模型中。
古巴的模型往往要复杂得多。在此,我不再赘述数学细节,只想简要说明一下他们的政治原则。美国和苏联的信息科学家经常使用流行度量标准(如引用次数)来选择哪些资料需要保留,哪些需要丢弃。古巴信息科学家们拒绝接受这些流行度量标准,他们非常关注确保图书馆藏书中观点的多样性。
关键在于,他们明白信息检索系统永远不可能是中立的。当算法选择如何对搜索结果进行排序或选择推荐哪些视频时,这始终是一个具有政治后果的规范性决策。古巴信息科学家们拥抱了这种不可避免的政治偏见。
当我研究古巴信息学时,网上几乎没有任何可以轻易获取的资料。我的第一篇相关文章发表后,维基百科编辑几乎立即联系了我,并创建了关于弗雷尔·德·安德拉德和 CID-201 计算机的新条目。我很荣幸能在这段历史的公开记录中发挥作用,也很高兴能亲身经历信息系统的政治。
古巴的信息学实验得到了社会主义国家的支持,但是,我还应当介绍一个案例,在此案例中,一个更加专制的社会主义国家压制了其他实验,迫使它们转入地下。我最后的故事是关于捷克斯洛伐克的机器诗学。
4.「前」捷克斯洛伐克
语言的计算模型总是倾向于关注语言的基本的字面方面,而压制或搁置诗意和美学方面。美国科学家沃伦·韦弗(Warren Weaver)可以说是机器翻译的首倡者,他在 1955 年曾这样说过: “任何有理智的人都不会认为机器翻译能达到优雅和具有风格的效果。普希金无需颤抖。”
这就是为什么机器翻译最早的项目集中在冷战时期的科技文件。科学散文被认为更简单、更直接、更容易形式化。
这种倾向在当今的机器翻译系统和对话自动机中依然存在,它们基于语义相似度的衡量标准,但并没有在其模型中明确考虑诗学。
在前捷克斯洛伐克,早期的机器翻译和计算语言学项目也符合这一趋势。然而,在这些项目的边缘,却出现了令人惊讶的例外。语言学家、工程师、作家和学者努力将捷克斯洛伐克的第一台计算机用于文学目的,并开发出明确包含诗学的语言模型。
捷克文学理论家伊日·列维(Jiří Levý)试图利用各种数学模型(如信息论、博弈论和统计决策论)将翻译过程中的“美学”决策形式化。与美国和苏联的机器翻译项目不同,列维设想计算机可用于翻译包括诗歌在内的文学文本。另一位语言学家克韦塔·斯加洛瓦(Květa Sgallová)受到列维对主流计算语言学批判的启发,致力于研究“诗歌语言”的概率模型。
这类工作为何会在捷克斯洛伐克涌现?一个先决条件是,受战前布拉格语言学派的思想所影响,该学派将语言的“诗学”(poetic)或“美学”(aesthetic)功能理论化。对于后来的捷克结构主义者(如列维)来说,语言可分为语义和审美两种结构,而这两种结构同样适用于数学形式化。
为诗歌语言建立数学模型或计算模型的大部分出版著作都出现在 20 世纪 60 年代中期。早在 20 世纪 50 年代,结构语言学就被与苏联结盟的政权视为有争议的学科,因为斯大林后期的论战将结构语言学定性为与马克思主义不相容的学科。许多语言学家被清除出捷克斯洛伐克的大学,一些人被流放,另一些人则放弃了结构主义,宣誓效忠马克思主义。20 世纪 60 年代中期,政治压迫出现短暂松动,也正是有关机器诗学的大多数出版物出现的时期。
其中一些作品涉及使用计算机自动作诗。一些人甚至将计算机生成诗歌作为一种政治批判模式。在 1968 年“布拉格之春”期间,一位研究人员收集了一位政要的官方声明,然后用计算机生成戏仿的、官腔声明的荒诞诗歌。就在华沙条约组织入侵前几个月,这份研究成果发表在杂志上,标题为“生成的退化”(Generative Degeneration)。
但在入侵和随后的镇压之后,大多数机器诗学研究人员都受到了惩罚,并被解除了学术职务。在某些情况下,研究人员受到惩罚,原因至少部分是:他们的工作被认为具有颠覆性,《生成的退化》的作者似乎就属于这种情况。在另一些情况下,研究人员受到惩罚是因为他们的个人观点和行为,而非他们的学术工作,斯加洛瓦似乎就是这种情况,她被解除了教职,只被允许担任图书管理员。出于这样或那样的原因,几乎所有从事机器诗学研究的人都无法在入侵后继续在大学里从事这项工作。
这并不意味着研究工作完全停止。在 20 世纪 70 年代和 80 年代,包括斯加洛瓦在内的一群对诗歌语言数学研究感兴趣的人在布拉格附近的不同公寓组织了地下会议。这群人组织的活动被非正式地称为“诗歌学夜校”(Evening School of Versology),他们以自行出版的排印本(即samizdat,地下出版物)形式传播自己的研究成果。
多萝塔·奥尔萨夫斯卡(Dorota Olsavska)是我以前的学生,她通过实习支持了我的研究,去年她在布拉格的一间公寓里拜访了克韦塔·斯加洛瓦(Květa Sgallová),对她进行了初步采访。斯加洛瓦至今仍认为,对诗歌语言的研究是她一生中最重要的工作。尽管如此,她还是对我们在如此漫长的岁月之后,从遥远的荷兰得知她的工作的存在感到惊讶。她也很好奇我们在做什么研究,于是多萝塔把我写的关于古巴信息学的文章寄给了她。她在通过机器翻译阅读了我的文章后,同意帮助我们,她甚至在她的公寓里翻找到以前的通讯记录。
讽刺的是,如果没有现有的、商业化的、反诗学形式的语言模型,这次相遇是不可能的。我最初是通过阅读论文(机器翻译自捷克语)了解斯加洛瓦的思想的。现在,我从多萝塔更仔细的翻译中知道,我错过或误解了很多东西。但从一开始,尽管主流机器翻译存在局限性,我仍然能感受到这部作品的重要之处,甚至是美妙之处。
计算模型能够压制诗意,但不能完全压制。
这也是我所有故事中普遍模式的一部分。计算模型的设计可以抑制不一致、不确定、党派性(partisan)和诗意,但它们永远不会完全成功。尽管人们试图摆脱计算模型中的不一致性、不确定性、政治性和诗意,但总有人会提出反对意见,甚至还有人通过开发其他计算模型来表达这些反对意见。总有人想象出其他的计算方法,我想也包括我本周在上海遇到的网络社会研究所这个非同寻常的群体。
感谢您的聆听。
讲者简介
罗德里戈·落亀
Rodrigo Ochigame
Rodrigo Ochigame 是研究计算机和人工智能的人类学家,现任莱顿大学助理教授。他的研究关注计算理性的非正统模型,例如巴西的非经典逻辑、印度的非二进制图灵机以及古巴的信息科学框架。他的教学专长包括当代社会和人类学理论、科技史和科技人类学,以及数字技术的社会维度。奥奇加姆在加利福尼亚大学伯克利分校获得学士学位,并在麻省理工学院获得博士学位。