网络社会年会

第八届网络社会年会|Marc Weber:从链接到人工智能 ─ 在超媒体梦想中的多媒体及其根源

Marc Weber, From Links to AI:Multimedia And Its Root in Hypermedia Dreams

文/马克·韦伯(Mark Weber)
整理翻译/许可
校对/袁孟如 张铎瀚
校订/黄孙权

年会现场演讲

我是马克·韦伯(Mark Weber),计算机历史博物馆互联网历史项目的策展总监,有点啰嗦的说法。我要感谢黄孙权教授的邀请,感谢他的盛情款待,感谢刘怿斯先生的联系。我很荣幸能来到这里,也很荣幸能欢迎你们中的一些人来到计算机历史博物馆来。

人们往往认为多媒体和超文本(如网络)是两个不同的领域。它们只是在大致相同的时间段内出现在大众视野中的两项技术进步。人们很少想到,它们在 100 多年的时间里,以有时相互冲突的方式,深深地交织在一起。正如我们将要看到的这张图片来自多媒体先驱之一:保罗·奥特莱(Paul Otlet)。他计划在 20 世纪 30 年代在日内瓦国际联盟附近建造一座世界城市,作为倡议中的全球网络中心。

首先要介绍一下计算机历史博物馆。我们拥有世界上最大的计算机综合资料馆藏,包括一个向研究人员开放的媒体档案馆。我们大约 40% 的藏品是实物,其余为论文、视频、图像、软件和数据。我们已经进行了超过 1200 次视频口述历史记录。我们的永久性展览 《革命:计算的第一个2000 年》 (Revolution: The First 2000 Years of Computing),是第一个深入介绍了在线文本世界演变的展览。我们的软件展览探讨了软件在联网和上网过程中的社会作用。我很荣幸地将李·费尔森斯坦(Lee Felsenstein)在个人计算机革命中研究的一个社区记忆终端放在了这里。

计算机历史博物馆

我今天要谈的大部分内容都与多媒体和超文本有关,但我们也有很多关于交互式图形的经典历史资料,从可以玩《太空战争》的PDP1修复版,到伊万·萨瑟兰(Ivan Sutherland)1968年的第一个虚拟现实头盔。我们最大的文物是作为硅图公司(Silicon Graphic)销售总部而建造的大楼。

互联网历史项目以博物馆收藏的世界级网络和移动资料,以及早期网络历史项目收集的资料为基础。我们的目标是保存和讲述网络世界的故事、网络世界背后的人们以及那些生活在网络世界中的人们的故事,从智能手机到 “零工经济”(Gig economy),他们的生活因网络世界而改变,博物馆约四分之一的展厅都以网络和移动设备为主题,并通过现场活动、出版物和视频吸引广大观众。

我们目前正在筹办一个聊天机器人展览,该展览将于明年 6 月开幕,非常具有现实意义,这就是互联网历史项目。图片上就是聊天机器人展览。我们不会展出这个算命的自动机,但会展出一个同类型的自动机。人们尝试让机器说话已经有一段时间了。

聊天机器人展览 将于2024年 6 月开幕 投币式祖母算命师,一种自动机或机械模型。 旧金山机械博物馆

就图形学而言,我的第一份工作是在上世纪80年代末为美国动视公司(Activision)、美国苹果公司和游戏公司EA(Electronic Arts)测试绘画程序。这些都是让普通人制作从音乐、视频到页面设计等各种媒体工具的大趋势的一部分。

左上:Photoshop 创始人:约翰·诺尔 (John Knoll) 图源:Photoshop Exhibit (Photoshop展览) 右上:使用 MacDraw Il 和 Studio8 进行业余绘画 右下:软件实验室,CHM 媒体档案

而这正是个人电脑革命的一部分,即为人们提供工具的理念。我们在许多其他软件中也保留了这些工具。虽然随着电脑的更新换代,人们获取工具的途径在很多方面已经消失,但在另一些方面却有所增加。 到了 20 世纪 90 年代初,在 CD ROM 读取器的帮助下,个人电脑上的多媒体效果出奇的好。游戏变得非常生动。超文本通过 Hypercard (一款在1987年由苹果公司推出的早期超文本系统)最为人熟知,它还可以创建交互式 CD ROM。这一切都是独立的,大部分都没有联网。但媒体的未来看起来非常丰富多彩,有越来越好的图像、声音。

直到网络出现,基本上把所有这些东西都炸回了石器时代——至少倒退了十年。

1995 年,我担任了一本实验性多媒体杂志(Telecom Observer)的执行主编,合作伙伴包括《经济学人》集团、《卫报》、莱蒙德广告公司、瑞士广播电视台等。我们能将音频片段(很短的片段)整合到你可以点击的麦克风图标中,这是一项巨大的成就。我和吉姆·克拉克(Jim Clark)的电视访谈是在多媒体骨干网(M-bone)上以视频形式播出的。我不知道你们中是否有人还记得,那时互联网上的视频大概是每秒两帧左右的速度。而这并不是专业知识的限制。杂志的出版商是由让-范萨·格拉夫(Jean-François Groff)共同创办的公司,他与蒂姆·伯纳斯-李(Tim Berners-Lee)共同参与发明了万维网。限制在于带宽以及随着网络发展而做出的某些选择。

实验性多媒体杂志(Telecom Observer)

但是,内容表现与内容传播之间的矛盾却可以追溯到更早的时候。从音乐、舞蹈、烹饪到诗歌,人们长期以来一直在创造不同的媒体。但事实上,语言由不连续的单词组成,因此特别容易剪切、快速和准确地复制。这也使它大约从 5000 年前开始成为编码和压缩符号的理想选择。因此,有些形式因素似乎会反复出现,右图实际上是一块木质书写板,上面覆盖着可擦除的蜡。不过,即使是像左图这样的泥板,也会使用交叉引用,你可以将其视为超链接的祖先。

但问题是,文字可以无限地表现和复制,而不会像其他媒体那样失去分辨率。因此,尽管任何识字的人都可以复制文字,而且错误很少,但复制哪怕是简单的插图都需要解释和技巧。

左:美索不达米亚医疗平板复制品,图源网络画廊。右:用蜡片的希腊人。艺术家:Douris,约公元前 500 年,图源柏林博物馆

早期的印刷术也主要是为文字设计的。插图需要很长时间才能赶上。例如,古希腊和古罗马的学者在他们的文字中绘制了几何图形,如毕达哥拉斯。但大部分插图在复制时都丢失了。最后只有文字,图像被剥离。显然,印刷术、活字印刷术都起源于亚洲,到了西方的古腾堡(Gutenberg)出现时变的非常盛行。但它们并不是为插图而设计的,纯粹是针对可重复出现的字符或字母。

左图:希腊手稿,图源大英博物馆维基共享资源。右图:第一张已知的活字印刷页,1377年,图源维基共享资源

因此,始于 1837 年的电报的光速数字通信,最初只是文本通信。19 世纪的发明家们第一次捕捉到了图像、声音,甚至以电影形式展现运动。但这并不是通过电报实现的。除了电话,所有这些媒体都需要物理传输。它们完全被固定在某个地方。

左图:火车轨道上的电报线。右图:用于显示证券市场报价和交易信息的设备

到了 20 世纪 20 年代,保罗·奥特莱和亨利·德拉方丹(Henri de la Fontaine,他曾在比利时与保罗·奥特莱共事)等信息先驱开始梦想建立一个世界性的网络,或者像威尔斯(HG. Wells)所说的,由超链接连结的世界大脑。但是,激励这些有远见的人将世界上的所有知识联系起来的那股浪潮,也驱使他们中的一些人试图将每一种媒介都包括进来,因此,不仅仅是纸张和缩微胶片(这是当时新出现的压缩媒介),还有电报、电话、广播、录音,以及仍在试验中的电视。

右图是奥特莱提出的类似于 Mondotheque(荷兰词,直译为英语是 “World Library”,中文可以理解为“世界图书馆”或“全球图书馆”)的东西。虽然不容易翻译,但对于家庭来说,其中包括一大堆小玩意儿,你将有六种不同的机器来处理不同的媒体。他坚信,你确实需要多种媒体来有效地传播知识。你可以从文字中学习,但有了动作、声音和图像,你就能获得更丰富的体验。

因此,他和亨利·德拉方丹利用我刚才介绍的所有技术,在布鲁塞尔建立了一套行之有效的系统。他们是坚定的国际主义者,对共享信息将带来世界和平和一个普遍的黄金时代抱有极大的信心。当然,在电报、早期无线电和网络时代也有这样的人。德拉方丹还收集女权主义文学作品和小册子,是女权运动的主要支持者。在两次大战之间,欧洲出现了一个这样的世界、一种国际主义、和平主义的活动,而这正是其中的一种表现形式。

奥特莱与勒·柯布西耶(Le Corbusier)和其他建筑师,想要规划一座作为全球网络神经中枢的世界城市。原本计划将其选址在国际联盟附近,先是布鲁塞尔,在布鲁塞尔失去主办权后,又选在瑞士的日内瓦。因此,他们是群怀有和平国际主义情操的信息前瞻者所组成的松散国际网络的一部分。他们还在探索第一种机器可读介质。用孔洞和纸质胶片来浏览信息。这可以追溯到霍莱里斯卡片分拣机(Hollerith card sorters), IBM 的卡片分拣机,或者更早的雅卡尔织布机(Jacquard loom machine)等。

左:Mundaneum:比利时的一个历史性机构,成立于20世纪初,由Paul Otlet和Henri La Fontaine创办 右:Mondotheque,家庭多媒体“终端“

这就是自动搜索的曙光,使用机器可读介质在纸上开孔,从而实现信息搜索的智能计算。伊曼纽尔·戈德堡(Emanuel Goldberg)曾在德国蔡司公司(Zeiss Ikon)工作,领导着他们的研究实验室,他们在做早期的电视、研究微点。我们以为自动搜索是最近的事情,但他早就率先使用光电池和打孔的 35 毫米胶片与微缩胶片页面进行搜索,这样你就可以输入一个数字代码,有点像 URL 或网址,它会在几秒钟内将对应的页面显示在你的屏幕上,他甚至将其内置到他在蔡司公司的办公桌上,就像一个工作站。

自动搜索的黎明 左图:伊曼纽尔·戈德堡(Emanuel Goldberg)在德国蔡司圣像公司(Zeiss Ikon)右图:他的统计机自动搜索缩微胶卷的专利图

在同一时期,有两位同行也有这样的想法。威廉·奥斯特瓦尔德(Wilhelm Ostwald)是获得诺贝尔化学奖的一位化学家。在德国建造了一种叫做 “桥 ”(The bridge)的东西,用于标准化各种格式,共享信息。

科幻小说作家威尔斯也写过一本名为《世界大脑》(World Brain)的书,他在书中提出了一套非常相似的观点,并四处宣扬这些观点。两人都对共享信息能够带来和平充满信心。

志同道合的伙伴 左图:威廉·奥斯特瓦尔德(Wilhelm Ostwald),“桥”,慕尼黑 。右图:H. G. 威尔斯(H. G. Wells)《世界大脑》

但第二次世界大战抹去了人们对这些著作的大部分了解。

具有讽刺意味的是,英语国家的计算机先驱们只通过范尼瓦尔·布什(Vannevar Bush)的记忆延伸(Memex) 概念才真正接触到了微缩胶片,这是一种在戈德堡搜索引擎基础上扩展的微缩胶片网络浏览器。戈德堡的搜索引擎基本上只有一个屏幕,你可以输入一组数字,然后得到一个类似于网址的页面,但无法在两者之间建立链接。

记忆延伸系统中有两台相邻的微缩胶片阅读器,你可以在它们之间创建链接。因此,这是一个很大的飞跃。但布什是美国曼哈顿计划(原子弹计划)之父,也是美国军事科学研究的负责人之一。

因此,这些非常相似的想法来自于目标迥异的不同人士。这可能看起来有些矛盾,但我认为实际上存在一种共同的意愿,那就是前往新边疆,打破理想主义者和军事研究人员之间的界限。人们昨天讨论的东西会被颠覆,这里有种想要颠覆的共同性。但我想说的是目标仍是关键,许多不同的人想要颠覆社会或技术秩序,但他们实际上要解决的问题却是非常重要的,尽管有着不同的目标。

但我们可以肯定的是,当你进入20世纪60年代的硅谷时,你会发现双方都有一种探索新想法的勇气,既是意图,也是创造。

美国工城师 Vannevar Bush 的記憶延伸

因此,我向你们展示了战前的资料,包括保罗·奥特莱、威尔斯等人的观点,所有这些结合媒体的想法都涉及大量的设备,复杂、精密、笨重的设备。从 20 世纪 50 年代开始,道格·恩格尔巴特(Doug Engelbart)、特德·尼尔森(Ted Nelson)和其他人意识到,可以做一些类似于记忆延伸的东西,这本来是用微缩胶片制作的,但可以使用数字计算机。你可以在一台机器上完成这一切。

被称为信息论之父的香农(Claude Shannon),证明了1和0比特可以数字化地表示任何介质,这对二十世纪二、三十年代的人来说并不明显,我不认为那时的人们知道可以相同的存储设备,在全媒体(omnimedia)上存储并且混合所有不同的媒体。

给计算机带来”世界大脑“的人们

因此,尽管他们还不知道保罗·奥特莱,先驱们很快就开始梦想将多种媒体连接起来。泰德·尼尔森(Ted Nelson)实际上就是从视频超文本的想法开始的。他对电影很感兴趣,他想让电影通过特定的地方链接到其他电影。道格·恩格尔巴特(Doug Engelbard)和安迪·范·达姆(Andy Van Dam),后者很早就开始研究图形学,试图在当时非常有限的计算机中尽可能多地加入图形功能。

因此,这里的矛盾在于,他们想利用计算机将所有媒体结合起来。但当时的电脑几乎没有内存,甚至无法显示简单的图形。能力非常有限。

左1:泰德·尼尔森(Ted Nelson) 左2:梦想机器,1970年代 右下:HES(超文本编辑系统),泰德·尼尔森(Ted Nelson)和安迪·范·达姆(Andy Van Dam)

道格·恩格尔巴特在赫曼·米勒(Herman Miller)定制的工作站上,他在李(Lee Felsenstein)提到的 “所有演示之母 “中使用了这台工作站。我们博物馆里有一个复制品,是由当初参与设计的一些人制作的。

20世纪60年代末,道格·英格巴特在NLS工作站,由赫尔曼·米勒公司(Herman Miller Inc.)以及SRI的唐·尼尔森(Don Nielson)和马丁·哈迪(Martin Hardy)在2018年重新创建。这是在CHM的复制品。

安迪·范·达姆不断推出越来越多的多媒体超文本。这是 70 年代为技术培训制作的可视化超文本系统模型。但在这一时期,计算机在多媒体方面的应用非常有限。

电子文档系统模型,约1980年。首创了“图像映射”和基于上下文的超文本。

因此,它们具有无限的灵活性,但资源有限。我们有很多介于这两者之间的尴尬时期的例子,当时人们试图让计算机在内存和处理能力上做得更多。他们把类比和数字混合在一起。这实际上是计算机出现之前的时代的(镶有缩微胶片的)窗孔卡片(Aperture card)。但进入80年代,我相信一些苹果电脑公司早期的蓝图是使用这种技术制作的。

右边是一张蓝图的缩微胶片插图。这张卡片可以在电脑卡片分拣机上分拣,找到正确的图像。这是一种追踪图像振动的方法。但图像不在电脑里,它们在这个独立的麦克风上。

光圈卡 – 具有嵌入式微缩胶片图像的可计算穿孔卡。图源维基媒体共享。

这是IBM 1360 ,它是用化学方法存储数据的。它可以存储大量数据供美国中情局和其他机构使用。它的功能非常强大,但同样是类比的,它的数据存储方式实际上不是数字的。

20世纪60年代末期,IBM 1360(“Cypress”)照片数字存储处理器。被中央情报局(CIA)等组织用于大规模存储。

1974 年,电脑辅助教学系统伯拉图系统(PLATO,Programmed Logic for Automated Teaching Operations)终于配上了一个平面触摸屏,这幅图像实际上是投射在屏幕上的缩微胶片。它可以控制终端内的微缩胶片阅读器。他们还用磁性音频台以类似的方式提供音频。

PLATO 萤幕投射原理

20 世纪 80 年代初,麻省理工学院媒体实验室的阿斯彭电影地图(Aspen Movie Map)将模拟视频磁盘(这些磁盘最初是为视频而设计的)连接到一台微型计算机上。这基本上就是谷歌街景地图,我们已经在我们的展览中展示过,但使用的是由电脑控制的模拟视频台。

左图”阿斯彭电影地图,科罗拉多州阿斯彭,大约在1980年。图片来源:麻省理工学院建筑机器组。右:使用阿斯彭电影地图进行实验装置。

苹果公司的 “视觉年鉴”(Visual Almanac)通过 Mac 控制视频光盘播放器。这是我们藏品中的一个展品。你可以在视频编辑台上看到整套百科全书。

计算机历史博物馆youtube视频:”Visual Almanac” 的视频民族志学

但并非所有人都认为连接性与超媒体不太相容。一些人梦想通过宽带和奥地利开发的 Hyper-g 系统实现互动电视。互联网上也有超媒体。右图是 20 世纪 80 年代在局域网上运行的具有强大多媒体功能的多媒体。但这些都是例外,而且是在大多数人无法使用的网络上运行。

左图:Hyper-g截图 右图:跨媒体截图,1980年代中期

因此,蒂姆·伯纳斯·李在与罗伯特·卡里奇(Robert Cailliau)等其他人一起创建万维网时,就为他的全球网络系统规划了各种雄心勃勃的媒体,并将通过格式协商来处理,基本上,无论你在哪种机器上,它都能适应。

如果你有一台功能强大的机器,它就会向你展示精美的图形、声音或电影。如果你使用的是非常简单的终端或移动设备,它就会自动降级,向你展示它所能做的一切。但他没有时间把这些功能添加到下一台机器上的演示浏览器中。这是第一个浏览器,也是一个编辑器。当时,网络的互动性要强得多

万维网截图

在资金极少的情况下,他请志愿者制作 Unix 浏览器。这就是他所需要的平台。他还要求他们添加灵活的多媒体功能。但最成功的浏览器 Mosaic 很快就添加了点阵图( bitmaps),而且只能是点阵图,很难嵌入其他媒体。因此,在过去的几年里,它基本上将非常有限的图形功能冻结在网络中。但图像无疑吸引了人们,并使它成功战胜了 Gopher 等竞争对手。

左图:Mosaic截图 右图:Viola截图

与此同时,虚拟现实标记语言(VR Markup Language)社区正在积极推动3D网络浏览器的发展。像欧洲核子研究所组织的虚拟电脑辅助设计系统,金星(VENUS) 曾在高端设备上取得了巨大成功,这系统被用于开发粒子加速器。当时,这些系统只适用于拥有高速互联网和昂贵工作站的人群。而在当时,普通网民所能接触到的多媒体内容非常有限。

左图:VENUS虚拟计算机辅助设计系统 右图:VRML内部

但最终,随着宽带和MP3等更好的压缩技术的出现,网络多媒体得到了普及。这其中,Napster和其他音乐盗版网站的流行,以及成人网站对Flash的使用都起到了一定的推动作用。

最终,到了20世纪90年代末期,网络多媒体的水平逐渐赶上了上个世纪80年代中期的单机多媒体水平。这一过程历时很长。包括泰德·尼尔森和道格·恩格尔巴特在内的许多人从反文化的角度来看待超媒体技术,他们真切地希望通过共享知识来改善世界,并怀有对这种方式的信心。

MP3交互展听 CHM

我希望通过这些话来展示旧金山湾区的反文化风气。60年代和70年代无疑是最著名的时期。但这实际上是来自刺耳协会(Cacophony Society),它在1990年初发起了火人节(Burning Man)活动。这是种奇怪汇聚而有的”虚拟现实”,有提摩西·李瑞(Timothy Leary)、斯图尔特·布兰德(Stewart Brand)和刺耳协会。围绕着火人节的反文化群体与计算机行业之间的关联一直延续至今。参与其中的人各有所好,当然,你可以将它看作硅谷工业领袖的独家俱乐部。但也有一些人有着完全不同的目标。

刺耳协会

如今,网络多媒体在技术上终于赶上了多年前CD-ROM所能实现的水平,而用户数量已经达到40亿。然而,我要提出一个问题,那就是应用程序呢?Zoom是一个百年前概念的实现,即视频会议,也是一个50年前的演示的实现。就像保罗·奥特莱在1930年所设想的视频会议,非常类似于现今人们所做的事情,并由道格·恩格尔巴特在1968年的“所有演示之母”中进行了展示。

因此,我们要想象下一个能够被实现的是什么?

左图:视频会议演示,NLS,1968年 右图:保罗·奥特莱(Paul Otlet)1930年代设想中的视频会议

我们可以在线立即、廉价地混合任何媒介,分辨率非常高,但我们要怎么处理它呢?我认为真正的变数当然是生成式人工智能,大多数超媒体先驱所想象的是一个人选择各种媒体并将它们结合成一种全媒体的想法。

但是生成式人工智能,就像昨天演讲者(Lev Manovich)说的,它将事物分解成这些小碎片,几乎是言语或形象的数据包,并重新组合它们。我认为这不过是引入了另一个因素,也就是人工智能正在做出一些决策。它更像是人和这种几乎是通道化的集体无意识形象或词汇之间的互动。所以这种技术更像是选择性地繁殖而不是设计某物。这更像是进化的过程,正如昨天一位艺术家所说的,从AI生成的众多图像中进行选择与设想某物并实现它是完全不同的。

 Midjourney Bot 生产的图像

我认为对比在于,有一个更古老的关于脑机接口的设想,未来你可以直接在脑中想象一个场景,它就会出现在屏幕上,或者你想象出音乐。这将是一种比生成性人工智能更直接的控制方式。因为在使用生成性人工智能时,你会牵涉到人工智能,它以你可能喜欢或不喜欢的方式混合事物,并且你需要与它对话。所以我认为,这是一个有趣的新篇章,在这一篇章中,我们将所有媒介融合在一起,混合它们并探索如何利用它们。

谢谢。

问答环节

Q:谢谢马克·韦伯先生的分享。我想问一个关于硬件的保存的问题。硬件和软件的保存,您觉得哪个会比较困难?您觉得最好的保存方法是应该把它开放给更多人用,让它变成一个更有商业价值的项目,还是给像你们这样比较专业的机构保存它供大众参观呢?还有一个问题比较私人,您会选择在系统更新的时候立即更新呢,还是用到不能更新了为止?

Marc:就我个人而言,我会等到没有其他选择的时候才会采取行动,这在一定程度上是因为我处理历史事件,并且通常更喜欢研究古老的东西。但就获取信息而言,我想这才是你所问的重点。当涉及到旧硬件时,我认为它们非常脆弱,难以维护,需要专家的帮助。比如,在博物馆里,我们有两个修复项目,每个项目都需要一组志愿者来维护。一个是 IBM 14,另一个是早期的小型计算机 PDP1,但要让它持续运转真的很费力。模拟技术让人们可以在较新的硬件上以相当真实的形式使用旧软件。所以就我个人而言,我认为仿真技术是让公众获得对古老资料广泛访问的途径。首先,硬件的问题在于维护,而且还要知道如何操作。再说到游戏,在博物馆里我们有三个互动式的模拟游戏,人们可以参与其中。游戏设计得让人们能够立刻理解并且愉快地玩耍。对于那台 IBM 1401 主机,他们会请当时的专家来演示它,并向人们展示如何操作,因为如果我们中的任何人,包括我,只是走上前去,使用穿孔卡,输出结果,这对普通人来说是个谜。所以我认为,对于大多数不是显而易见的东西,比如游戏,你应该展示视频和演示,而硬件通常应该是演示而不是仅仅交给别人操作。

Lee Felsenstein:这引出了关于计算机文化背景以及其变化的想法。这是一个非常宽泛的领域,我不认为我们能在几个小时内草拟出一个计划,可能需要几年时间。不过我认为这会是计算机历史博物馆非常有趣的方向。毕竟,历史必须结合背景才能被理解。虽然你可以拥有最好的展示机器,但你不会对它们为何被设计成那个样子有多少了解,以及人们做了什么以及它对他们的生活产生了什么影响。如果你允许的话,让我通过向这个提议中加入许多复杂因素来使你的任务复杂化。我想知道你对这个建议的想法。

Marc:我觉得这取决于你是在现场还是场外讨论。假设今天的场景是展览现场,如果你不能在大约30秒内吸引他们的注意,也许一两分钟,他们就会失去兴趣。这取决于情境,博物馆可以提供两种情况。比如说,现在互联网档案馆提供了很多旧游戏的模拟游戏供你玩。你显然不会体验到原始硬件的外观和气味,但这是你可以在空闲时间做的事情,而给别人一台古老的机器却没有时间去探索,意义不是很大。所以这个问题非常复杂,我们一直在努力解决。比如说,对于聊天机器人展,我们可能会展示目前的系统的视频,比如为治疗而设计的聊天机器人,客户支持的聊天机器人等等。如果你让人们去玩这些系统,很多人只会被一些指令迷失。比如说,我们曾尝试过有一个维基百科的展览,你可以去编辑维基百科的终端机,整个目的是维基百科是任何人都可以编辑的。对吧?人们确实这样做了,他们张贴了各种可怕的东西,现在那个IP地址被维基百科封禁了,因为如果人们真的可以自由地玩这些东西,他们会以多种不同的方式玩。

Q:韦伯先生您好,我对人机交互界面有一个问题。您认为人机交互界面是否已经走到了尽头?因为在1960年,我们使用视频终端代替了电传打字机成为主要的人机交互界面,直到今天,我们仍然使用键盘和视频显示器作为我们的人机交互,作为一种商业界面。另外,虚拟现实头盔从80、90年代开始发展,在过去15年里获得了大量投资,但仍无法取代传统的人机介面,例如键盘和视频显示器。唯一有些改变的是触摸设备,例如1996年推出的Palm Pilot,但直到今天我们仍然用手持设备、触摸屏和大图标。它似乎与早期的Palm Pilot几乎没有太大区别,所以您认为人机交互作为今天的界面已经走到了尽头吗?

Marc:我希望不是这样。打字机有150年的历史,基本上,也就是现在的样子,一个键盘上方的屏幕或一张纸。移动电话的整个历史实际上是如何变成不带大屏幕,和便于输入数据的简单方式来完成有用的事情。值得记住的是,现在这些不再有像Palm Pilot这样的笔,你在熟练后可以相当快速和准确地书写,也没有像旧的黑莓手机那样的拇指键盘。软键盘实际上非常难以准确地使用。自iPhone和Android真正遵循了相同的模式以来,它们都被优化用于浏览而不是创作。这又回到了早期互联网是用来参与的观点。它是一个浏览,一个接收广播的机器,而不是一种创作的方式。我认为这是为什么我们倾向于使用Twitter和微型博客,部分原因是在这些设备上写长篇作品并不容易。实际上,记者和作家约翰·马科夫(John Markoff)在我们博物馆举办iPhone周年纪念活动时写了一篇文章,名为《下看的目光》(The Downward Gaze)。如果你想想,为什么我们总是低头看着我们的手机,然后会撞到东西或绊倒呢?因为我们需要看着打字。使用老式的拇指键盘,人们熟练掌握了盲打的技巧,同样也适用于手机。因此,我们可能花费60%的时间盯着屏幕,以确保我们已经准确地输入文本。我认为这仅仅只是一个例子,表明了人机交互界面的那些决定是非常重要的。它们远未结束。幽默杂志《洋葱》(The OINON)(编按:洋葱是一本非常有趣的伪新闻媒体网站)有一篇很棒的文章,我的论据来自那里。研究表明,我们花费80%的时间盯着那些无聊的矩形屏幕。我们早上醒来,就去一边拿起这个发光的小矩形手机。然后我们去工作,看着一个更大的矩形,晚上回家后,就用一个更大的矩形来放松心情。为什么计算机还没有摆脱屏幕的束缚呢?人们多年来一直在谈论有形计算和墙壁上的文字以及智能油漆等等,但它们在哪里呢?我们仍然盯着这些微小的矩形屏幕。因此,在这方面有很多广阔的领域需要开发。

Q:马克,我有一个相当长的问题,我已经写下来了,是关于超文本的问题。你提到超文本,我在想在90年代甚至2000年,超文本在个人计算机向网络计算转变的过程中非常重要。但是,在某种意义上,超文本处于一个奇怪的境地,它是该领域中最常被写作的类型,但似乎同时又是当今作家们最不积极追求的类型,而不像作为一个独立的类型存在,它的元素已经开辟了新的形式,比如新的媒介。一些超文本的基本要素存在于许多当代电子文学的类型中,比如一些VR作品或一些互动小说。但我想问一下,超文本在今天的重要性是什么?我记得罗伯特•库珀(Robert Cooper)的一句话,他曾经说过:永远不要忘记阅读电子文学有多有趣。那么,它现在还有趣吗?因为看起来,我们在网上阅读新闻就像在读小说。超文本小说或超文本,它是否只会是一个存档的东西,还是有更有趣的东西,或者超文本本身有更多可能性?谢谢。

Marc: 事实上,我们已经为博物馆采访了罗伯特·库珀,但是在超文本中的那种高度创意写作依然是一种边缘流派。但我认为我们又在使用它了。在网上我们几乎做的任何事,我们都在不断使用超文本。这是我们获取新闻、参考信息,显然还有社交媒体的方式。所以我意思是,它已经成为我们导航内容方式的一个基础部分,我认为它根本没有消失。的确,书籍保持了相当传统的模式,尽管即使在你阅读Kindle书籍时,你经常会跳转到定义或其他内容而不自知。但是那些原始的“选择你自己冒险”的书籍,你可以创建叙事,至今还没有成为主流书籍。但我认为,在游戏中它们在某种程度上已经实现了。你有了那些通过你的行动实际上塑造叙事的游戏。我的意思是,再次提到,有超文本也有超媒体。像泰德·尼尔森这样的人更多地期待一种包含视频和其他形式、其他媒介的超媒体。如果你看看现代游戏和今天使用的网络,那都是超媒体。

所以我认为它存在。就我个人而言,这需要一种心理上的努力。当你为了娱乐阅读某些内容时,你不一定想做决定。你想要听一个故事。你不想创造一个故事。所以我认为在电影中,例如,技术上没有理由不能有一个超文本、超媒体电影,在那里你只需做出决定,就能把情节带入不同的方向。但这并没有流行开来。我的猜测,纯粹是猜测,那是因为人们想要放松,想要被动地在那种情境中。他们不想在一天的第三屏幕上放松时选择自己的冒险,毕竟前两个屏幕之后。但是,超文本链接已经与AI结合起来了,既有网络上老式的机器学习,现在还有生成式的。链接不再仅仅是一个链接。它可以是在你的兴趣或其他人的兴趣中进行的各种复杂计算。所以它正在创造一个真正动态的媒介。超文本已经远远超越了静态指针,即旧式的链接。所以我认为它就在我们周围。但是那种特定形式的文学并没有成为主流。这是真的。我不知道是否回答了你的问题。

讲者简介

计算机历史博物馆互联网历史项目的策展总监。互联网历史项目依托博物馆领先的网络历史资料收藏,通过出版书籍和举办活动来探索互联世界。韦伯于1995年开始将网页历史作为一个研究主题,得到了网页的主要发明者蒂姆·伯纳斯·李爵士以及其他先驱人士的重要支持。他共同创立了该领域两个最早的组织,并在十多个画廊策划了与网络、移动和人工智能相关的展览。韦伯也在主流媒体、专利公司和电影制作方面就相关主题发表演讲并提供建议咨询。他曾在硅谷和瑞士日内瓦附近担任软件和生物医学顾问长达十多年。他曾在加利福尼亚大学任教,拥有布朗大学神经生物学和创意写作双学士学位。

Marc Weber is curatorial director of the Internet History Program at the Computer History Museum (CHM). The program explores our connected world through publications and events, and builds on the Museum’ s leading collection of networking history materials. He pioneered Web history as a topic starting in 1995, with crucial help from the Web’ s main inventor Sir Tim Berners Lee and other pioneers. He co-founded two of the first organizations in the field, and has curated over a dozen galleries or exhibits on networking, mobile, and Al.