Debiasing Data to Build Inclusive Technologies
文 / Payal Arora
翻译 / 韩秋霞
校对 / 郑叶颖
我非常喜欢本次会议提出的主题,这也是为什么我希望与大家深入交流的原因之一。会议主题让我感触最深的一点是:我们是否能够从不同的起点思考全球南方所发生的事情,而不总是借用、依赖那些基于全球北方的理论、关切和经验数据。这一点,我认为非常关键。
让我进一步阐释这一观点在我的书中是如何体现的。我的新书《从悲观到希望:全球南方包容性技术设计的经验》(From Pessimism to Promise: Lessons from the Global South on Designing Inclusive Tech)讨论了我近年来观察到的一种趋势:即在数字技术领域,全球北方和全球南方之间存在着明显的悲观主义与乐观主义分裂现象。全球北方对数字技术及其未来越来越悲观,而全球南方地区尽管面临各种风险,却对诸如人工智能(AI)等新兴技术创新表现出越来越多的乐观态度。
这种趋势可以从大量媒体报道中看出。例如,在全球北方,关于 AI 的头条新闻通常围绕着“AI 将导致人类灭绝”、“AI 对人类生存构成威胁”、“AI 正在摧毁我们的民主、心理健康以及社会生活”等悲观论调。一种对数字技术的无力感表现为失望悲观的情绪。许多书籍也巩固了这一情绪,例如《被设计的悲伤》(Sad by Design:On Platform Nihilism)和《监控资本主义》(The Age of Surveillance Capitalism: The Fight for a Human Future at the New Frontier of Power)。北方叙事已经演变为一种人类对抗机器的“大卫与歌利亚”(David and Goliath)式悲剧1,人们认为庞大的技术公司掌握巨大权力,侵蚀我们的一切:我们的控制力、身体和生活。
因此,当算法中存在压迫时,它本质上就是种族主义。而大量现有的讨论都在告诉我们:无论它是压迫性的还是种族主义的,我们唯一能对抗人工智能的方法就是抵制它。它是与我们作对的东西,我们需要抵制它,这是恢复人性的唯一方法。
因此,这种将 AI 视作人类敌人的认识框架引发我们这一代深刻的焦虑。有人认为,这正在重新塑造我们的思维方式,改变甚至破坏新一代的成长。因此,我们需要禁止它、控制它,尽一切努力远离科技,以恢复自我。这就是我们的时代氛围,也难怪全球北方及其相关学术研究对技术抱持如此悲观的看法。
最近有一篇文章探讨了:美国的进步主义者让自己变得如此悲观的原因2。这种情绪还远不止于此:美国多项民意调查显示,今天普通美国人对未来比十年前更加悲观。尽管经济等因素没有明显恶化,但他们认为自己的处境比以往糟糕得多。当然,目前的政治局势加剧了这种绝望,然而这种情绪早在此之前就已经存在。
与此相反,多项民调显示,在肯尼亚、墨西哥、中国、尼日利亚和印度等国家地区,大多数人对未来充满乐观,而相比之下,瑞典、法国、澳大利亚和英国的人们则相对悲观。当问及 AI 对工作场所生产力的影响时,印度、印度尼西亚、阿联酋和墨西哥等国家呈现出更多的积极反馈,而这种乐观情绪在欧洲和美国明显减弱。这是多项民意调查在过去十年内持续调查所得出的结果,呈现出的结果相当一致。
再比如气候变化,同样,在亚洲和撒哈拉以南非洲地区,人们对未来的乐观情绪远高于欧洲和北美。这种情况令人困惑,因为全球南方是受气候危机影响最严重的地区之一。这是显而易见的,因为他们需要承担主要的环境影响,而其资源远少于像荷兰这样的发达国家,且往往缺乏强有力的政策执行机构。那么为什么他们的乐观情绪反而更强?
学术界和媒体对此给出的解释是:他们“天真无知”。学界与媒体认为全球南方过于天真,但这不是他们的错,因为他们缺乏知识。因此,这种所谓的“乐观”被归因于一种缺陷模型(deficiency model):他们缺乏教育、素养和意识。所以全球北方的任务是教育他们,告诉他们为什么应该将 AI 视为敌人,说明 AI 为何具有极强的压迫性、种族歧视和性别歧视,从而引导他们走向同样的悲观立:只有批判性地看待技术,人们才能勉强找到未来的路径。
相反,我们可以换一个角度看待这个问题,我在书中从三个视角进行探讨。首先,从人口统计学角度来看,全球 90% 的年轻人生活在全球南方。他们天然就更加乐观,是因为他们有未来可期,而这与老龄化的欧洲人口形成鲜明对比。其次,作为一个年轻人,关键需求之一是自我实现。无论是在印度、尼日利亚、巴西还是菲律宾,年轻人自我发现的机会至关重要。这意味着,当你生活在一个高度保守的社会,比如宗教约束很强,或者你的性取向在全球南方的大部分地区是违法的,互联网就会成为比实际物理生活空间更自由的空间,尤其是与“浪漫经济”(romance economy)有关的现象。在全球南方的很多国家地区,大多数人会经历包办婚姻,很少甚至完全没有恋爱经历。这种独立探索亲密关系的匮乏,使得数字化世界能够满足年轻人探索自我性取向和亲密关系体验的基本需求,而这种探索是个体成长中非常重要的驱动因素,我们有数据支持这一点。
第二个方面是关于自由——特别是政治自由和个人自由,这两者在很多情况下是交织在一起的。极端例子包括阿富汗和伊朗,在这些地方,女性在公共空间中往往被“驯化”和“隐形化”,甚至无法与他人交谈。在阿富汗,她们不能歌唱,不能在公共场所行走,她们的权利受到限制。相比这类特定的地方现实处境,数字世界的确为她们提供了一个重新“赋予人性”(rehumanize)并与外界公共领域接触的机会。这一现象同样适用于许多其他被边缘化、受压迫的群体,比如性少数群体。这些群体都会利用数字化资源获取应得的平等权利。数字空间对他们而言相对安全,这也是一种对数字技术颠覆性的使用方式。
第三,由于地方政府往往无法理解年轻人的需求,我们可以看到数字空间具有一种经济层面上的灵活性。年轻人不再想成为农民或水管工,也不想重复祖父母或父母的职业。他们希望开辟自己的道路,通过跨越传统工作方式,迈向全新的生活。创作者经济(creator economy)为年轻人开辟了一条小径,让他们能够进行实验并实现劳动货币化,尽管这同时存在各种危害和风险。这并不是说他们不了解这种“掠夺性机制”(extractive nature),相比而言在特定地方这一经济模式的好处显然大于其风险。例如在纳米比亚,高失业率显而易见。我和我的团队在纳米比亚发现,大约 60% 到 70% 的农村青年在某一时期阶段处于失业状态,这导致他们陷入深度抑郁。因此,他们利用数字资源不仅仅是为了连接网络,还尝试寻找潜在的就业机会,同时也在探索开辟新的工作和生活方式。我们需要新的看待 AI 的出发点,而不是陷入“AI 是好还是坏”、“它是否造成压迫或性化”等二元对立的思考模式。这种框架限制了我们以多元视角分析全球南方作为独立实体的复杂性。
因此,我将提出五个基本理论,用来反思和挑战既有的全球北方强势理论。
1. 数字鸿沟:从工具性到整体导向
Digital Divide From instrumentality to holistic oriented
我是联合国及许多其他机构的董事会和委员会成员,最近与一位联合国高级官员进行了一次令人不安的对话。这位官员长期致力于推动“最后一公里上网”(即让偏远地区接入互联网)。然而,她坦言自己正陷入伦理困境:她认为,让全球南方用户接入互联网存在伦理问题,这可能意味着将全球南方送入“数据攫取器”(data extraction machine)和“数据殖民机”(data colonial machine)。因此,这种看似弥合数字鸿沟的行为可能并非正确之举。需要强调的是,这种反思正在那些倡导“数字权利”的圈子中发生,因此,这种争论显得尤为令人不安,而类似的话题在十年前几乎不曾出现。如今,是否应将全球南方群体接入互联网,竟成为一个合法性讨论。这种趋势无疑令人震惊,因为接入网络本应是一项基本权利,而这种思潮正在跨领域、跨行业蔓延。
而这实际上会进一步疏远全球南方。此外,这其中也存在一种双重标准:那些声称数字化有着各种有害特质的人,恰恰是那些在网上与追随者高度互动的人。例如,以马克·扎克伯格(Mark Zuckerberg)为代表的各种人物都在社交媒体上异常活跃,并从中获得各种好处。因此,我们需要一种智识上的诚实和个人层面的坦率:如果我们在全球北方的自由民主制度中,正在日常生活中消费这些社交媒体和人工智能工具,那么为何要为全球南方设定一种不同的标准?除非我们打算放弃使用所有这些工具,或者认为我们在某种程度上拥有更好的工具,又或者认为我们比全球南方的人们更具备个人能力。因此,我对目前的这种趋势深感不安。
还有一种奇怪的现象,这种现象始于后殖民心态(post-colonial mentality),即全球南方与北方存在数字鸿沟,并且随之衍生出富人和穷人之间的分化,然而这一状态现在已经发生了显著的变化。在我的上一部著作中,我讨论了过去十年来新增的互联网用户群体的动态变化。其中数据成本在这十年间的变化极其显著——全球南方从全球数据成本最昂贵的地区变成了成本最低的地区。如今,移动互联网成本最低的国家包括印度、中国、菲律宾、柬埔寨和以色列等。如果你与典型的全球北方普通民众交流——当然,这不包括那些对这些领域非常关注的人——他们根本不会意识到这一点。他们依然假设西方拥有最廉价的互联网,这一判断并不基于任何相关数据统计。因此,他们的世界观仍停留在过去的数字鸿沟概念中。然而,事实上,全球南方在许多方面已经超越了北方。例如,他们在金融科技领域的表现尤为突出,比如亚洲国家普遍应用金融科技最多。例如十年前,当有人问到埃隆·马斯克(Elon Musk)对比亚迪的看法时,他曾对此嗤之以鼻。而今天,他却恳求欧盟监管机构阻止比亚迪进入西方市场,他明确表示否则这将摧毁整个市场。然而,我们似乎仍未理解这一变化,我们依然固守西方进步的概念和框架,并将全球南方视为数字上的“缺乏者”。
2. 渴望的算法与压迫性算法
Algorithms of Aspiration vs. Algorithms of Oppression
另一个视角是“渴望的算法”(algorithms of aspiration)。我在新书中提出这一观点,用来与“压迫性算法”(algorithms of oppression)形成对照。在此,我想明确回应一点质疑:这是否在否认算法的压迫性?我并没有否认这一点,然而我的关注点是比例问题。学术研究往往过于专注于算法的压迫性维度,例如性别歧视、种族歧视,而鲜少以更全面的视角看待 AI 的作用。这种单一视角会引导我们陷入一种消极的螺旋式思维,仿佛 AI 毫无价值可言。
而在我的研究工作中,作为一名数字人类学家,我过去二十年间主要在印度、巴西、纳米比亚等地的边缘化社区开展研究。我们发现人们对任何形式的数字创新都表现出极大的热情。事实上,在美国,非裔美国人的低收入群体对 ChatGPT 的乐观程度远高于美国其他人群。然而,我们却倾向于专注于 AI 的压迫性,而没有尝试去理解:他们为何对人工智能如此兴奋?以下是其中几个原因:
首先,全球南方地区许多人缺乏优质教育,或者缺乏优质教材,尤其缺乏用他们的母语或方言编写的教材。此外,教师经常缺席或无法到校授课。在这种情况下,像 ChatGPT 这样的 AI 工具提供了一种几乎类人化的支持,使得这些用户能够与其深入对话,并以一种高度个性化的方式进行学习。因此,这些群体对这些工具充满渴望并保持乐观是有原因的。通过实际使用和实验,我们发现低收入群体的年轻人往往会花费 10 到 14 个小时投入于此。他们对 AI 工具的潜在功能感到痴迷,因为这些工具可以帮助他们开拓新的谋生方式和自我存在的形式。同时,由于这些群体往往长期不被看见或听见,他们的处境被各种不利因素所限制——例如,英语不是他们的主要语言,他们身处全球南方,没有享受到发达网络的优势,而这些工具通过偶然性和“渴望的算法”为他们提供了某种机会。
以 Ranautneel 为例,他是一位来自印度的“农村网红”,住在接近农村的三线城市,他通过使用其所在农村的本土材料响应全球时尚趋势。我们可以看到,他仅靠一张图片就获得了 27,000 多个点赞,而他所拥有的粉丝数量甚至超过了许多全球时尚品牌。这只是其中一个例子,而这一现象在十年前是不可思议的。这不仅为这些年轻人提供了展示自我的途径,也打破了都市印度人对“乡村性”的固有观念。
我最近为印度一些初创企业做了一次内部书籍分享会,这些企业的员工在阅读我的书后表示,最大的收获之一是,他们之前从未真正考虑过印度的乡村市场。他们默认乡村地区非常保守,因此只关注城市市场。而看完书后,他们感到振奋,认为应该认真考虑乡村二、三级市场作为用户、消费者和创造者。
这一点让我感到非常兴奋,它推动人们重新审视自己既有的观念框架。我相信在每个国家,无论是菲律宾还是中国,都存在关于农村的刻板印象。我们往往将其定格在过去的时间中,然而它们是公共与多元文化的交汇点,需要特定理论思考。
另一种“渴望”推动全球南方的年轻人连入网络。在我们的采访中,有一位参与者通过大量视觉创意在网络上制造浪漫创想,而这种创意表现形式在这一人群中非常常见。更有意思的是,根据全球调查显示,欧洲和美国的典型年轻人往往不认为自己是“全球公民”,比如只有不到 30% 的德国人认同这一身份。而全球南方地区的年轻人中,大约有 80% 到 85% 认为自己是“全球公民”,即便他们中的大多数从未离开过自己的城镇或国家。这反映了一种渴望,而这种渴望在线上得到了体现。正如我们之前看到的,这些年轻人通过接触全球化的叙事、全球化的媒体和娱乐,成为一个更大的跨文化叙事的一部分。
3. 关怀式监控与监控资本主义
Surveillance of Care vs. Surveillance Capitalism
另外,对于全球南方群体而言,接入网络所能够获得的“关怀式监控”(surveillance of care)往往多于“监控资本主义”(surveillance capitalism)。近年来,我接触到一些硕博士研究生,尤其是来自东亚的学生,告诉我他们很难让自己获取的数据与“监控资本主义”理论契合,因为他们的受访者,比如越南的用户,似乎对这些平台非常感兴趣。那些用户并不觉得这是压迫性的,即使他们知道自己的行为被货币化,也了解其潜在的危害。但他们通过平台分享信息,并将其视为一种彼此团结互助的方式。例如,在创作者经济中,用户会分享关于如何制作内容和使用人工智能的经验。以非洲的创作者为例,他们建立了大量非常值得关注的子群体。这是因为他们意识到,要想作为一个整体推动自身发展,合作是关键。因此有了这种“关照彼此”的概念,而不是单纯地“观察彼此”(watching over each other versus watching each other)。因此,这里不仅仅存在监控资本主义式的数据追踪与攫取,还有一种“关怀式追踪”(tracking for care)。我们开展了一项为期三年的研究,聚焦于印度和孟加拉国的网约车行业。研究发现,女性司机非常希望公司对她们进行追踪,因为这可以保障安全、便于问责。毕竟,她们需要搭载陌生人并往往在深夜工作。此外,她们还希望实现双向沟通,例如司机能够评价乘客的性骚扰或不当行为,让公司将这些乘客列入黑名单。这本质上也是一种追踪。
我们需要意识到,在全球南方的大多数地区,女性的权利与男性并不平等:她们往往被视作“二等公民”。例如,在监护制度下,她们需要男性的陪伴才能出行;她们在公共空间中的权利也远不及男性,这在阿富汗、伊朗等国家地区非常常见。印度的性别不平等文化也是女性从事网约车行业的最大障碍之一,尽管市场对女性司机的需求极高,因为许多人认为选择女性司机更安全。无论是送孩子上学,接送年迈的父母,还是家庭中的女性成员的出行,大家都倾向于选择女性司机。然而,女性司机却十分稀缺。这种供需矛盾的部分原因在于,女性司机希望被公司和同行追踪,这样她们才能感到安全。
4. 再生式人工智能与抵制人工智能
Regenerative AI vs. Resisting AI
第四个议题有关再生式人工智能(regenerative AI)与抵抗人工智能(resisting AI)。当我们听到很多学者,特别是批判性数据研究领域的学者对 AI 的看法时,他们常说,“我们之所以批判,是因为我们关心,我们将批判作为一种生产方式。”但是,当他们谈论 AI 背后的大型科技公司时,往往以“抵抗”的形式呈现。然而我们如何能够集体抵抗权威,抵抗大型科技寡头,抵抗来自上层的压迫力量?”两周后我将参加一个会议,我们的讨论小组将讨论一个核心问题:“我们如何应对(brace)AI?”而我在想,为什么我们要抱有如此负面的观点呢?“应对 AI ”就像是我们需要为最坏情况做好准备。这种心态的出发点非常消极。然而,如果我们从再生性角度思考,AI 可以成为我们的盟友和朋友,只要我们为其建立正确的“护栏”(guardrails),让人们得以充分利用。
如我在之前的例子中提到的那样,我们有足够的数据证明网络上的许多仇恨言论实际上有关性别歧视。Twitter 自己也承认了这一点。因此,如果我们确保这些空间有问责机制,让那些发表性别歧视言论的人无法使用甚至访问这些平台,或者受到某种形式的惩罚,我们就能够为每个人创造安全的数字公共空间,让大家都能享受这些空间并利用这些工具获取利益。
以下是一些具体的例子,说明 AI 是如何再生的,并且为什么使用 AI 的社区会因此感到骄傲。伊朗的女性运动正在使用 AI 提醒大家,伊朗是伊朗人民和政权的国家。伊朗曾是一个进步的国家,在此人民享有自由的权利——可以穿着自己喜欢的衣服,甚至可以公开接吻而不遭受严重后果和身体伤害,这种自由仅仅在几十年前就存在。活动家生成 AI 图像用于说明这一点,作为在伊朗境内进行道德抗议的一种方式,同时它不会让人们处于危险之中。这是一种非常重要的视听赋权策略,引发抗议活动带来的群体情感,而不把人们置于危险境地。
目前,我有一个名为“包容性 AI 实验室”(Inclusive AI Lab)的项目,我们正在投资建立一个包含伊朗和阿富汗女性的合成视听叙事资料库。我们希望将其放入创意共享平台,让这些女性重新被赋予人权,以向公众展示她们的形象。
另外一个例子是,在玻利维亚,我们通常对拉丁美洲的土著社区存在刻板印象。在这里,艺术家 Miranda Gamel 利用 AI 技术,抵消算法偏见,用极具表现力的方式,展示这些社区的形象,某种程度上是在“游戏”算法,从而可能改变我们看待这些社区和世界的方式。
在我们关于巴西和委内瑞拉边境的难民研究中,我和联合国难民署(UNHCR)团队进行为期一年的合作。我们发现,大多数年轻难民并没有选择退出,而是希望加入数字世界。他们与数字世界产生了深刻的共鸣,并发现其中的巨大价值。他们喜欢在线上活动。以下是一位来自委内瑞拉的同性恋者的自述,他最终在网上出柜,并得到了巨大的支持:
我的梦想是做视频,因为我的故事很难讲述。我曾经历过两次心脏病发作,后来得到了上帝的拯救。还有些事情我希望世界能理解——我不仅仅是一个难民,我有自己的故事,我想被听见、被分享。我拍摄了一张照片以表达我的孤独,这张照片被许多人所喜欢。我也很喜欢这张照片,正是这张照片让我明白,必须重视自己作为一个人的价值。
数字平台能够为这些个体提供自我表达和认同的机会。
5. 数据作为货币与数据殖民:数据殖民主义与技术迷恋
Data as currency vs. Data colonial, data colonialism, techno-fetish
最后要提到的是数据作为货币的问题。这与大量关于数据攫取、殖民主义和科技迷恋的文献相抗衡,人们看到数据也是一种货币。用户意识到,虽然公司通过他们的数据获益,了解了他们的行为,但这种关系总是相对的,尤其是在用户资源极为有限的情况下——就如我在前面的案例中提到的那样,他们理解这是他们进入数字世界的一种方式。我并不是说这是一种理想的方式,我们当然更希望没有数据追踪。但是另一方面,这一切总是相对于我们所看重的内容,尤其是在优化和个性化的背景下。
我们需要诚实地面对人们做出决策的方式,并对他们为何做出这些决策所带来的公正机会给予理解,而不是默认将其归结为数据殖民主义的叙事。我的一些同事前往印度“原生 5G”(indigenous 5G)进行调研。他们研究了这些基础设施网络,并得出结论:印度的技术政治空间并不关心公共价值,而具有极强的压迫性。他是一位新马克思主义学者,然而我认为他的观点过于苛刻。印度已经开创了世界上最大的数字公共基础设施,这使得年轻人能够免费接入互联网,甚至成为创业者,而不必支付安卓或 iOS 系统的“黑社会税”,即 20% 到 30% 的费用。
他的研究问题也基于这样的假设:“这与爱立信有何不同?”他指出,印度政府拆除爱立信的基础设施,取而代之的是政府自己的基础设施,这本质上还是国家监控。所以,全球北方学术界,尤其是在批判数据研究领域,往往把全球南方视为受害者或国家压迫者,两者之间似乎没有空隙。在他们看来,用户不可能从这些公共数字基础设施中获得价值,因为他们处于国家的监控与压迫之下。我并不否认我们需要批判研究,但我们需要留出讨论的空间。
如 Anghami(中东和北非地区领先的音乐流媒体平台),正在实验 AI 工具通过 AI 分配创作来源,并允许 AI 生成音乐,而大多数国家长期以来存在着这类非正式经济(informal economies)。我们有很多非常独特的视角,这些视角在全球北方关于零工经济(Gig economy)的文献出现之前就已经存在,而这一点并没有被充分发掘。似乎从“零工经济”范式在全球北方学者研究中出现后,非正式经济才成为一个话题,但这在全球南方的国际发展研究和其他相关学科中早已有大量研究。
因此,作为总结,我们可以通过认识到我们处于不同的立场来打破这种悲观的泡沫。如果我们想要保持知识的诚实,就必须认识到这并非非此即彼。我们需要仔细描绘并充分权衡人们做出某些看似令人困惑的决策背后的原因。我就讲到这里,期待听到大家的想法,谢谢!
问答讨论
Q:非常感谢您的演讲!关于全球南方,您提到的所有技术其实可以分为两种类型:一种是由人们直接拥有和访问的技术,另一种是平台化且由公司拥有的技术。这两者的差异非常大。因为您提到“监控为关怀服务”的观点,比如,我们中国政府以类似父母式的监管著称。我记得有一次叫网约车,司机的手机会一直被平台录音,所有的对话都会被记录下来。这给司机带来了巨大的压力,这让他们避免和顾客发生冲突。乘客在乘车时也有很多规则需要遵守。所以,虽然我在某种程度上同意技术能够为全球南方带来一些积极影响,但我有些不确定,是否技术真的能带来抗争和赋权,毕竟也有很多技术并不能如此。但我还是比较认同全球南方的技术具有积极面。那么,您是否对技术所有权有不同的意见或思考?
A:非常感谢您的提问。首先,确实存在很多需要关注的问题。比如,我曾看到一些统计数据,由于大多数全球南方国家并不具备自由民主制度,因此他们面临的风险和伤害要远高于其他地区。然而,全球仅有不到 7% 的国家是自由民主制国家,并且这些国家通常还非常保守,并且存在父权制问题。面对如此多的挑战和困境,尤其是国家监控问题,为什么这些人仍然表现出如此强烈的乐观情绪?尽管面临如此多的困难,为什么在过去的二十年里,我仍然能遇到许多人对技术充满希望?我并不是说他们是天真的,但这让我停下来思考。因为我享受着荷兰这样的自由民主国家生活,尽管我来自印度。虽然我并不住在那里,但我的整个家庭都在那里,我对那里的动态变化和风险是非常敏感的。如果他们感到乐观,那么我就必须给予他们这种乐观情绪应有的重视。关键在于,这种乐观情绪与什么有关?我认为这一点非常重要。
所以,您说得对,关于监控和持续监视的具体例子确实令人担忧,尤其是当这种监控是单向的。如果监控同时也作用于顾客,并且对顾客对待司机的行为有责任追究,并且有相应的后果——比如我们在女性清洁服务公司,如 Urban Company 进行过的一项研究,研究对象是那些进入陌生人家中的女性,她们提供清洁、理发等服务。这些人的工作需要他们进入一个完全陌生的人的家,而如果服务提供者是女性,那个陌生人可能做出任何行为。那么,我们是否可以通过对顾客的评分来施加某种责任呢?这点非常重要。我想表达的意思是,尽管面临如此多的挑战,印度的女性往往更倾向于被持续追踪,因为现有的社会体系对她们不利,充斥着父权和性别歧视。
我认为这是关于权衡取舍的问题,这些女性知道这些技术对于不怀好意者来说是令人害怕的。我有很多其他的例子,但从根本上讲,关于所有权的问题也是如此。前几天我正在审阅一篇来自顶级媒体学术期刊的文章,文章中提到,非洲没有自主权,因为大多数基础设施是由美国或中国拥有的,他们基本上只是被动的接受者。我想,怎么能把整个大陆描绘成没有自主权的状态呢?因为这样做其实是在削弱一个事实,那就是非洲的用户群体非常庞大,并且非常年轻,非洲拥有世界上最多的上网用户,而到 2030 年,非洲的年轻人口会占据更加显著的比例,他们将拥有数量上的力量。而公司必须在某种程度上关心他们的客户。我们如果认为这些人完全没有任何权利和自主性,那是过于悲观的。是的,局势对他们不利,但他们依然选择参与其中。
这让我想到了公共空间所有权的概念,实际上是合作化的。举个例子,像纽约的华尔街公司,有时候这些公司会拥有他们大楼外面的一部分街道,在伦敦也是如此,但这些地方依然是公众使用的空间。因此,所有权存在,但这也涉及到控制的方式。当 Facebook 威胁要退出澳大利亚时,经过一周的大规模批评后,他们又回来了。所以,虽然你可以拥有某物,但你无法完全控制并对你的用户做任何事情,Facebook 作为全球最大的社交媒体,对用户群体的代理权存在一定的局限性。全球南方是全球最大的用户群体,我们应该要有信心,认识到用户人数的力量。所以,我知道还有其他问题,我自己也在与这个问题作斗争,我希望能够给人们作出看似不理性选择的原因给予公平的重视。我无法接受那种“缺陷模型”,只是认为他们只是天真而已。所以,这正是我想要弥补的差距。
Q:我从大学时就开始学习计算机科学,我也做了很多关于社交媒体和社交网络的研究。我们可以说今天技术最重要的部分就是数据,尤其是大多数人工智能和大型语言模型都是由西方开发的,使用的主要是西方的数据集,特别是英语世界的数据集,而其他语言的数据集相对较少。那么,全球南方如何才能为全球南方的人们开发出属于自己的人工智能呢?正如你所提到的,大多数人工智能系统是为西方世界设计的,关注的是他们的福祉和权益。那么,如何利用全球南方的数据,使得其中大多数数据最终服务于其他地区的人们呢?
A:谢谢你的问题这也是很多全球南方很多地区充满乐观情绪的原因之一。例如,长期以来,(技术发展需要)迎合不同语言的需求是非常不现实的。以印度为例,印度有 22 种区域语言和 2,000 种方言,因此从财政角度来看,无法为这个资源有限的国家提供多语言服务。然而,随着大型语言模型的出现,这一局面发生了根本性变化。现在,很多地区方言的微型语言模型已经得以建立,甚至一些区域方言也被纳入其中,这在印度是非常明显的。
同样的情况也发生在非洲,很多创业者正在打造超本地化的解决方案,来解决当地的问题。这些企业家正在构建适应当地需求的语言模型,(让人们能够)使用这些地方性语言模型。因此,这也赋予他们相对于来自全球北方的通用大型语言模型的优势。我们可以看到,非洲、印度、菲律宾的创业潮正在兴起。东亚地区也是如此,我最近在和东亚最大的风险投资公司之一进行内部交流,他们展示了越来越多的企业家正利用人工智能,不仅关注语言问题,还在考虑本地化优势,并能够通过合成数据进行捕捉和扩展。但问题在于我们的学科之间并没有很好地进行连接。例如,批判性数据研究与移民研究并没有与社会创业研究有交集。我认为我们需要真正的跨学科对话,这样才能捕捉到正在发生的变化,并改变我们的思维方式。商学院对此非常敏感,很多创新与创业的学术研究都非常关注这一点,但他们并不完全认同批判性数据研究的观点。批判性数据研究等学术领域虽然非常重要,帮助建立伦理框架以确保责任和安全性,但我们仍然需要跨学科的协作,以便优化这些基于证据的方法。
Q:我相信在座的许多人也有类似的看法,虽然我不能替他们发言,但之前您提到的内容都指向未来将朝着类似的方向发展。关于你提到的全球北方如何以过于父权主义的方式向全球南方解释一切,这也是历史上非常常见的议题。很多时候,他们总是这样框定:等待就好,终会到达。那么,我们该如何干预这一长久以来的叙事?如何反击这种局面?
A:非常高兴再次见到你,谢谢你的问题。你提到的这一点非常重要,我们应该从理解普通人,尤其是那些被边缘化群体的需求入手。我们通常会问他们的担忧和问题,关注其伤害,但我们往往忽略了他们的价值观:为什么他们在所有这些问题面前仍然选择在连接网络?一旦认识到其中的原因,我们就需要将其放在中心位置,确保在建立平台和制定政策时,不会破坏他们所珍视的东西。确实,全球北方在财力上具有巨大的不对称优势,尤其是美国在生成性人工智能方面的强大影响力。然而,是否可以将全球南方的用户和公民放在中心位置,关注他们所热爱的,而不仅仅是他们所害怕的?比如,欧洲经常宣称,他们制定的人工智能法案是为全世界设计的,但如果仔细研究,你会发现,这些法案完全是基于欧洲的价值观。而且,你会发现这些法案并没有真正考虑到全球南方的情况。如果直接复制这些政策,可能会对全球南方产生深远的负面影响,甚至可能会剥夺很多地方文化的核心。比如“同意”这一概念,在一些国家或地区,女性可能因法律规定需要获得丈夫或父亲的同意才能自由行动。因此简单的“同意”概念并不能适用于这些地区,因为这些地区的选择并非真正的选择。
我一直在推动敏捷软件开发(Agile software development)3的发展,也在印度数字经济委员会担任职务。我们注意到,印度的数字生态系统虽然令人自豪,但当谈及技术带来的伤害时,更多关注的是网络诈骗和威胁,而忽视了人们在使用这些技术时所感受到的真实困扰。像印度、墨西哥等地的某些群体,会因为可能感到不安全或受到骚扰而远离某些数字工具。所以我们应该更加关注这些群体的需求,同时也要了解他们真正看重的价值。比如,在疫情期间,很多市场的从业者开始在线直播,这不仅帮助他们维持生计,而且特别是女性通过直播建立了社群感,这也让她们能够获得使用数字工具的合法理由。
最终,我想说的是,我们在全球北方有责任去开发适合全球南方的工具。幸运的是,我看到全球南方,尤其是非洲和印度,正在涌现出不同的解决方案,这可能会为我们带来新的范式变革。这是另一个话题,值得进一步探讨。
这是一个非常重要的问题,因为这是我们接下来要面对的挑战——如何从现在开始走向未来。正如我之前提到的,我们在讨论这一点时必须强调,我们不应陷入这种决定论的思维方式。例如,有学者认为我们已经失去了对数据、对自我、对生活的控制。这是一个非常决定论的说法,他声称我们已经被数据殖民化,失去自己对数据的控制权。然而,他依然在线上,享受着这些技术带来的便利。那么,他是否已经承认愿意成为数字技术的仆人呢?你说得对,问题在于所有算法天生就是种族主义、性别歧视、压迫性的说法是非常有害的,如果我们相信这是一个既定的状态,那么为什么还要起床去改变它呢?
因此,我们可以采取不同的视角来看待这个问题,即理解人工智能是通过数据进行训练的,数据集本身存在缺陷——“垃圾进,垃圾出”。但是,假如我们不再输入垃圾数据,而是开始构建高质量的数据集呢?我们实际上正在进行这样的工作。我们正在为人工智能系统构建招聘合成数据集,这是欧洲一项大型资助项目的一部分,这在欧洲非常普及。然而,我们面临的经典问题是,像亚马逊这样的公司往往将 CEO 职位推荐给白人男性,因为数据集的历史就是这样。那我们如何改变这一点,如何让算法在思考职位时不依赖身份特征呢?我们目前正在与计算机工程师、社会科学家和人类学家合作,构建一个高质量的数据集,然后我们可以通过合成数据扩展它。合成数据本质上是这种高质量数据的复制。这是AI 技术令人兴奋之处,几年前这是不可能的。
我还在做的另一个项目是与一家大型设计公司合作,去矫正他们的视觉数据集。当你在印度 Google “女性工作”时,搜索结果中有很多刻板图像,比如“非洲儿童”之类的贫困图像,而这些图像大多由援助机构创造,用于募款等目的。那么,如果我们能改变这些数据集,去多元化非洲人想要被呈现的方式呢?我们正在进行这个工作,目前已经聘请了印度的创意人员,对数据集进行调整,并计划在扩展到肯尼亚乃至拉丁美洲的第三个国家。这不仅仅是合作,更是团结,我们可以一起完成这项工作。这是一个可以复制的努力,最终(好的数据集与 AI 工具)会进入创意共享平台。我认为这些充满希望,归根结底,数据集就是我们自己。我们每天的交流实践本身就是数据,我们可以通过集体努力“游戏化”系统,从而改变算法。所以,这一切正在发生,我们只需要放大这些努力,来改变这个局面。
- 编者注:这里使用 David and Goliath 的寓言以比喻人类对抗机器是以弱战强 ↩︎
- 编者注:Are American progressives making themselves sad? Conservatives seem more excited about change, from The Economist April 2024 ↩︎
- 编者注:敏捷开发是一种应对需求快速变化的软件开发模式 ↩︎
讲者介绍
佩雅尔·阿罗拉
Payal Arora
简介:Payal Arora是乌得勒支大学(UU)包容性人工智能文化教授,也是FemLab和包容性人工智能实验室的联合创始人。作为一位数字人类学领域的领军人物,她在全球南方地区拥有二十年的用户经验,致力于推动构建包容性人工智能设计和政策。Payal撰写了100多篇期刊文章和获奖书籍,包括与哈佛大学出版社合著的《下一个十亿用户》(The Next Billion Users)(Harvard University Press, 2019)。福布斯杂志称她为“下一个十亿用户的冠军”和“改革科技界的合适人选”。她与麻省理工学院出版社合作的新书《从悲观到希望:全球南方包容性技术设计的经验》(From Pessimism to Promise: Lessons from the Global South on Designing Inclusive Tech)(The MIT Press, 2024)在国际媒体上引起了广泛关注,包括《金融时报》(Financial Times)、BBC《科技解码》(BBC Tech Decoded)和《UX杂志》(UX Magazine)等纷纷报道。约150家国际媒体对她的工作进行了报道,其中包括《经济学人》(The Economist)、《99%隐形》(99% Invisible)、《TechCrunch博客》(TechCrunch)和《波士顿环球报》(The Boston Globe)等。她为公共部门和私营部门提供咨询服务,包括联合国难民署、Spotify、毕马威、Adobe、IDEO、谷歌和通用电气等,并担任多个董事会成员,包括联合国董事会和纽约世界妇女全球理事会。她曾在67个国家的350多个重要活动和邀请演讲中发表讲话,包括ACM FAccT、哥本哈根科技节、re:publica、COP26、世界经济论坛、瑞典互联网基金会等活动,与Jimmy Wales、Steve Wozniak等人物同台,并在TEDx演讲中探讨互联网的未来和创新。她曾是洛克菲勒贝拉吉奥(Rockefeller Bellagio)的驻地研究员,拥有印度、美国和爱尔兰血统,视阿姆斯特丹为家。