设为首页加入收藏
全站搜索
新闻详情
 
当前位置
销声匿迹:数字化工作的真正未来(上)
作者:admin    发布于:2021-06-05 14:52    浏览次数:
  

  AI)系统运行的竟是人类的劳动力,但我们很难发现——事实上,这些劳动力往往是被故意隐藏起来的。这是个不透明的雇佣世界,我们称之为“幽灵工作”(ghost work)。1想想你最近一次在网上搜索。也许是一则热门新闻话题、最喜爱球队的最新消息,或是新鲜出炉的名人八卦。你有没有想过,为什么搜索引擎返回的图片和链接既不包含的成人内容,也不是完全随机的结果?毕竟,所有的生意,无论是不是合法,做在线广告时都希望自己的网站在搜索中排名靠前。或者想想你最近一次浏览Facebook、Instagram或Twitter。这些网站都有“无暴力图片”和“无仇恨言论”政策,这些政策是如何执行的?在互联网上,所有人都畅所欲言,只要有机会,人们就会说出各种各样的话。那为什么我们看到的内容是净化过的呢?答案是,人类和软件的协同工作为你和我这样的用户提供着看似自动化的服务。

  除了一些基本的决策,今天的人工智能必须依赖人类的参与才能运行。无论是发送相关的新闻提要,还是执行复杂的短信比萨订单,当人工智能出错或无法完成任务时,数以千计的企业会悄悄找人力完成这些项目。这条新的数字流水线把分散在各处的工人汇集起来,形成集体劳动力,而流水线上运转着的不是产品零件,而是一个个项目。这条流水线不分昼夜地运行,横跨多个经济部门。事实上,就业本身正在发生更大规模也更深刻的重组,影子劳动力的崛起只不过反映了这一趋势。这种按需型的就业还有待分类,本质上我们不能断定它是好是坏。但是,如果没有明确的定义,也不让从中受益的消费者知道他们的存在,那么这些工作就很容易沦为幽灵工作。

  企业可以把项目交给数以千计的工人完成,并按任务付费。现在,网络连接、云计算、复杂的数据库,以及人类计算(human computation)这样的工程技术,可以把人类联结起来,完成单靠软件本身无法完成的项目。所谓“人类计算”,就是人类与人工智能协同工作。这是代码与人类智慧的融合,它正在迅速发展。根据美国皮尤研究中心(Pew Research Center)2016年的报告《零工、在线销售和家庭共享》(Gig Work,Online Selling and Home Sharing),2015年美国大约有2 000万成年人通过完成按需分配的任务来挣钱。2到2025年,按需工作平台提供的职业白领信息服务预计增加2.7亿美元,约占全球GDP的2%。3经济学家估计,如果保持目前的增长趋势,到21世纪30年代初,仅美国就有38%的职业会随着科技创新而消失,或者半自动化。4如果任其发展,幽灵工作不透明的雇佣行为和人工智能无所不能的陈旧观点结合起来,可能会使数亿人的劳动被隐于无形。

  琼在家工作,和81岁的母亲住在休斯敦的一幢房子里。2012年,母亲因膝盖手术变得虚弱,无法独自生活,所以琼搬过来照顾她。一年后,琼开始通过MTurk在线领取工作。MTurk是“亚马逊土耳其机器人”(Amazon Mechanical Turk)的缩写,是由科技巨头亚马逊公司拥有并运营的庞大市场。琼最赚钱的工作是“审查猥亵图片”。在Twitter和社交媒体上,用户会标记出“令人反感的”图片,琼会再为这些图片贴上标签。

  企业不能自动处理用户标记的每一段内容,所以会把一些更难评估的材料发送给琼这样的工人。表面上,她的任务很简单:点击图片,然后评估图片内容。这是一张应该删除的X级(1)的阴茎自拍,还是一些无害的G级的身体部位?完成每个任务她都可以得到报酬,并且完成后才能离开电脑。琼已经有好几年经验,现在她平均每天可以挤出10个小时的工作时间,完成任务后能得到大约40美元(2)的收入。

  在几千英里之外的印度班加罗尔,卡拉躲在卧室的角落里工作,这是她的临时家庭办公室。5琼和卡拉做着相同的工作,为互联网公司做单词和图片的分类和标记。不同的是,卡拉从一家外包公司手中接活,这家公司为通用人类关联系统(UHRS)提供人力。UHRS是微软公司自建的供内部使用的平台,跟MTurk很像。卡拉43岁,拥有电气工程学士学位,她是家庭主妇,也是两个十几岁孩子的母亲。卡拉把两个孩子叫进房间,指着LED显示屏上一大段话中的一个单词问他们:“这个词是什么意思?是你们不该说的东西吗?”卡拉大声朗读这段话,两个孩子咯咯地笑了起来。他们在取笑卡拉读“小妞电影”(Chick flick)时的发音。两个孩子一致决定,不,这句话不包含成人内容。卡拉在屏幕上点击“否”,窗口就会刷新,出现一个新的短语让孩子们理解。“他们比我更有资格鉴别这些词,”卡拉笑着说,“他们帮助我为其他家庭维持干净和安全的互联网。”卡拉经常找不到足够多的任务,每周的工作时间不到15个小时,但她几乎每天都会登入UHRS,看看是否有新的任务是她有资格做的。卡拉的坚持和运气已经得到了回报。由于她已经学会如何快速浏览和申领任务,所以可以利用做饭和检查孩子作业之间的空闲时间,用卡拉的话来说,她感觉这些时间“富有成效”,因为她通过网络搜寻她关心的额外收入。

  有很多新工作依赖于琼和卡拉这样的人,内容审核——从筛查新闻提要和搜索结果,到评判相应内容的争议,从而帮助科技和传媒公司判断哪些内容可以保留,哪些内容需要删除——只是其中一个例子。社交媒体公司试图确保数十亿网站用户每天得到家庭友好型的信息,因此内容审查是普遍存在的,通常也是时效性很强的任务。像琼和卡拉这样的人,有太多网页、照片以及各种语言的推文需要评估。

  谷歌、微软、Facebook和Twitter等公司使用软件自动删除尽可能多的“不适合在工作场合出现的内容”。但这些由机器学习和人工智能驱动的软件过滤系统并不完美。它们不能百分百地区别拇指和阴茎,更别提仇恨言论和讽刺了。还记得2012年美国总统大选的经典时刻吗?当时共和党总统候选人米特·罗姆尼(Mitt Romney)说了句“满载女性的活页夹!”,惹恼网民。Twitter需要工人做琼那样的工作,从而及时判断为什么包含在话题标签中的让人摸不着头脑的一句话会飙升到热门话题的最前列。是黑客干的吗?是出故障了吗?真的有人在疯狂地刷Twitter吗?目前的人工智能系统还无法可靠地辨别上述问题。而按需工作指明了一种方向,可以把计算能力与人类的创造力和活力结合起来。

  琼、卡拉以及数百万和她们一样的工人在人工智能失灵时介入,本书讲述的就是他们的故事。我们想当然地以为系统是自动的,但他们才是在幕后推动系统的人类。现代的人工智能系统不仅需要人类回答不熟悉的或有难度的问题,最开始还需要人类帮助它们学习如何回答问题。例如,搜索“驼背沙发”的图片,你会得到一大堆靠背呈曲线的沙发。必应、谷歌这样的搜索引擎并不能和我们人类一样看到或理解图像。家具爱好者不到一秒钟就能找出一件漂亮的带曲线靠背的沙发,这种沙发像驼背沙发一样可以让很多人坐在上面。搜索引擎背后的人工智能系统最开始必须输入至少几百张曲线靠背沙发的图片,每张图片都标记为“驼背沙发”。然后,当搜索引擎遇到一张新的沙发图片时,它会运行一种所谓的“分类算法”,这种算法本质上就是在检查,相比于没有被标记为“驼背”的沙发,这张新图片是否更适合被标记为“驼背”沙发。那么,最初的一系列带有标签的图片,也就是所谓的训练数据,是从哪里来的呢?来自贾斯汀。引导大家接单的任务描述不会超过两句话,贾斯汀这样的工人必须在几秒钟内申请工作,否则就会被其他愿意接手的人捷足先登。贾斯汀是个全职爸爸,带着两个年幼的儿子,孩子上学前和午睡时是他工作的时间。他大方地承认,一开始并不知道驼背沙发是什么。“在回答这些问题之前,我必须在谷歌上花很多时间,弄清楚这些术语的含义。”

  许多企业提供这样的付费项目,其中猫途鹰(TripAdvisor)、、谷歌、Twitter、Facebook和微软知名度较高。像贾斯汀这样的人按任务获得报酬,一天24小时,每周7天。每天都有新的企业出现,他们的商业模式依赖于世界各地的工人,这些工人通过软件响应公开选拔,在幕后完成这些工作。这些企业把日常活动外包给独立工人,而不是交给正式雇员。他们利用幽灵工作回答客户的在线咨询,编辑产品评论,或者完成几乎不需要雇员全职参与的工作。

  计算机程序不过是一串指令,告诉计算机应该做什么。两个软件程序(或一个软件加一个硬件)必须建立一种通用语言才能沟通。这可以通过应用程序接口(API)实现。通过定义程序将会接受的指令以及执行每条指令的效果,API可以确定通用语言。可以说,API规定了计算机程序的“交战规则”。例如,现在市场上有成百上千种计算机,为每种类型编写定制版的软件系统是极其复杂的。但是,如果所有(或至少大部分)可用的计算机都使用相同的API,那么程序员就可以一次性为所有计算机编写代码,因为API确保所有机器都能理解相同的语言。这种API只有计算机能使用,但MTurk的API却可以给人使用:软件工程师可以编写程序,只要稍微修改指令,就可以自动付费让人类完成任务。6

  通常,如果要计算一些东西,程序员可以通过API接入中央处理器(CPU),其中API由操作系统定义。但是,如果利用幽灵工作完成任务,程序员就会通过按需劳工平台的API与工人交互。7人类具有创新能力,可以应答呼叫,所以程序员会把任务分配给人类。不同于API,人类具有能动性,会自己做决定。无论给出什么指令,CPU都会执行;但人类会自发地做出创造性的决策,并加入自己的理解。接入API以后,人类还有需求、动机和偏见。输入相同的内容,CPU总是输出相同的结果。然而,如果带一个饥饿的人走进杂货铺,他(或她)出来的时候会带着一大包食品,与不饿的时候截然不同。人类冲动,喜欢自作主张,但作为补偿,人类也带来了CPU所缺乏的东西——创造力和创新。琼、卡拉和贾斯汀都属于一个不断增长的经济体制,他们被API隐藏起来,被幽灵工作所推动。

  不到20年前,软件工程师只能编写供计算机执行的代码。MTurk以及随后的API出现以后,程序员便可以利用人类完成计算机不能完成的任务,比如快速准确地做出判断,就像卡拉和琼判定内容是否那样。事实上,现在任何坐在网页浏览器前的人都可以回应类似的自动请求。这是API、机械计算和人类独创性的混合,企业称之为“众包”“微工作”或“众工作”。计算机科学家称之为“人类计算”。任何项目只要可以分解成一系列分立的任务,就可以用人类计算来解决。软件可以使用这些API管理工作流程,处理计算机和个人的输出,甚至在人们完成任务后根据贡献多少给他们支付报酬。这些人驱动了现代的人工智能系统、网站和应用程序,我们所有人都是受益者,并且认为一切理所当然。

  想象一个二十出头的女人,站在芝加哥的路边——我们姑且叫她埃米莉。埃米莉在智能手机上打开优步(Uber)应用程序,一位优步司机接了单。埃米莉和司机都不知道,他们的相遇依赖于两个大洋之外的另一个女人,也许她叫艾莎。8

  埃米莉和司机都不知道,刚刚优步软件标记了司机的账户。假设司机的名字是山姆,他昨天晚上为给女朋友过生日刮掉了胡子。现在,他早晨上车时登记的这张自拍与他登记的身份证照片不符——这是2016年优步推出的“实时ID检查”(Real-Time ID Check)的一部分,用来验证司机的身份。两张照片存在差异,一张有胡子,另一张没有——山姆没料到,这会导致他的账户被冻结。突然之间,在他本人不知道的情况下,这单生意可能要黄了。

  与此同时,在海外被誉为“印度硅谷”的海得拉巴,艾莎坐在餐桌旁,眯着眼睛盯着笔记本电脑。她刚刚接受了一份工作,从优步转到了CrowdFlower,在埃米莉的这趟旅程中,艾莎扮演了无形但不可或缺的角色。CloudFactory、Playment、Clickworker是CrowdFlower的竞争对手,它们都有时髦的技术名称。这些平台把软件作为一种服务,提供给任何想要快速获得工人的雇主。每天都有成千上万像艾莎一样的工人登入CrowdFlower这样的众包平台,寻找任务型工作。现在,艾莎或者任何恰好响应CrowdFlower请求的隐形工人,将决定山姆能否去接埃米莉。

  优步和CrowdFlower是不断成长的服务供应链中的两个环节,这些服务利用API和人类计算把人们投入工作。优步通过CrowdFlower的API付费给某个人,让其查看艾莎的工作结果。如果通过审核,系统将在几分钟内处理优步的付费请求。如果没有达到预先设定的标准,艾莎就得不到任何报酬,也没有机会投诉。这种API在设计之初就不想倾听艾莎的想法。

  艾莎把司机的两张照片并排放在一起比较。CrowdFlower网页右上角的一个计时器开始倒计时,提醒她加快速度。如果计时结束前她没有提交判定结果,CrowdFlower就不会处理优步的付费。艾莎眨眨眼,看了看计时器,又眯起眼睛看了看只有拇指指甲大小的照片:是的,眼睛都是棕色的。酒窝是一样的。她点击“同意”。

  山姆把车停在路边时,他的账户得到授权,可以去接埃米莉了。埃米莉一直在拥挤的芝加哥街头张望,直到山姆停下车,她钻进车里。车门关上的时候,艾莎已经进入下一个任务。她希望在下班前多挣几个卢比。

  优步的乘客和司机都没有注意到,有人在实时审查他们的交易,这个人可能远在天边,也可能就在路的尽头。在美国,每100个优步订单中就有一个这样无法察觉的交流,这意味着每天要发生大约1.3万次。我们永远看不见艾莎为CrowdFlower做的幽灵工作,但花时间研究她和像她那样的工人之后,我们可以想象,埃米莉这样的用户和山姆这样的司机永远不会看到这种短暂的市场交流。艾莎是幽灵工作存在的唯一证据,因此,当埃米莉和山姆远去之后,她是唯一能帮助我们还原幽灵工作体验的人。

  数十亿人每天都在查看网站内容,使用搜索引擎,发布推文和帖子,享受移动应用程序的服务。他们认为自己获得的服务仅仅是依靠技术的魔力。但实际上,有一名国际工人在背后默默劳动,他们主要是自由职业者和临时工,而不是全职的或按小时计酬的工人,其法律地位不被认可。有时,这些工作被拔高成“第二次机器时代”或“第四次工业革命”的先驱,或者被认为是更庞大的数字经济或平台经济的一部分。而其他时候,我们不假思索地称之为“零工”(gigs)。9

  没有一部劳工法可以完全适用于按需零工经济,它是一种奇特的组合,独立于任何一位雇主,却又依赖在线平台。按需平台是零工经济的监工,它的盈利模式是,在线上把购买人力和提供人力的双方匹配起来,形成一个由大量企业和匿名工人构成的双边市场。重要的是,正如传媒学者、社会学家塔尔顿·吉莱斯皮(Tarleton Gillespie)指出,平台本身可能不生产内容,“但它对内容做出的筛选至关重要”。10按需工作平台很容易成为隐名合伙人,它更可能向付费的一方倾斜,而不是找工作的人。

  从头部公司到最小的创业公司,每一个企业都依赖这个由按需平台累积起来的共享按需工人库。他们利用这些工人满足消费者的需求,消费者的期许越来越高,都希望在几秒钟内得到答复。企业不再寻找传统的临时工中介,而是求助于这样的工人库来紧急填补团队的缺口。企业还从中开发新的项目,从测试新软件的隐私设置,到检查意大利面的口味描述是否容易理解,不一而足。这些新的风险投资项目要么过于投机,要么缺乏深思熟虑,以至于企业不敢轻易雇用全职雇员,也不好确认招聘的成本,哪怕找临时工也有风险。如果没有衡量消费者的反应,企业便不想贸然推出新服务或新产品。顾客的口味越来越刁钻,期望值越来越高,在这种情况下,服务业可以先尝试由幽灵工作提出的创意,并反复让其他工人评价,从而代替普通消费者模拟市场反应。

  每周,宣告工作终结的耸人听闻的标题都会接连不断地出现。很快就有人警告我们,机器人将奋起反抗。人们普遍认为,自动化及其助手人工智能,将淘汰人类的工作。工厂里的机械臂可以移动车间的金属板材。软件机器人可以接收短信比萨订单。无人机可以送货上门。现在,这些智能系统与许多传统的求职网站相连,有人认为这预示着人类将很快在工作场所消失。据说,人工智能将不可避免地取得胜利,所有人都会被解雇,只留下最不可替代的工人。我们都需要提高技能。立刻!马上!

  在这场大合唱中,特斯拉和SpaceX的创始人埃隆·马斯克(Elon Musk)、著名物理学家史蒂芬·霍金(Stephen Hawking)以及谷歌的联合创始人拉里·佩奇(Larry Page)只是几个代表性的声音。11他们要么对人工智能“召唤恶魔”表示恐慌,要么怀念没有人工智能的时代,当时人们自认为能主宰自己的命运。12但吸引眼球的标题掩盖了更加混乱的现实。不可否认,机器人是在崛起,但大多数自动化工作仍然需要人类昼夜不歇,其中许多人是兼职或合同工。但就像人类一样,机器也经常会有卡住或出现故障的时候,此时人类便可对自动化过程做出微调和维护。

  我们也必须承认,在实现自动化的漫长征途中,人们创造了新的需求,也培养了各式的人类劳动力来满足这些需求。从这一点来说,新的、软件管理的工作世界与在流水线上组装汽车的工厂工作有着相似的特征,工厂工作是在最需要工人的时间把工人安置在最需要他们的地方。这也类似于19世纪妇女和儿童在农场里做的所谓“计件工作”,每组装一个火柴盒可以挣几便士。这也很像把医疗文书转录和客服呼叫中心的工作外包给“全球南方”(3)的情形。20世纪90年代末,随着互联网的扩张,这种现象十分普遍。

  工厂工作、计件工作和外包都是在线分配任务的前身,因为它们涉及的都是琐碎而重复的工作,无关宏旨。这些工作收入微薄、朝不保夕,大多数情况下,都是由经济学家认为的可有可无或“低技能”的人完成。市场亲切地把这些人叫作“人力资本”。点击“狗”或“猫”给图片贴上标签,使它最终能被苹果手机识别为家庭宠物,与拧紧一颗螺丝钉,最终制造一辆福特卡车没有什么不同。但从这里开始工作相似性就终结了。

  蓝领制造业一直是人工智能发展最直接针对的目标。2016年,生产苹果手机的富士康工厂据称用机器人取代了6万名工人。根据报道,同一年,亚马逊在20个物流中心部署了4.5万台机器人,与23万名工人一起工作。然而,这些数字没有说清自动化催生了多少工作岗位。人工智能会对全职蓝领工作产生影响的媒体相关报道可能会分散我们的注意力,使我们忽视了一种正在快速增长的新工人。当人工智能触及自身天花板时,这类新兴的工人将完善或倾向于使制造系统完成自动化。

  过去20年里,最挣钱的企业已经从大规模生产家具、服装等耐用品,慢慢转型为提供医疗保健、消费者分析和零售等服务。把一种体验卖给消费者,比如喝一杯拿铁或浏览娱乐资讯,比制造一台电视赚的钱更多。13所有企业都在接入临时工人共享库,通过使用临时工来控制成本。在需要的时候获得想要的人,这种策略已经有半个世纪的历史,企业不再需要与全职雇员谈判,也不受制于保护全职雇员的职业分类和劳动法。

  这种人类与人工智能的混合,可谓制造业、零售业、市场销售和客户服务的一次重新洗牌,已经超越了我们熟悉的就业类别。传统的制造业由全职工人轮班工作,他们每周工作40个小时,干的活重复而连续;现在的任务型工作完全不同,比如修正客户的纳税申报表,或者实时翻译视频并添加字幕,这些都需要人类不断贡献智慧和判断力。这些任务是动态的,而不是机械的,所以很难把人类排除在外。

  人工智能并不像大多数人希望的或害怕的那样聪明。以驱动AlphaGo的人工智能为例,最近技术专家斯科特·哈特利(Scott Hartley)在《模糊性与技术专家》(The Fuzzy and the Techie)一书中记录了它取得的斐然成就。14围棋是中国古代的棋盘游戏,2017年5月,AlphaGo成为第一个击败中国围棋世界冠军柯洁的电脑程序。5个月后,AlphaGo迭代出AlphaGo Zero。但我们不必太震惊,因为有一点非常重要,即围棋的规则是死的,有固定的形式,在封闭的环境中进行,结果完全取决于两个玩家。在谷歌旗下的公司DeepMind,AlphaGo和AlphaGo Zero的人类程序员给出了输赢的明确定义。围棋的制胜之道是在对弈过程中预测落子的远期影响。15因此,通过人类围棋大师对弈的庞大数据库以及与自己对弈,AlphaGo接受了几十亿个棋局的训练,从而了解哪种棋路更好,哪个落子位置威力更大。16之后AlphaGo Zero与它的镜像AlphaGo对弈,把之前的经验又复习了一遍。但是正如人工智能研究领域的著名专家汤姆·迪克里奇(Tom Dietterich)所说,“人工智能对世界的渊博知识必须依靠人类补充”,如此才能完成大多数日常任务。现实生活可比围棋复杂得多。

  新的线上工作平台把工作机会介绍给琼、卡拉、贾斯汀和艾莎,这颠覆了媒体经常报道的人工智能拥有无限智慧、机器人势不可挡之类的传奇故事。现实世界的任务,从识别仇恨言论、把出租屋归类为春季婚礼的绝佳场地,到修正纳税申报表,都需要人类的见解和判断。生活不像围棋,不存在单一形式和最优解。例如,你很难列举“最好的”婚礼场地具备哪些特质。即使能列出来,也不会使人信服,因为人们对这些特质存在不同的偏好。此外,也不存在那种用来教会人工智能识别“最优解”的训练数据。而且,从方言俚语、气候变化引起的飓风,到随意的税法改革,一系列无穷无尽的外部因素会掺杂进来,影响结果。在许多情况下,未知因素太多了,以至于无法训练当前的人工智能,使它具备足够的意识或者获得足够的经验,也无法对所有意外情况做出明智的反应。这就是为什么人工智能还必须得指望人类,利用人类对世界的渊博知识来弥补决策的盲区。

  任何人只要像我们一样仔细地观察,走到人工智能的背后,就会发现一个新的工作世界,在这个世界里,软件管理着人类,而人类则在完成计算机做不到的工作。这个世界的系统把任务从人转移到机器,他们通过自动化来解决新的问题。例如,网络成为主流之后,Facebook、Twitter和Instagram等公司需要在线审核的内容越来越多,仅仅靠自动化工具无法实现。与此同时,新系统上线时,通常会面临突发问题,无法达到预期效果,因此需要卡拉和琼的工作。多亏了这样的工人,自动化审核软件变得越来越好,但还远远不够完美。在达到完美的过程中,自动化不可避免地会出现小故障,这就需要临时工来解决。一旦工人成功地训练了人工智能,使它像人类一样工作,他们就会转向工程师指派的下一个任务,这些任务将不断推进自动化的边界。人们畅想人工智能的新应用,自动化的终点线也在改变,所以我们无法确定通往完全自动化的“最后一英里”是否会走完。我们称之为“自动化的最后一英里悖论”。

  随着人工智能的发展,那些无法预见和无法预测的任务也创造了临时劳工市场。17自动化的最大悖论在于,使人类免于劳动的愿望总是给人类带来新的任务。我们所说的“最后一英里”是计算机和人力之间的差距。毫无疑问,软件工程师将利用幽灵工作执行手中的任务,并把人工智能推向极限。而且很有可能,随着越来越多的企业设法为我们提供支持人工智能的“智能”数字助理,从而帮助我们管理行程和预定航班,那么当人工智能无法满足我们日益苛刻且不断增长的需求时,会需要越来越多的人力参与进来。事实上,在技术走向自动化的漫长历史中,很关键的一点是对临时劳动力的依赖。今天致力于通过算法和人工智能解决问题的工程师,是自动化最后一英里悖论的最新迭代。在这一前沿,临时工的高峰和低谷不断转换,这重新定义了人类和机器的关系。

  按需劳动平台的兴起表明,使用API来组织、指派和计划工作具有吸引力。正如本书中的例子所示,利用临时劳动力开发新技术的这种重新定位,推动了新近所谓的“人工智能革命”。当驱动手机应用程序或在线服务的人工智能不知道下一步该为客户做什么时,它需要人的帮助,而且越快越好。终端用户希望运行搜索引擎和社交媒体的软件能在几毫秒内作出响应。传统的雇佣方法在这里行不通。因此,人工智能的决策闭环中需要人的加入,这样才能理解,比如说,为什么与一场突发自然灾害相关的搜索词会暴增,此时,它需要立即获得人工的信息输入。这场灾害将成为历史,但从瞬间的大量人工输入中,软件将会掌握它需要的东西。正是嵌入API中随时待命的共享劳动力库提供了这些人工输入。软件工程师可以编写代码来自动雇人以解决眼前的问题,自动检查他们的工作,并支付报酬。与此类似,使用现代机器学习系统的科学家和研究员同样依赖清晰无误的训练数据。他们需要一种自动化的方法来帮助生成和清理这些数据,而且需要大量来自世界各地的人来完成这件事。按需劳动平台为当今的线上企业提供了此种人类劳动和人工智能的结合,创造了一个庞大且隐于无形的人力资源库来从事幽灵工作。按需提供服务和工作可能是未来工作趋势的一部分。如果在设计和管理过程中没有注意到它如何重构人们日常工作的体验和意义,那可能就会产生意想不到的、潜在的灾难性后果。

  雇佣工作的逐步分解可能是工作性质的一种深刻而根本的转变。在美国,传统的全职工作已经不再普遍。过去,员工可能几十年日复一日地待在同一间办公室里,成就一番事业,并期望得到稳定的薪酬、健康护理、病假和退休福利。现在,从童工保护法到工作场所安全指南,全球几个世纪以来的改革成就正在瓦解。事实上,根据美国劳工统计局(Bureau of Labor Statistics)的数据,目前只有52%的雇主提供工作场所福利。大萧条之后,美国人开始意识到,除了提供食品、保健或在实体店销售商品,最好的选择是在按需零工经济中找工作,这样的机会越来越多。由于劳动法中没有任何职业分类保护这种工作,而MTurk和CrowdFlower等平台的服务条款几乎与我们在更新软件时都会点击的对话框没有什么不同,这就相当于抹去了传统员工享受的保护。

  虽然皮尤研究中心的最乐观估计是,目前从事幽灵工作的人数约为2 000万,但没有确切的统计数字表明,有多少人像琼、卡拉、贾斯汀和艾莎那样,为了生计草率地做了一些基于合同的幽灵工作。美国劳工统计局增加了一项补充调查,内容是“临时就业与替代就业安排”,从美国人口普查局(Census Bureau)2017年5月的当前人口调查(CPS)中选择了6万个符合条件的家庭,这样的月度调查使劳工统计局了解了这个国家的就业和失业数据。十多年以来,这是第一次试图估计临时工作的增长。18据劳工统计局估计,10.1%的美国工人没有长期雇佣合同,无论是正式的还是非正式的。但这项调查只统计了那些把替代就业作为主业或独立工作的人。所以,如果一个人一边做着幽灵工作,一边朝九晚五接受另一位雇主的固定工资或时薪,那就很难被统计到。而在我们遇到的最活跃的工人中,这是一种非常普遍的趋势。

  作为对当前人口调查的补充,美国劳工统计局发布的《2017年临时就业与替代就业安排》为衡量幽灵工作的兴起设置了两个障碍。在一个多项选择调查里,对工人而言,很难真正理解“长期就业”是指什么。而且,有许多人都同时打多份工来支付房租,想知道什么是“主业”可能同样困难。美国政府责任署(Government Accountability Office)的人口调查与劳工统计局的数据存在分歧,这也可以反映人们对“长期”或“主业”等旧工作分类的困惑。就在两年前,美国政府责任署的报告称,至少有31%的美国职工表示,他们从事某种形式的替代工作,包括自由职业或独立的雇佣合同。19劳动经济学家劳伦斯·卡茨(Lawrence Katz)和艾伦·克鲁格(Alan Krueger)估计,通过个体经营者或那些由劳务中介派遣的临时工——所谓的劳动力转向雇佣临时工制——完成的替代合同工作从10%上升到16%,相当于美国经济过去十年的净就业增长。20关于幽灵工作的规模和增长的最准确理解可能来自独立智库,而不是政府数据。

  对按需零工市场最保守的估计来自经济政策研究所(Economic Policy Institute)。经济学家劳伦斯·米歇尔(Lawrence Mishel)和他的研究团队估计,在美国有工作的成年人里,参与按需零工经济的比例为0.5%至1%,或者125万至250万人。但他们之所以得出这样的数字,是通过一项针对优步司机的非常具体的研究,他们假设大部分零工工作都来自优步和其他在线约车应用。摩根大通研究所(JPMorgan Chase Institute)的一项研究发现,2015年至2016年间,美国成年人中,至少参与过一次线上平台经济工作的比例为4.3%,也就是1 073万人。21这一就业市场的特点就是临时工作人员频繁更替。没有被认可的专业头衔。没有晋升的阶梯。没有奖金。没有保障。任务都有一定的时限,一旦公司达成了特定目标,被雇用的工人就会转移到其他项目上。

  从软件工程、法律服务到商业媒体、保健,现在很多企业都转向按需劳动平台,他们把白领工作转变为承包项目。这种全数字化的信息服务和知识工作,把需要思考和处理数据的创造性专业知识,转化为由科技、法律、金融和娱乐等行业在线提供的消费性服务。由于这种突然而巨大的变化,大型企业里有全职雇员现场工作的日子将屈指可数。许多公司争相销售把计算机、智能设备与人工智能结合起来的信息服务。按需型知识工作是一种更庞大的“宏任务”(macro-tasks),Catalant(HourlyNerd的前身)、Popexpert和Upwork等公司利用API把这种工作交付给其他企业或个人。与传统朝九晚五的工作相比,自动化创造的就业前景无疑会更加支离破碎。一些劳动经济学家认为,“职场裂隙”的新现实,是20世纪八九十年代以来将长期就业转变为一系列短期合同的最终结果。22然而,这种新的、出乎意料的现实并没有阻止世界各地数以百万计的数字工人,他们夜以继日地坐在键盘前面,完成不计其数的幕后任务,这些幕后任务使应用程序看起来比实际更加智能。这意味着商业和就业的未来更有可能类似于今天的按需经济,而不是一部人类消失、机器人统治世界的反乌托邦电影。它将要求人类浏览软件界面的菜单,并学会在人工智能笼罩的阴影下工作。它将包含一个生态系统,由琼这样的独立承包人构成,他们会在印度农村、田纳西州诺克斯维尔和俄勒冈州波特兰的闲置卧室、咖啡馆和煤渣住宅中敲打着键盘——或者任何一个只要有网络连接、有电脑、有雄心壮志或经济需要的人在任何地方能上网就可以。如果很少有人关注这些幕后工人,那么他们很快就会变得日益疏远、地位低下、不稳定和孤立。

  我们采访到的所有工人都有一个意想不到的共同点:希望。他们希望利用按需工作来掌控自己的工作时间、工作伙伴以及承担的任务。他们希望和家人待在一起。他们希望避免长途通勤和恶劣的工作环境。他们希望能获得经验从而刷新自己的简历,或者为新的可能性打开一扇门。同样真实的是,许多人认为自己和家人没有其他选择。在他们的城镇里,全职就业通常意味着在大卖场里拿时薪,有固定的轮班,适应随时变化的工作日程表,不存在有意义的晋升机会。按需工作给了他们实际经验,包括安排会议、测试和调试网站、开发计算机知识技能、寻找销售线索以及管理全职雇员的人力资源档案。有哪个工人不希望有一天能完全掌控自己的工作日程和工作目的呢?

  《销声匿迹》基于一项为期五年的研究,我们俩——一位是人类学家,另一位是计算机科学家——招募了一个研究团队,调查这个蓬勃发展但基本上不为人所知的经济领域。23我们对来自美国和印度的工人做了200多次采访,并收集了成千上万份调查问卷;我们对按需工作平台做了几十个行为实验和社交网络分析,也对按需劳工市场的其他关键参与者进行了独特的研究,这些参与者包括把平台转变为生意的人以及在平台上雇用工人的人。本书就是这些研究的成果。《销声匿迹》揭示了这样一个世界:稳定的工作和薪水正在被一系列混乱的小项目和小额支付取代,而人类老板也正在被自动化流程取代。这些自动化流程的目的,就是监督分布广泛的由匿名独立合同工组成的劳工群体。《销声匿迹》讲述了一个日益兴起的更加复杂的未来,与人人熟知的机器人崛起的故事截然不同。这本书展示了幽灵工作平台如何培养我们对于技术奇妙前景的信念。

  作为一名人类学家,玛丽的兴趣是被一种恐怖的情景所激发的:在一个原子化的世界里,工人通过分类和注释几千张尖耳狗、无毛猫以及“阴茎图片”赚钱。玛丽问那些被雇用的工人,他们对接收工作的人有什么了解,工人的回答不是“我不知道”就是“我为什么要知道?!”。作为一名计算机科学家,西达尔特多年来一直在使用按需平台进行线上实验,但他对这些工人知之甚少,因为API将这些工人隐藏了起来。24那些主动把自己挂到平台上等待被雇用的人是谁?是什么驱使他们做许多人认为“单调乏味的工作”?他们如何从这种规则不清晰的就业形式中取得报酬?这种工作对他们而言意味着什么?有多少任务在按需平台上进行?产生任务型工作需求的商业模式是怎样的?这种以任务为基础的经济是如何运作的?

  2013年,当我们的研究团队开始提出这些问题时,参与到对话中来的只有经济学家、计算机科学家和商人。这三类人都对按需劳工市场进行了评估,指标是提高效率的能力以及使企业盈亏底线最大化的能力。而当我们谈到“人”的时候,仅仅指的是消费者。消费者的体验如何?工程师和计算机科学家为企业或为他们自己的实验构建API来推进人工智能,他们想要设计若干系统,这些系统能够消除他们认为会惹恼终端用户的昂贵和多余的操作。他们致力于构建更智能、更快捷的软件,能够自动把人与服务匹配起来,无论是乘车、用餐还是税务咨询,最终目标是使用每次迭代的数据来训练未来的软件,使其更加自动化。很少有人关注,对于那些争相从事任务型工作的人来说,这种提高生产力的方法意味着什么。他们的假设是,一旦人工智能做对了,就不需要那些生成训练数据和改进软件的工人。毕竟,企业开发的是软件,而不是临时工作。

  在接下来的五年里,我们做了一些在各自的研究领域没有做过的事情:了解幽灵工作的范围和按需工人的生活。我们的研究是同行里最全面的一个。《销声匿迹》是第一本阐明幽灵工作如何构建人工智能的书,也是第一本讲述从事幽灵工作工人生活的书,我们虽然看不见这些工人,但他们是互联网运行与自动化未来的核心。关于工人在这个新经济中的经历,本书提供了密切而细致的视角。我们关注的是生活在印度和美国的工人,这两个国家有最大的按需工人共享库,而且它们都与技术进步的漫长历史密不可分。我们的团队采访和观察了数百人,在他们的家里或其他临时工作场所观察他们所做的一切,从标记推文到转录医生的咨询意见,不一而足。我们调查了数千人,这帮助我们建立了一个基准,从而判断哪些做法是普遍的,哪些做法是特殊的。之后,我们进行了几十个行为实验并采用了“大数据”式的分析,两种分析方式各自都有几千名参与者,进而从采访数据中获得了更多的结果。在《销声匿迹》一书中,读者将看到我们在这两种分析方式之间切换,结合它们各自的优势,使我们更了解在按需经济中工作的这些人。

  我们研究了四种不同类型的幽灵工作平台:亚马逊的土耳其机器人(MTurk);微软内部的通用人类关联系统(UHRS);具有社会意识的初创企业LeadGenius;以及一个致力于为跨国受众和听力障碍者翻译并添加字幕的非营利网站。这四个平台提供了不同的产品和商业模式。把它们放在一起调查可以表明,我们的观察和结论在按需经济中普遍适用,而不是只针对某一类幽灵工作。MTurk是最早具有商业价值的幽灵工作平台之一,提供了如何将人类计算应用于商业解决方案的范例。UHRS代表每个大型技术公司维护的内部平台,以满足自身对幽灵工作的需求。LeadGenius和Amara说明了幽灵工作可以多么复杂和精致,以及在为幽灵工作创造更好的环境方面,企业可以发挥多大的作用。

  此外还有工人。在这些平台上工作的人,有些会把按需项目串联在一起,重新创建与全职就业相关的工作时间、工资标准和职业发展。我们见到一些受过大学教育的全职父母,他们为了不无聊而参与这些工作;我们也见到了出生在美国的大学生,他们为了攒钱办婚礼或支持弟弟妹妹的学位而每周工作50个小时。还有残疾人和退休职员,他们都在寻找其他就业途径或赚取额外收入来填补他们的社保支票。我们还见到一些工程师和企业家,他们创办、设计和搭建了幽灵工作平台。

  起初,我们想知道:这些人是谁?他们的工作与传统朝九晚五的工作有什么区别?在许多按需劳动平台上,像西达尔特这样的请求者看不到工人的个人信息——性别、位置、年龄和以前的工作经验都是未知的。而除了任务描述之外,工人也看不到请求者的信息。任务的范围可以非常广,并且每天都在变化。API可以用来让人给猫的照片添加标签,也可以进行研究实验,其他类似的API还可用来雇人送餐、派车、设计网站。在消费者和请求者看来,调用API和生成工作都是自动化的。但谁能从这种自动化的表象中受益呢?谁可能会受到伤害呢?

  研究结束的时候,我们明白了从事幽灵工作的人与我们的朋友、家人通过自由写作、研究、开发软件或兼职教学谋生没什么区别。但他们的工作往往是脆弱且没有安全感的。然而,按需平台的匿名性和远程访问特性也使那些在正式工作中被边缘化的人更容易获得收入。这些人之所以被边缘化,是因为他们住的地方更偏远,他们被视为残疾,或者他们属于被污名化的少数群体。

  我们越是密切关注按需工作的新生边界,就越会看到人们使用熟悉的策略来维持生计,并为自己和同伴创造有意义的就业机会。有时这些工人通过相互协作取得成功。他们分享能使任务变得更容易的策略,交换新任务上线的情报,在等待新任务的时候帮助彼此保持清醒。我们遇到了一些工人,他们在尝试失败后学会了前进。他们学会了抵制剥削性的商业模式、劳动法和漠视他们利益的API。我们注意到,企业不知道他们从工人网络中获得了多少利润。本书将API对人类工作草率的处理称为算法的残酷(algorithmic cruelty)——这样说毫不夸张,算法不能思考,更别提有共情能力了。按需工人比任何工程师、科技公司CEO、政策制定者或劳工维权人士都更了解按需工作的风险和潜力。他们每天都这样生活。而且,他们尽最大的努力改善现状,无论是经济上还是心理上。

  正如我们需要企业对生产食品、服装和电脑的劳工负责,数字内容的生产者也应该对消费者和工人负责。无论是编策新闻,还是处理那些喷子在我们最喜欢的社交媒体上刚刚发布的帖子,这背后都有人类的参与并使我们所有人获益,我们应当要求在宣传这些产品和服务时有更全面的真实性。

  除了呼吁提高透明度,《销声匿迹》还为希望拥有高效劳动力的科技企业家、正在建设未来劳工平台的工程师以及负责塑造这一新商业格局的政策制定者提供了经验教训。我们手机上的应用程序、我们浏览的网站,都由那些隐形的工人驱动,关于他们那些未曾讲述的故事,很多读者应该会感兴趣。这些读者看过一些关于“零工”或“MTurk工作”的报道,也很清楚“众包”和“微工作”,他们听说过很多关于机器人崛起的故事,现在想要深入了解的是,人工智能如何塑造工作世界,以及在它阴影之下的人们做着怎样的工作。我们提供了一个有层次的、细致入微的、最终充满希望的叙述。除此之外,我们还展示了单靠跨越全职自由职业者的鸿沟,就能大大地鼓励我们与那些肩负着解决“自动化的最后一英里悖论”的人分享互联网创造的财富。我们在美国和印度采访了许多工人,希望从他们身上学到的经验教训,将帮助数百万已经或即将从事这项工作的人。最重要的是,任何正在工作并且想知道未来前途的人,都应该读《销声匿迹》这本书。

  (1)X级代表限制级,即;G级适合所有年龄段。(除特殊说明外,本书页下注均为译者注。——编者)

  (2)在本书中,所有的货币单位都是美元。卢比是指按当前汇率计算的印度货币。——原注

  (3)全球南方(Global South)是一个新兴术语,一般指亚洲、非洲、拉丁美洲和加勒比地区的低收入或中等收入国家。这个词是“第三世界”的替代性说法。对应于本书第三章中所说的全球北方(Global North)。

  21世纪初,亚马逊公司处境艰难。它当时是一家年轻的创业公司,随着“电子商务”的兴起,亚马逊的图书市场迅速扩张。为了扩建线上书店,亚马逊以电子的方式直接从出版商和图书馆的目录中提取数据,获得了几百万个书名,其中大部分条目有错误。为了建立忠诚的客户群体,亚马逊急需找到数据中的重复记录、错别字以及新旧版本封面图片错配的问题,然后才能卖给愿意在网上购物的消费者,这些消费者还很谨慎。1起初,亚马逊雇临时工清理数据库。仿效附近的科技公司,亚马逊在美国和印度雇用临时工,在这两个国家,只需要支付较低的薪资,就可以通过中介雇用和管理当地英语流利的合同工。工人不仅会纠正书名、出版日期和商品描述,还要确保图书封面与列出的版本相符,他们还嵌入关键词,对应每个书名的一串编程代码。编程代码的作用是,当客户使用亚马逊搜索栏时,能够返回尽可能多的相关条目。2

  之后,为了成为最大的线上零售商,亚马逊还需要克服一项与此相关的挑战。亚马逊并没有数以百万计的商品库存,而是让中小型企业在网站上列出自己的存货清单,通过亚马逊网站销售,范围从电子产品、玩具到清洁用品、小众食品,应有尽有。3随着线上市场不断扩大,其他书商和图书以外的其他产品的提供商也不断涌入,于是亚马逊面临另外一项挑战,即确保每一种商品的描述与对应的图片相符。包括亚马逊在内,所有商家都需要少量常备的固定工人处理这些琐碎又单调乏味的任务——比如核查产品描述与图片,创建产品说明和关键词,从而帮助线上购物者浏览不断扩大的商品目录。亚马逊向供应商求助,让他们雇用合同工来满足劳动力需求。随着亚马逊公司不断发展,它也需要润色用户的书评,以免模糊的措辞和别扭的语法损害网站上评论的价值。不久,合同工也接受了这项工作。

  2005年,亚马逊推出了一个新网站,在这个网站上,拥有认证账户的人能够更方便地清理产品列表和用户通篇错别字的评论。亚马逊称之为“亚马逊土耳其机器人”(Amazon Mechanical Turk),不久用户就简称其为“MTurk”。MTurk是一个在线劳工市场,“请求者”(requester)发布任务,工人通过完成任务获得报酬。平台会列出任务和薪资,就像在克雷格列表网站(1)上发布招聘信息一样简单。MTurk平台也像银行一样运转,请求者可以在支付账户中预存足量资金并保留一个记账标签,只要工人提交手中的项目,系统就会自动支付报酬。

  在每个任务中,亚马逊会向请求者收取一定比例的费用;如果请求者对工人有特殊要求,也要额外收费。任何人只要愿意与亚马逊分享银行账户、信用卡信息以及可验证的邮箱地址,就可以在MTurk上签约工作,获得积分换取亚马逊的礼品卡。任务的报酬不等,少到1美分为特定的图片添加关键词,多到25美元做一次市场调查。据说杰夫·贝佐斯(Jeff Bezos)非常喜欢MTurk这个项目。贝佐斯是亚马逊的创始人,据说是他创建了MTurk,这样一来,亚马逊不仅提供图书和其他耐用品,也使劳动力本身成为一种服务,任何人都可以在亚马逊的网站上搜索和购买这项服务。4

  最初两年,超过10万人在MTurk平台上注册找工作——这或许是一个信号,表明全球经济衰退开始加剧。工人登入MTurk找工作,任何企业与个人都可以把堆积如山的任务分发给他们,MTurk自动雇用这些工人并付款。除了亚马逊自身的产品团队,MTurk平台还承接其他业务。之后不久,它解决了直接存款的转账问题,对于在美国有通讯地址的人,它可以支付现金。而对于在印度的工人,MTurk通过新加坡银行把美元兑换成印度卢比,从而减少使用纸质支票。当MTurk开始用现金替代礼品卡支付工资时,在平台上工作的人就分成了两个阵营,一边是大量的美国和印度工人,他们积极竞争平台上的工作,另一边是来自其他国家只是随意接活儿赚取礼品卡的人。5

  MTurk填补了一个需求很大且有利可图的市场。企业和个人在网上发布越来越多的产品,他们需要一种方法检查发布物料信息的准确性。那些在工作中负责把发票信息录入到费用报表以便报销的人,现在越来越多求助于MTurk这样的平台,在这里他们能很快找人完成任务,任意一天、任意时间都行。当时的初创企业,比如Yelp(2)以及那些受雇为其撰写、整合数据库内容的承包商,能够提供附近餐厅的精确位置信息,数量和细致程度都是之前无法比拟的。营销机构与公关公司可以分发简短的调查,获得关于新产品创意、广告语和词语联想的几百种反馈。相比于全职雇员或临时工,这种雇佣方法的时薪要少得多。学者可以调查更广泛的人群,他们花大约一小时给1 000人发送民意调查,效果相当于在一门本科基础课程上分发相同数量的问卷。

  更妙的是,相比于美国大学校园里18—22岁的学生,MTurk上的调查对象可能覆盖更广的地域和年龄。在美国,像克雷格列表这样受欢迎的线上分类广告网站也会发布人们能在线做的工作,但MTurk代表了完全不同的东西。MTurk平台提供的合约工作很少有限制条件,也不要求掌握高级的计算机技能。工人只需要有时间,注重细节,并且能连接互联网。无论是营销、调查、生成训练数据、及时检查网上内容,相比于办公室的雇员,MTurk这样的按需劳工市场能够更快得到结果,也更加便宜。不久,无数新业务诞生了,通过把简单的计算机程序、网站界面以及不受监管的雇佣政策结合起来,催生出一种强大的新方法,自动雇用人类完成幽灵工作。

  数百万人执行数十亿项任务,而技术的使用者浑然不觉,幽灵工作通过这种方式推动了人工智能的革命。其他企业很快想出了如何利用幽灵工作完成更大的项目,我们称之为“宏任务”。无论是哪种情况,幽灵工作都驱动了许多流行的网站和手机应用程序,方法是使用应用程序接口(API)雇用工人,并把他们隐藏在API背后。

  MTurk上注册的工人越来越多,只要能够访问它的应用程序接口,就可以与它连通。无论是亚马逊公司还是其他公司的程序员,现在都可以编写软件在MTurk平台上发布任务,从而更方便地招募工人、评估工作、收集项目、发放报酬——程序员只需要事先写好机器执行的代码,所有这一切都在几秒钟内完成。

  以前,程序员编写的代码只能由机器执行。MTurk的创新之处在于,人类能够执行部分代码,而不是完全由机器执行。6它可以分批处理一系列任务,然后通过API交给人类完成——这种简单的技术是MTurk的伟大突破,使其转变成一个“买卖”人类劳动力的劳工市场。人类具有创造力,计算机能够反复执行相同或相似的任务,现在,一种软件可以同时整合这两种能力。程序员的软件和MTurk的API管理按需分配的临时劳动力,它们高效地扮演这个角色。在这个过程中,API和基于网络的平台接口,复制了MTurk的商业模式,似乎消除了我们原本对老板的许多期望——反馈、日程安排、工作环境、薪酬以及对我们做了恰当的工作并完成了任务给予肯定。通过这种方式,MTurk解构了“雇主”的角色,把寻求即时帮助的程序员和企业变成“请求者”。

  这种新工作方式最重要的意义在于,API决定了程序员和工人之间的对话和交流。例如,API赋予每个请求者和工人独一无二的身份标识(ID),这是一串看似随机的字母和数字,比如“A16HE9ETNPNONN”。在程序员看来,由于每一个工人都对应一个ID,所以人是可以替换的。任何使人成为人的东西,比如信仰、禀赋和经历,都从这个ID中被剥离。

  计算机科学家会说,你的所有属性都不予考虑。这就好比雇主只知道你的社会保险号码,而对其他信息一无所知。问题的源头在于API,它似乎表明,没有必要弄清楚这些人是谁。就像扑克筹码让赌徒忘记他赌的是真金白银,把人表示成唯一识别符会使程序员忘记自己雇用的是活生生的人,也会忘记他的代码将影响人们的生活。亚马逊有些冷淡地提到了19世纪的“土耳其机器人”,这是下国际象棋的机器人,不过它并没有看上去那么神秘。7自1770年诞生以来,它风靡了80多年。亚马逊的本意是表明自己的服务与这种神秘的室内游戏有相似之处。具有讽刺意味的是,土耳其机器人被证明是一场骗局,它不过是一些身材矮小的藏在机器木箱子里的象棋大师。是决策环路中的人类在幕后操纵机器人落子,而不是机器本身。而且,正如它的名字所暗示的,人类的智慧决定了机器学习的极限。API是教育机器以提升人工智能的完美监工。

  计算机科学家凯文·墨菲(Kevin P. Murphy)这样定义机器学习:“自动监测数据中的模式,并利用已发现的模式预测未来数据的一系列方法。”8

  回想一下机器学习的问题,在引言中,我们讨论过识别驼背沙发。一种常见的机器学习方法是,首先收集所谓的“训练数据”,在这个例子中,通过收集沙发的图片,比如来自家具目录和社交媒体的帖子,让贾斯汀这样的人给它们贴上“是驼背沙发”或“不是驼背沙发”的标签。然后,机器学习算法把一张新的沙发图片与训练数据中的图片进行比较。如果它看起来更像驼背沙发,算法就会把新图片归类到驼背沙发。但如果新图片光线不好,或者图片角度有问题看不清靠背,或者有人坐在沙发上挡住了靠背,机器学习算法可能就不知道如何归类。在这种情况下,大概需要更多人类帮忙。

  人工智能的总体目标是建立具有智能的计算机系统,这种智能指的是具有可以与人类媲美的评价和行动能力。实现通用人工智能是一场野心勃勃的革命,而理解图片中的物体是其中的一部分。毕竟,即使一两岁的小孩也能够认出照片里是苹果还是狗。计算机科学教授李飞飞是斯坦福大学以人为本人工智能研究所(Human-Centered AI Institute)的联合主任,她和同事想要解决一个更普遍的问题,而不是训练人工智能识别特定的物体,比如沙发。他们想训练机器识别图片中的主要物体,无论这个物体是什么——狗、人、车,还是山。要做到这一点,他们需要的训练数据远远不是一个人能产生的。要多得多。

  李飞飞和她的同事首先编写了一个软件,以便从万维网上下载数百万张图片。最开始,他们雇了一个大学生团队给每张图片贴标签——在理论上,这相当于雇用临时工。尝试了之后,他们推算出完成这项工作需要的时间——大约是19年。所以他们改变了策略。接下来,他们尝试开发机器学习算法,凭猜测自动给图片贴标签;如果机器不知道贴什么标签,就求助于人类。这种方法也失败了,因为机器学习算法犯的错误太多了。他们正在寻找非常精确的数据,或者叫“黄金标准”数据,以便日后其他科学家能够反复使用。事实上,如果这个问题很容易就能由机器来解决,那么他们一开始就不需要数据集。

  不久,2007年,李飞飞和她的同事发现了MTurk,他们意识到,MTurk的API为他们提供了一种方法,可以自动向人们分发图片标记任务,并向他们支付费用。他们尝试了几种不同的工作流程,但最终他们共使用了来自167个国家的约4.5万名工人,准确地为320万张图片贴了标签。9两年半后,他们的集体劳动创造了一个庞大的符合黄金标准的数据集,其中的图片分辨率很高,物体的标签也非常准确。李飞飞称之为“ImageNet”。由于ImageNet自创建以来每年都会举办比赛,研究团队使用这些数据开发更复杂的图像识别系统,并提高技术水平。有了黄金标准的数据集,研究人员可以测量新算法的精度,并与当前算法的技术水平做比较。研究人员因此取得了非常大的进步,以至于现在有些人工智能在图像识别方面比人类做得更好!10

  在2010年至2017年的竞赛中,科学家在算法和工程方面取得的进步,推动了近期的“人工智能革命”,对多个领域和多种问题产生了影响。训练数据的规模和质量对这一努力至关重要。MTurk工人是人工智能革命的幕后英雄。如果没有他们生成训练数据,并提高训练数据的规模和质量,ImageNet就不会存在。11ImageNet的成功是一个值得注意的例子,说明了自动化的最后一英里悖论是如何发挥作用的。人类训练了人工智能,结果人工智能完全接管了任务。之后研究人员可能会提出更困难的问题。例如,在ImageNet挑战完成之后,研究人员把注意力转向寻找图片和视频中物体的位置。这些问题还需要更多的训练数据,从而产生了另一波幽灵工作。但是,程序员和企业家利用幽灵工作创建训练数据从而开发更好的人工智能有很多实例,ImageNet只是其中一个。12

  产生按需幽灵工作的平台把自己当成看门人,帮助“雇主”转变为“请求者”,从而处理需要一点点人类智慧的问题。企业仍然可以进入全球劳工市场,但不需要依赖临时工中介。MTurk以“微任务”闻名,就像李飞飞的团队所做的那样,这些任务可以很快完成,但需要很多人。近年来出现了许多企业,它们把工人和更大的“宏任务”匹配起来。你可以在Upwork和Fiverr等平台找人编审新闻通讯,开发网页,或者创建移动应用程序,使用的雇佣策略是相同的:把任务分发给一批联网的工人,由人工智能或API负责雇佣、安排、管理和付费——至少部分由它们负责。所有付费任务都是一种基于平台的幽灵工作。而且,到今天为止,还没有对应的法律保护。也就是说,在幽灵工作中,没有法律规定谁是“雇主”,谁是“雇员”。工人在平台上找工作,但目前为止,还不清楚这些平台在哪里。然而很明显,这些平台已经成为按需工人的实际工作地点。除非遇到API背后的人,否则很难看清楚这种工作是什么样子。

  我们在引言里介绍过琼。她把头发绾成松散的发髻,用黑得发亮的筷子固定住,这样工作的时候头发就不会遮住眼睛。自从2011年搬回休斯敦照顾81岁的母亲,琼一直都生活在这里。她做饭,处理家务,开车送母亲去看医生。过去的三年里,她的大部分收入都来自亚马逊土耳其机器人。

  在搬回家乡之前,琼有一份全职工作,是文档工程师。她有许多成就,包括起草并编辑了得克萨斯州申请失业保险的手册。最开始,琼从401(k)计划(3)中取钱,靠这些钱生活。但是,随着母亲的健康状况恶化,琼开始找能在家办公的工作。按需工作看起来很合适。琼把一间闲置的卧室改造成家庭办公室,里面放着饱经风霜的棕色椅子、电脑桌和大显示屏,狭小的空间显得很逼仄。然后她开始上网搜索可以线上完成的工作。

  琼不记得她最早是如何发现MTurk的,但她怀疑是通过Reddit论坛。按需工人会在一些线上社区分享如何起步的技巧,Reddit就是其中之一。作为一名拥有传播学硕士学位的39岁白人女性,在某些方面,琼是一名典型的MTurk工人。接近70%的MTurk工人拥有学士学位甚至更高的学历。在其他方面,琼很不一样。MTurk工人趋于低龄化:76.9%的人在18岁到37岁之间,这个年龄段的人一般在最积极地寻找第一份工作,这份工作将决定整个职业生涯。

  虽然琼不记得所有的细节,但从她第一次登入以来,创建工人账户的流程就没有改变过。她连接互联网,浏览MTurk的主页,然后点击注册按钮。作为一名新人,系统要求她输入一个可验证的姓名和电子邮箱,并设置密码。从那时起,她就可以进入网站的后台。琼的“数据面板”上显示着几十个任务。任务,或者亚马逊所说的HITs(Human Intelligence Tasks,人类智慧任务),都是等待雇佣的工作。她点击一个任务,会看到一条简短的描述,说明任务要求、截止日期和报酬。她可以点击并完成一项任务,但是作为新用户,她得等账户通过验证后才能得到报酬。在亚马逊向工人支付工资之前,系统会核实工人的实际通信地址、国籍和银行账户信息。对琼来说,成为按需工人太容易了。

  对于像琼这样的新工人,MTurk的数据面板看起来有些混乱。在上面我们能看到多个可扩展的菜单选项卡,包括一个记录个人账户的选项卡、跟踪单个任务的选项卡和列出工人“资格”(qualification)的选项卡。“资格”这个词与技能不是一回事。在MTurk的世界里,资格可以是工人的年龄、性别、位置之类的东西。在亚马逊上发布任务的人使用“资格”来限制什么样的工人能接受这个任务。例如,如果一家广告公司在寻找一类人,为一款旨在吸引40多岁女性的产品提供反馈,它可能会在这份工作中加入性别和年龄等“资格”。它甚至可以向亚马逊支付额外的费用,寻找那些具有“烟民”(30美分)或“2016年选民”(10美分)等资格的工人。琼记得,第一次看到MTurk数据面板的时候,她有些紧张过度,但并没有因此却步。她说:“我想,好吧,一开始可能没有回报,但如果我做一段时间,它可能会成为一份不错的副业。”

  没有人知道具体有多少人使用MTurk,但通常有2 500人左右同时活跃在平台上,要么在找任务,要么在做任务。13由于没有任何机构能追踪到这一信息,即使工会和劳工部也不能,所以很难确定宏观的数据。亚马逊坚称,注册MTurk的工人有50万。研究人员称,大约有10万到20万人在MTurk上注册工作。14帕诺斯·伊佩罗提斯(Panos Ipeirotis)是一位著名的研究员,他的工作是跟踪MTurk上工人数量的涨落。他估计任何时候都可以在MTurk平台上找到2 000至5 000名工人。这大约相当于1万至2.5万个全职劳动力。15如果我们把这一逻辑应用到每个按需平台上,那么可能有数百万个全职工人处在幽灵工作的阴影中。当然,这是假设人们愿意全职从事这项工作。然而,我们将清楚地看到,相当一部分工人之所以坚持做幽灵工作,恰恰是因为他不想做全职工作。

  我们在MTurk平台上发布了一个任务,想了解世界各地工人的分布情况。接受任务后,工人会看到一张必应(Bing)的世界地图,任务描述是这样的:“双击你所在的位置,然后提交任务——就这么简单。”在10周的时间里,全球8 763名工人报告了自己的工作地点。美国工人既有来自人口密集的地区,也有来自人口稀疏的地区,但印度工人集中在南部。这一点我们将在下一章讨论。16

  和我们遇到的大多数工人一样,琼每天的第一件事就是找任务。她做得最多的任务是文本分类。她可能要阅读一段文字,也许是来自新闻报道中的一两句话,然后为这段文字创建一个类别,或者从选项列表中选择“政治”或“体育”。我们第一次和琼交谈时,她正在做这样的工作。每分类一个资料,她就赚2美分。每周她都要分类成千上万段文字。

  琼花了6个月时间在MTurk上寻找立足之地。最后她意识到,要想获得可观的收入,诀窍在于迅速找到可以做的工作,并评价提供这份工作的请求者。她注意到,在MTurk上,每一秒钟都很重要;缓慢的网络连接,把时间耗费在找工作上,或者任何计划外的误工,都相当于减少收入。在MTurk的第一年,她赚了4 400美元。有些人可能认为这个数字微不足道,但她说:“当你以前的收入为零时,4 400美元是意义重大的数字。”两年后,她在MTurk上的收入几乎翻了两番,达到16 000美元。现在,琼是MTurk上前4%的工人,这些工人熟练、有经验,而且很幸运,每小时能挣7.25美元以上。17

  对于高收入的工人来说,高度警觉是必要的。那些赚钱最多的工人,会花几个小时检查自己的数据面板,一页一页地浏览工作信息。琼和其他许多人一样,正试图让MTurk成为主要的收入来源。为了减少搜索成本,她求助于免费的软件工具和工人线上论坛,不过这些搜索成本并不会得到工作报酬的补偿。18他们必须做好准备,一旦报酬优厚或快捷简单的任务出现在屏幕上,他们就要立刻点击,以免其他工人捷足先登。她说:“在这方面,我比从事以往任何的办公室工作都更加努力。”为了提高速度,琼调整了浏览器上显示的MTurk数据面板,每次显示25个任务或HITs;为了快速地浏览页面,她自己设置了键盘快捷键。

  琼专心工作的时候,她每小时可以完成1 100个任务,净赚22美元。她知道,人们可能会觉得这项工作让人头脑麻木,但她发现,各种各样的任务都能启发思考。她特别喜欢编辑类的工作,因为她有文档写作的工作背景,这充分发挥了她的优势。“我很擅长,而且做起来很轻松。”当工作变得单调或重复时,她会通过听电子音乐或看电视保持清醒。我们和她交谈的时候,她正在看《巅峰拍档》(Top Gear),这是一档面向汽车爱好者的节目,有好几季。“人们谈论‘网飞和放松’(4),”她说,“但我看网飞和MTurk。”

  MTurk把工作的最低报酬设定为每项任务1美分,在这个基础上,请求者可以决定每项任务给工人支付多少报酬。平均而言,请求者的定价相当于每小时11美元。但市场上大多是抠门的请求者提供的最低报酬的任务,这拉低了工人的整体收入潜力。他们必须艰难地翻完所有低价任务,才能找到体面的工作。琼说:“这是一场逐底竞争。”据估计,MTurk和CrowdFlower等类似网站上的请求者每年的总收入达1.2亿美元。19工人获得请求者支付的“报酬”,但亚马逊向请求者收取20%作为平台运营的费用。“报酬”就是工人的薪酬,包括所有奖金(相当于小费)。如果需要10个以上的工人,亚马逊还会对这些任务收取20%的额外费用。20

  与传统的雇主—雇员关系不同,MTurk工人大多是匿名的,而且大多是自治的,这意味着请求者不能指定由谁执行任务,也不能在工人接受任务后规定该如何完成。工人需要为自己在MTurk上的收入纳税。他们要以独立承包人的身份提交美国国税局的1099号税表,在自由职业者提供咨询的世界中,这张表格人尽皆知。请求者的权衡是,工作完成得很快,而且没有正式雇员的相关成本。工人的权衡是,他们只需要完成任务,之后不必坚持做同样的工作。工人可以根据生活需要来安排工作,而不必把自己的生活交给朝九晚五的工作并忍受长时间通勤或恶劣的环境。他们赚够了钱就可以停下来。但发薪日并不总是在完成任务当天。MTurk工人提交的工作要由一个人或一种算法审查,这种算法决定工作是令人满意的还是不合格的。如果工作不合格,工人就没有工资。在网站上,每个工人的通过率,即他们的任务合格的比例,相当于声誉。MTurk上的许多任务都要求工人的通过率超过95%,因此,即使一次不合格,也会限制工人未来参与工作的机会,从而严重影响他们赚钱的能力。

  像所有按需工人一样,琼必须经受住收入的波动。也许今天生意兴隆,但明天请求者就无影无踪了。注册MTurk之后不久,琼收到了“体验世界”(Taste of the World)发布的一系列报酬不菲的任务。“体验世界”是工人之间广为流传的一个匿名账户,隶属于热门旅游网站猫途鹰。“体验世界”在MTurk上发布了成千上万个任务,包括删除重复的酒店列表、验证网站链接、编写热门景点的描述、创建特定城市的最佳就餐地点列表以及清理拼写错误。一名经验丰富的工人从“体验世界”的任务中获得的报酬相当于平均每小时10美元,而且还有小费。琼说,“这项工作几乎每天都有……而且每次都要发布好几个小时”,意思是她不必抢在任务消失前去看。她可以离开电脑做晚饭,等她回来的时候,“体验世界”的任务还没有完成,因为工作量实在太大了。但是,就像工作机会突然来临一样,它也突然枯竭了。琼告诉我们,不到一年的时间里,“体验世界”突然在MTurk上发帖称:“我们已经有足够的人手。”琼直截了当地补充说:“就这样结束了。”

  当涉及为幽灵工作付费时,每个平台的操作方式都有所不同。在某些方面,亚马逊既像是一台自动取款机,又像是企业内部的商店。MTurk上的新工人最开始需要等待10天,之后才能提取做任务挣到的钱。在平台上提交被请求者认可的工作,10天后美国工人有一个选择:他们可以以亚马逊礼品卡的形式得到全部收入,也可以把薪水转入亚马逊支付账户。工人可以通过亚马逊的支付账户把收入转进个人银行账户,但必须向亚马逊支付手续费才能享受这项特权。除了印度公民,其他国际工人只能把他们的收入兑换成亚马逊礼品卡。

  印度公民是唯一能在MTurk上赚取现金的国际按需工人。原因是亚马逊的跨国控股模式只允许它在美国和印度的办公地点之间运营和转移资金。印度的MTurk工人可以选择亚马逊礼品卡,不过,如果是杂乱的非常规社区,亚马逊不能保证万无一失地送达。如果印度工人想把钱转到个人银行账户,他们必须先提供自己的出生日期和永久账户号码卡(PAN卡)的扫描件。PAN相当于美国的社会保险号。亚马逊需要一周或者更长的时间来验证PAN卡信息。完成后,印度工人还需要跨越一个障碍:他们必须把自己的银行账户信息发送给亚马逊进行验证。一旦验证成功,亚马逊就可以开具纸质支票,或者直接向印度MTurk工人账户中存款,但需要额外收费。

  对于琼来说,她一开始并不打算把MTurk变成一份全职工作。但计划赶不上变化。现在,她已经适应了独立工人的生活。她的长期目标是把几个收入来源结合在一起,实现财务稳定。在我们遇到的工人中,这是一个共同的主题。事实上,75%的MTurk工人报告说,他们至少有一种其他收入来源。以琼为例,除了在MTurk上的工作,她还自己纺羊毛,并在当地市场销售针织工艺品。她还在提高自己的文档写作技能,目标是在宏任务网站Upwork上建立一个更有竞争力的自由职业者形象。她想找一份远程办公的兼职,比如在线客服,但她不知道如何在照顾妈妈的同时做到这一点。而且,和MTurk上75%的工人一样,琼也在其他平台上做幽灵工作,包括微软的UHRS,但她也提到,这一年多来,她的主要收入来自MTurk。

  我们在引言中提到过卡拉。卡拉43岁时有了孩子,在此之前她是一名电气工程师。第二个孩子出生的时候,卡拉退出了职场。然而,在家待了几年后,她开始怀念工作中享受到的那种集体归属感和使命感。她提出要回去工作,哪怕跟着丈夫做兼职也好,但丈夫不相信她能兼顾家庭和工作。卡拉说:“他担心那样压力会很大。”但卡拉坚持要去工作。最后她和丈夫达成妥协:卡拉可以在家办公。现在,她在微软旗下的平台UHRS上工作。

  和一些大型科技公司一样,微软也模仿MTurk的机制,建立了自己内部的微任务幽灵工作平台。推动技术创新的公司需要大量工人做产品内测和代码检查。他们也依赖于按需工人通过清理大量专有数据储存中的训练数据,来改进服务的算法和人工智能。科技公司收集人们如何使用他们网站的信息并存档。这些数据包括热门搜索关键词、流行歌曲选择以及鼠标的光标移动轨迹,收集这些信息可以帮助推动产品开发。如果客户数据是新开发的石油,那么按需工人相当于在做操纵钻井塔的工作。

  MTurk与科技公司内部平台的最大区别在于,在招募和推销劳动力的同时,MTurk也在推销平台本身;而在大型技术公司的平台上,比如UHRS,第三方供应商管理系统(VMS)负责招募和供应幽灵劳动力。这就是说,供应商管理系统又创造了一层不透明,它就像是经纪人,在保密协议下寻找愿意签合同做幽灵工作的人。21例如,谷歌内部神秘的幽灵工作平台EWOQ就是靠供应商管理系统招人。通过Leapforce等外包公司,EWOQ雇人识别和重排新网页,从而微调广告与用户搜索之间的链接。22根据媒体报道以及我们对多个按需平台上的工人的采访调查,可知Twitter和Facebook都使用内部工具包,这些工具包的功能非常类似于MTurk,还会将供应商管理系统提供的工人接入到他们的平台,监测并审查平台上的内容。23卡拉在UHRS上为微软做类似的工作。

  在UHRS上做幽灵工作之前,卡拉在一家小公司工作,负责处理一家美国企业的后勤文件。她的公司位于班加罗尔电子城的中心社区,离挤满游客的乔邦公园不远,是一家业务流程外包(BPO)工场,处理来自美国的工作。24也许具有讽刺意味的是,该公司最大的合同是与美国一个历史最悠久、规模最大的劳工组织签订的。卡拉和另外三名妇女肩并肩坐在BPO工场狭小的只有四张办公桌的办公室里,做一些琐碎的任务,比如删除重复内容、纠正数据条目中的排印错误,以及更新劳工组织的联系人数据库。她喜欢在网上搜寻各种信息,比如查塔努加、霍博肯等城市的正确拼写和邮政编码。她喜欢追踪重要线索,输入正确的搜索词,并找到与手头任务相关的信息。

  三年前,卡拉就是这样进入微软的内部平台UHRS的。她首先在求职网站Glassdoor(5)上找到一个供应商管理系统的链接。“我点击那个链接。它似乎提供了一个很好的方法,让我可以继续利用网络搜索和其他计算机技能。”

  卡拉有资格在UHRS上轻松工作。每个供应商管理系统都有自己的流程,用来审核潜在的按需工人,主要涉及他们的语言能力(通常优先考虑英语写作水平)和网络检索技巧。例如,在UHRS上,系统会做一个简短的测试,判断应聘者的语言能力和检索技巧;如果通过了,几分钟之内,应聘者就会得到一个独立的账户。(就UHRS而言,工人账户和微软用于登录Xbox的游戏账户没有什么不同。)一旦该账户被激活,工人就可以完成平台上特定的培训,了解UHRS的复杂细节——相当于MTurk的数据面板,并且可以开始在UHRS上寻找被称为“HitApp”的项目。

  哪些HitApp是可以做的,取决于工人当前的IP地址,以及供应商管理系统中登记的国籍和语言。一旦UHRS的工人在HitApp中至少完成了一项工作(称为“判定项”),并且结果表明他们可以正确地完成这项任务,剩下的HitApp就会从市场区域转移到工人的“我的HitApp”区域,后者是一个主界面,工人可以看到他能领取的微任务。卡拉在卧室的角落里放了一张桌子,开始工作。

  只有微软的全职雇员以及与微软合作开发新产品的授权伙伴才能在UHRS上提交申请,招募按需工人。这意味着,微软超过12万名全职雇员可以随时成为环路中的请求者,在幽灵经济中委托按需工人帮助他们完成任务。

  正如琼在MTurk上那样,卡拉在UHRS上与她的同行也有相似之处和不同之处。UHRS上近80%的工人年龄在18岁到37岁之间,超过70%的工人是男性。但是,和卡拉一样,超过85%的工人拥有学士学位或者更高学位。

  跟MTurk的情况一样,没有明确的劳动法来管理谁可以在UHRS上注册并从事有偿工作。但是,任何像微软一样的跨国公司的幽灵工作都必然是全球性的事业。世界各地的工人都可以在UHRS上做微任务,这是因为微软迫切需要以70种语言向20多个国家和地区提供一系列产品和服务。

  如果你想想微软销售的产品种类,那么UHRS上工人可做的微任务类型有多少就可想而知了。工人会检查录音,评估录音的质量。他们还检查书面文本,确保其中没有夹杂成人内容。另一个热门任务是翻译。微软在语音识别和机器翻译方面的优势来自按需工人用精确的数据集训练算法。他们用一种语言录制一句简短的音频——通常是英语,然后翻译成他们的母语,输入到Excel文档中。

  UHRS上的另一种常见的工作是市场调查,这通常受到人口统计数据的限制,如年龄、性别和位置。此外还有名为“情绪分析”的任务。在情绪分析中,工人可能会看一系列单词、自拍、视频,或者听一些音频,然后用一个词描述他们对面前的单词、人物、动作或声音的情绪感受。之后研究人员也向算法展示相同的材料,这些人类的见解就成为训练数据。

  在家里,卡拉经常向她的儿子求助,帮助完成分类任务,尤其是那些需要掌握美国口语知识的任务。男孩们帮她对常见网站上的最佳搜索关键词进行分类和排序。(例如,如果有人要找一件昂贵的结婚礼物,他们会输入“精美的瓷器”还是“漂亮的餐具”呢?)卡拉的孩子也帮她识别“成人内容”,信息研究学者莎拉·罗伯茨(Sarah T. Roberts)把这种常见的工作称为“商业性内容审核”。25

  这种内容审核需要像卡拉这样的人在恰当的时刻参与进来,因为尽管单词看起来很简单,但根据读写单词的人不同,含义可能有许多种。人工智能可以学习并模仿人类的一些思考,比如卡拉和她儿子的思考,但它必须不断更新,以适应新的俚语或意想不到的词语组合。

  与供应商管理系统打交道的一个冲突点是,当有人提出问题或事情出差错。

脚注信息
Copyright 2017 黄金城新版app All Rights Reserved