肯尼亞“喂養(yǎng)”GPT-4
本文來自:時(shí)代周報(bào)APP,作者:劉沐軒,編輯:梁勵(lì),頭圖來自:視覺中國(guó)
積灰的吊扇慵懶地轉(zhuǎn)著,十幾個(gè)肯尼亞人盯著笨重的臺(tái)式電腦屏幕,不斷露出驚訝的神情。
考慮到這里是肯尼亞內(nèi)羅畢的基貝拉貧民窟,一個(gè)過半居民沒有工作,連自來水和干凈的廁所都難得一見的地方,可能有人會(huì)誤以為,他們一定是“村里剛通上網(wǎng)”,才會(huì)露出這種沒見過世面的反應(yīng)吧?
與想象的不同,實(shí)際上,他們?cè)跒槿蜃钕冗M(jìn)、最熱門的AI產(chǎn)品ChatGPT工作。這些人被稱作數(shù)據(jù)標(biāo)注師,正是他們保障了ChatGPT“健康成長(zhǎng)”,使其成為一個(gè)彬彬有禮、夸夸其談的聊天AI。
近半個(gè)月以來,隨著ChatGPT最新版本GPT-4的發(fā)布,全球科技公司紛紛跟進(jìn),例如英偉達(dá)宣布在芯片硬件和云服務(wù)領(lǐng)域上全面支持AI的開發(fā),百度發(fā)布文心一言,而AI也再次成為全球焦點(diǎn)。
但在光鮮亮麗的社會(huì)變革和投資熱潮背后,卻是一群時(shí)薪不到兩美元的肯尼亞人來教會(huì)AI,何為善惡。
而且這份工作,并不光鮮。
一、“精神污染”
互聯(lián)網(wǎng)上的言論總是充滿著“戾氣”,幾條惡毒的言論就可以影響一個(gè)人的心情。如果有這樣一份工作,要求員工每天高強(qiáng)度閱讀9個(gè)小時(shí)的惡意內(nèi)容,時(shí)薪多少能讓人接受?
為OpenAI閱讀和標(biāo)記這些內(nèi)容的肯尼亞人,實(shí)得工資約為每小時(shí)1.32美元至2美元(約合9~13.7元人民幣)。
這些肯尼亞數(shù)據(jù)標(biāo)注師的工作內(nèi)容類似于鑒黃師,但更重口。
為了教會(huì)ChatGPT什么內(nèi)容不該學(xué),數(shù)據(jù)標(biāo)注公司Sama從暗網(wǎng)上找來了各種由人性最黑暗面產(chǎn)生的文本和圖片,包括但不限于無碼的血腥酷刑、反人類的犯罪現(xiàn)場(chǎng)、兒童性虐待和仇恨言論。
一位負(fù)責(zé)為OpenAI閱讀和標(biāo)記惡意文本的肯尼亞數(shù)據(jù)標(biāo)注師表示,他在閱讀了一則跨物種獵奇性行為的圖片后,反復(fù)出現(xiàn)幻覺。“那是一種折磨,即便是在一周后,我還是偶爾會(huì)想起那張圖片,止不住地犯惡心。”
用中文互聯(lián)網(wǎng)的流行語來形容,就是“我的腦子不干凈了”,或“辣眼睛”。
一張圖片的影響已如此之大,但除了圖片之外,肯尼亞的數(shù)據(jù)標(biāo)注師們每天還需要閱讀150至250段文本,長(zhǎng)度從大約100個(gè)單詞到1000多個(gè)單詞不等。
這些讓人心理和生理上不適的內(nèi)容,不斷撕裂著數(shù)據(jù)標(biāo)注師的三觀,每個(gè)人都積攢了大量的精神壓力。最終,沒人能堅(jiān)持超過3個(gè)月。
因此,雇傭他們的Sama公司在2022年2月終止了為OpenAI提供服務(wù)的合同,比計(jì)劃提前了八個(gè)月。
Sama是一家總部位于美國(guó)舊金山的公司,長(zhǎng)期在肯尼亞、烏干達(dá)和印度雇用員工,為谷歌、Meta和微軟等硅谷公司提供類似的數(shù)據(jù)標(biāo)注業(yè)務(wù)。Sama將自己定位為一家“有道德的AI公司”,聲稱已幫助50000多人擺脫貧困。
自稱是改善社會(huì)生產(chǎn)方式的變革,但AI的源頭卻從這樣令人痛苦的工作開始。剝削貧困國(guó)家的廉價(jià)勞動(dòng)力去做最基礎(chǔ)的工作,是否會(huì)成為AI誕生的“原罪”?
二、離不開人的AI
即便是最先進(jìn)的AI,也仍然離不開人,哪怕這個(gè)人來自相對(duì)貧困落后的國(guó)家。因此,肯尼亞數(shù)據(jù)標(biāo)注師們的工作對(duì)OpenAI而言至關(guān)重要。
事實(shí)上,ChatGPT的前身GPT-3,就已經(jīng)具備了令人印象深刻的語言表達(dá)能力和邏輯認(rèn)知能力。但由于缺乏對(duì)于互聯(lián)網(wǎng)信息的篩選機(jī)制,GPT-3也會(huì)被充滿惡意的信息誘導(dǎo),輸出一些仇恨、暴力、歧視的內(nèi)容。
在全面推廣后,一旦發(fā)生類似“AI支持納粹”這樣的公關(guān)危機(jī),整個(gè)行業(yè)都有可能被偏見推上風(fēng)口浪尖,導(dǎo)致技術(shù)進(jìn)步停滯。
如今,大多數(shù)的互聯(lián)網(wǎng)平臺(tái)都有著運(yùn)用AI技術(shù)的信息審核機(jī)制,從最基礎(chǔ)的關(guān)鍵詞初篩,到高級(jí)的識(shí)圖和從語言邏輯中判斷惡意內(nèi)容,都離不開AI技術(shù)的身影。
想要構(gòu)建這樣能夠自我學(xué)習(xí)和進(jìn)化的信息審核機(jī)制,OpenAI借鑒了Facebook等社交媒體的做法。那便是先收集那些帶有血腥、暴力、仇恨言論和性虐待標(biāo)簽的素材,由遠(yuǎn)在肯尼亞的數(shù)據(jù)標(biāo)注師進(jìn)行人工評(píng)級(jí)打分,再教給ChatGPT。
經(jīng)歷多輪人工校對(duì)后,ChatGPT將建立自己的“善惡觀”,在產(chǎn)生惡意言論之前,就將其過濾掉。
現(xiàn)在呈現(xiàn)在世界面前的,這個(gè)禮貌、成熟,甚至表現(xiàn)出一定共情能力的GPT-4,可以說是AI見慣了人間百態(tài)之后的樣子。
OpenAI“誕下”了GPT-4,但雇了一批肯尼亞“保姆”,干著最臟最累的活來“養(yǎng)育”GPT-4。
“ChatGPT和其他語言模型AI令人印象深刻,但他們并不神奇。”人工智能倫理學(xué)家安德魯·斯特雷特表示,因?yàn)檫@些AI仍然依賴于大量人力和數(shù)據(jù),其中大部分是未經(jīng)授權(quán)和未經(jīng)同意使用的,連這個(gè)領(lǐng)域最明星的企業(yè)OpenAI也沒能解決這些嚴(yán)重的基礎(chǔ)性問題。
三、為什么是肯尼亞?
對(duì)于外界而言,崎嶇的山脈、茂密的森林和野生動(dòng)物豐富的大草原,構(gòu)成了他們眼中的肯尼亞。
然而在這片不到60萬平方公里的國(guó)土上,生活著5300萬肯尼亞人,其中不少人選擇了從事與計(jì)算機(jī)相關(guān)的數(shù)字工作。
據(jù)2021年肯尼亞媒體《肯尼亞華爾街》的一份報(bào)告,肯尼亞成年人口中有超過120萬數(shù)字工作者。相比于2019年的63.8萬人,這一數(shù)據(jù)有了顯著增長(zhǎng)。
他們從事線上營(yíng)銷、線上助理、學(xué)術(shù)寫作、軟件開發(fā)和數(shù)據(jù)科學(xué)等工作。
根據(jù)市場(chǎng)分析機(jī)構(gòu)埃森哲的預(yù)測(cè),到2025年,數(shù)字經(jīng)濟(jì)預(yù)計(jì)將占肯尼亞GDP的9.24%。但這一數(shù)字仍遠(yuǎn)低于世界銀行統(tǒng)計(jì)的全球平均水平15%。
盡管肯尼亞的互聯(lián)網(wǎng)普及率不高,貧富差距極大,但還是有一部分人率先享受到了線上工作的便利。
政府對(duì)數(shù)字經(jīng)濟(jì)的推動(dòng),極低的工資標(biāo)準(zhǔn),以及勞動(dòng)法執(zhí)行的紕漏,促使肯尼亞成為發(fā)達(dá)國(guó)家的數(shù)字外包“工廠”。
就拿數(shù)據(jù)標(biāo)注師的工資而言,雇傭美國(guó)人的平均月薪約為4374美元(約合3萬元人民幣),雇傭印度人的平均月薪要1.67萬盧比(約合1400元人民幣),而雇傭肯尼亞人僅需每月2萬肯尼亞先令(折合約1044元人民幣)。
美國(guó)《時(shí)代周刊》曾采訪多名承擔(dān)ChatGPT外包數(shù)據(jù)標(biāo)注師的肯尼亞Sama員工,他們都表示并沒有收到公司承諾的“全身心保障”福利,比如心理咨詢、冥想、護(hù)理和游戲等。
但對(duì)于工資,他們并未表達(dá)出明確的不滿,Sama承諾的每月21000~40000肯尼亞先令的工資水平,已經(jīng)遠(yuǎn)遠(yuǎn)高于當(dāng)?shù)刈畹驮滦綐?biāo)準(zhǔn)15000先令。為了生計(jì),他們也都不愿透露姓名。
遭受“精神污染”的數(shù)據(jù)標(biāo)記師終究還是少數(shù),大多數(shù)肯尼亞數(shù)據(jù)標(biāo)記師處理著相對(duì)正常的內(nèi)容。對(duì)于討生活的肯尼亞人而言,與其考慮自己是否“被剝削”,還不如接受這份高薪的外包工作。
這也促使科技巨頭們打著“幫助當(dāng)?shù)匕l(fā)展人工智能”的口號(hào),變本加厲地在這些國(guó)家攫取廉價(jià)勞動(dòng)力資源。
或許在他們看來,一個(gè)工業(yè)結(jié)構(gòu)不完整,政局不穩(wěn)定的貧困非洲國(guó)家,僅憑一群學(xué)歷都不高的員工幫助國(guó)際科技巨頭們做點(diǎn)外包工作,怎么可能實(shí)現(xiàn)所謂“人工智能領(lǐng)域的彎道超車”呢?
本文來自:時(shí)代周報(bào)APP,作者:劉沐軒,編輯:梁勵(lì)
本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表虎嗅立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系hezuo@huxiu.com
如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系tougao@huxiu.comEnd
想漲知識(shí) 關(guān)注虎嗅視頻號(hào)!
隨便看看:
- [業(yè)內(nèi)]“中國(guó)數(shù)谷”迸發(fā)“云”端新活力
- [業(yè)內(nèi)]“聚勢(shì)創(chuàng)新?質(zhì)惠未來” 第一屆信息系統(tǒng)工程監(jiān)理高質(zhì)量發(fā)展大會(huì)
- [數(shù)據(jù)]B站UP主發(fā)起停更潮,年輕人不想再為愛發(fā)電了
- [業(yè)內(nèi)]美國(guó)研制出適應(yīng)崎嶇路面的蜈蚣型機(jī)器人
- [業(yè)內(nèi)]零門檻復(fù)現(xiàn)ChatGPT:預(yù)訓(xùn)練模型數(shù)據(jù)集直接用,包含完整R
- [業(yè)內(nèi)]極氪推出ZEEKR OS 4.2系統(tǒng)升級(jí),為用戶帶來更多使用
- [業(yè)內(nèi)]我國(guó)馬鈴薯育種研究取得突破 有望縮短育種周期
- [業(yè)內(nèi)]中國(guó)科協(xié)、科技部聯(lián)合開展2023年“全國(guó)科技工作者日”活動(dòng)
- [數(shù)據(jù)]3種方法,查快遞,親測(cè)第3種是最準(zhǔn)確
- [業(yè)內(nèi)]蘇寧易購門店超1/4用戶選擇運(yùn)營(yíng)商分期補(bǔ)貼
相關(guān)推薦:
網(wǎng)友評(píng)論:
推薦使用友言、多說、暢言(需備案后使用)等社會(huì)化評(píng)論插件
- 零安裝割草時(shí)代,庫犸Mammotion發(fā)布三目視覺
- 2.5T+雙電機(jī) ,新一代帕里斯帝中國(guó)首秀演繹混動(dòng)
- 成本直降精度翻倍,先導(dǎo)智能狹縫模頭R2R涂布機(jī)引領(lǐng)
- 萬和空氣能閃耀2025熱泵行業(yè)年會(huì),斬獲四項(xiàng)大獎(jiǎng)榮
- 漢桑科技王斌:“智聲”驅(qū)動(dòng)未來 加速邁向全球高端音
- 探索 Web3.0:互聯(lián)網(wǎng)的未來新范式
- 力德動(dòng)力30kw微渦發(fā)電機(jī)成功完成高原考核
- 突破溫度與凈化邊界,美的空氣機(jī)打造舒適生活空間
- 原創(chuàng)科技守味二十四節(jié)氣!卡薩帝冰箱濟(jì)南啟動(dòng)非遺守護(hù)
- 最新盤點(diǎn)!中國(guó)超聲波焊接機(jī)TOP10,首位靈科,其
- 熱點(diǎn)搶先看|2024南方網(wǎng)通第二十五屆渠道商交流會(huì)
- 《大數(shù)據(jù)平臺(tái)云化改造實(shí)踐指南(2024)》發(fā)布,天
- 覺卿諦語智能科技在全國(guó)12355心理健康大會(huì)上展示
- 當(dāng)好“兩個(gè)稀土基地”建設(shè)主力軍,北方嘉軒永磁電機(jī)大
- 大模型助力工業(yè)智能化發(fā)展
- 工商業(yè)光伏發(fā)電施工指南-太陽庫光伏
- 科技賦能,避震嬰兒車或成為行業(yè)硬通貨
- 龍旗科技進(jìn)軍AI PC市場(chǎng),激發(fā)行業(yè)創(chuàng)新活力
- 科技賦能教育:核桃編程亮相“科創(chuàng)中國(guó)·北京創(chuàng)新薈”
- 英偉達(dá)搶占高位,市場(chǎng)急需尋求新機(jī)遇,這三支AI股值