隨著機(jī)器學(xué)習(xí)系統(tǒng)越來越多地運(yùn)用于許多重大決策中,如何對(duì)其公平性實(shí)現(xiàn)精細(xì)地控制已經(jīng)成了我們亟需解決的問題。為解決這一問題,目前已有一些研究人員通過引入公平機(jī)器學(xué)習(xí)模型來平衡準(zhǔn)確性和公平性,然而,一些包括公司、政府在內(nèi)的機(jī)構(gòu)態(tài)度不明朗甚至持與公平對(duì)立的立場(chǎng),所以他們往往不會(huì)選擇使用這些公平模型。在這樣的環(huán)境下,斯坦福 AI 實(shí)驗(yàn)室的研究人員通過引入了一種新的方法,即令關(guān)注公平的有關(guān)方通過對(duì)不公平性進(jìn)行具體限制來控制表示的公平性,從而對(duì)機(jī)器學(xué)習(xí)中的公平性實(shí)現(xiàn)可控性。斯坦福 AI 實(shí)驗(yàn)室發(fā)布文章介紹了這一成果,雷鋒網(wǎng) AI 科技評(píng)論編譯如下。
概述
機(jī)器學(xué)習(xí)系統(tǒng)越來越多地被應(yīng)用于高風(fēng)險(xiǎn)決策中,對(duì)信用評(píng)分、刑事判決等領(lǐng)域都帶來了影響。這就提出了一個(gè)亟待解決的問題:我們?nèi)绾未_保這些制度不因種族、性別、殘疾或其他少數(shù)群體身份而產(chǎn)生歧視性行為?為解決這一問題,一些研究人員通過引入公平機(jī)器學(xué)習(xí)模型來平衡準(zhǔn)確性和公平性;然而,一些包括公司、政府在內(nèi)的機(jī)構(gòu)態(tài)度不明朗甚至持與公平對(duì)立的立場(chǎng),所以他們往往不會(huì)選擇使用這些公平模型。
值得慶幸的是,目前已有研究人員提出了一些用以學(xué)習(xí)公平表示的方法。關(guān)注公平的有關(guān)方(如數(shù)據(jù)采集者、社區(qū)組織者或監(jiān)管機(jī)構(gòu)) 使用這些方法,可以將數(shù)據(jù)轉(zhuǎn)換為公平表示,然后僅呈現(xiàn)表示,進(jìn)一步提高公平性,從而使所有下游機(jī)器學(xué)習(xí)模型更難產(chǎn)生歧視性行為。
圖 1 學(xué)習(xí)和最終以控制良好的數(shù)據(jù)公平表示呈現(xiàn),能夠抑制下游機(jī)器學(xué)習(xí)產(chǎn)生歧視性行為
在這篇文章中,我們介紹了一種基于理論的機(jī)器學(xué)習(xí)公平表示方法,并且我們還發(fā)現(xiàn)一系列現(xiàn)有方法都屬于該方法的特例。此外,我們還注意到所有現(xiàn)有的機(jī)器學(xué)習(xí)公平表示方法,也可以用來平衡有用性和公平性,產(chǎn)生有用性和公平性兩者相平衡的表示。然后有關(guān)方必須多次運(yùn)行學(xué)習(xí)流程,直到找到他們滿意的表示結(jié)果。基于這種理論,我們引入了一種新的方法,即令有關(guān)方通過對(duì)不公平性進(jìn)行具體限制來控制表示的公平性。與早期的公平表示相比,這種方式可以讓機(jī)器更快地學(xué)到,同時(shí)滿足多個(gè)公平概念的要求,并涵蓋更多有用的信息。
公平表示的理論方法
我們首先假設(shè)得到一組通常用來表示人的數(shù)據(jù)點(diǎn)(x)以及他們的敏感屬性(u),這些屬性通常是指他們的種族、性別或其他少數(shù)群體身份。我們必須學(xué)習(xí)一個(gè)模型(q?)來將任一數(shù)據(jù)點(diǎn)映射到新的表示 (z) 上。我們的目標(biāo)是雙重的:該表示應(yīng)該是能夠表達(dá)出信息的,即包含數(shù)據(jù)點(diǎn)相關(guān)的大量有用信息;同時(shí)這一表示應(yīng)該是公平的,即包含有關(guān)敏感屬性的限制信息;這樣的做法可以抑制機(jī)器學(xué)習(xí)下游產(chǎn)生歧視性行為(為了簡(jiǎn)潔起見,我們聚焦人口均等,這是一種非常直觀和嚴(yán)格的公平概念,但我們的方法適用于許多公平概念,如后面的結(jié)果所示)。請(qǐng)注意,僅僅從數(shù)據(jù)中刪除敏感屬性(例如種族)并不能滿足這種公平概念,因?yàn)橄掠螜C(jī)器學(xué)習(xí)模型可能會(huì)基于相關(guān)特征(例如郵政編碼),這種做法稱為「劃紅線注銷(redlining)」。
首先,我們將我們的目標(biāo)轉(zhuǎn)化為互信息(mutual information)的信息理論概念。兩個(gè)變量之間的互信息被正式定義為變量的聯(lián)合概率與變量的邊緣概率乘積之間的 KL 散度(Kullback-Leibler Divergence)

;直觀而言,這是共享的信息總數(shù),我們的目標(biāo)具體如下:
- 為了實(shí)現(xiàn)表現(xiàn)力,我們希望最大化數(shù)據(jù)點(diǎn) x 和以敏感屬性 u 條件的表示 z 之間的互信息:max I(x;z∣u)。(通過限制敏感屬性,我們確保刺激數(shù)據(jù)點(diǎn)中與敏感屬性相關(guān)的信息出現(xiàn)在表示中。)
- 為了實(shí)現(xiàn)公平,我們希望限制表示 z 和敏感屬性 u 之間的互信息:I(z;u)<?,其中 ? 由有關(guān)方設(shè)置。
接下來,由于兩組互信息都很難得到優(yōu)化,我們需要尋找近似值:
- 我們用最大化下邊界−Lr≤I(x;z∣u)來取代最大化 I(x;z∣u)的方法,而最大化下邊界則依賴于我們引入的一個(gè)新模型 pθ(x∣z,u)。我們可以明顯發(fā)現(xiàn),最大化−Lr 會(huì)有利于映射出,表示 z 加上敏感屬性 u 得到的新模型可以成功地重建數(shù)據(jù)點(diǎn) x。
- 接著,我們通過約束上限 C1≥I(z;u)來代替對(duì) I(z;u)的約束。很顯然,對(duì) C1 的約束則可以阻止復(fù)雜表示。
- 或者我們也可以約束與 I(z;u)更相關(guān)的近似值——C2,它依賴于我們引入的一個(gè)新模型 pψ(u∣z)。而約束 C2 可以阻止新模型 pψ 使用表示 z 來重構(gòu)敏感屬性 u 的映射。
綜上所述,我們的最終目標(biāo)是找到模型 q?、 pθ, 和 pψ 來幫助成功實(shí)現(xiàn)對(duì)數(shù)據(jù)點(diǎn) x 的重建,同時(shí)限制表示 z 的復(fù)雜性,并限制敏感屬性 u 的重構(gòu):
圖 2 學(xué)習(xí)公平表示的「硬約束」目標(biāo)
其中 ?1 和 ?2 是有關(guān)方設(shè)定的限制。
這為我們提供了一個(gè)學(xué)習(xí)公平表示的原則性方法。我們還得到了一個(gè)巧妙的發(fā)現(xiàn):事實(shí)證明,現(xiàn)有的一系列學(xué)習(xí)公平表示的方法優(yōu)化了我們的雙重目標(biāo),得到一個(gè)「軟正則化」(soft-regularized)版本!
圖 3 學(xué)習(xí)公平表示的「軟正則化」損失函數(shù)

我們可以看到該框架泛化了一系列現(xiàn)有方法!
學(xué)習(xí)可控公平表示
現(xiàn)在讓我們仔細(xì)觀察「軟正則化」損失函數(shù),可以明顯發(fā)現(xiàn)現(xiàn)有的學(xué)習(xí)公平表示的方法會(huì)產(chǎn)生有用性和公平性兼具的表示,表現(xiàn)力和公平性之間的平衡由 λs 的選擇所控制。如果我們能優(yōu)化我們的「硬約束」目標(biāo),那么有關(guān)方就可以通過設(shè)置 ?,來對(duì)不公平性進(jìn)行具體限制。
所以,我們引入了:
圖 5 機(jī)器學(xué)習(xí)可控公平表示的損失函數(shù)
直觀而言該損失函數(shù)意味著,每當(dāng)我們考慮由于 C1>?1 或 C2>?2 導(dǎo)致的不公平時(shí),λs 將額外強(qiáng)調(diào)未滿足的約束;這種額外的強(qiáng)調(diào)將一直持續(xù)到 C1 和 C2 滿足有關(guān)方設(shè)定的限制為止。而當(dāng) C1 和 C2 在安全在限制范圍內(nèi)時(shí),將優(yōu)先考慮最小化 Lr ,進(jìn)而有利于產(chǎn)生富有表現(xiàn)力的表示。
結(jié)果
有了最后一塊拼圖,剩下的就是評(píng)估我們的理論是否能使其在實(shí)踐中學(xué)習(xí)可控的公平表現(xiàn)。為了進(jìn)行評(píng)估,我們學(xué)習(xí)了三個(gè)真實(shí)數(shù)據(jù)集的表示:
- UCI 德國(guó)信用數(shù)據(jù)集,包含 1,000 個(gè)人,其中二進(jìn)制敏感屬性滿足條件 age<50 / age>50 的應(yīng)受到保護(hù)。
- 來自美國(guó)人口普查的 40000 名成人的 UCI 成人數(shù)據(jù)集,其中二進(jìn)制敏感屬性 Man / Woman 應(yīng)受到保護(hù)。(性別不是二元的,在使用這些數(shù)據(jù)集時(shí)將性別視為二元是有問題的,也是這項(xiàng)工作的局限)
- 60,000 名患者的遺傳健康數(shù)據(jù)集,其中要保護(hù)的敏感屬性是年齡和性別的交集:年齡組 (9 個(gè)可能的年齡組) × 性別 (Man / Woman)
不出所料,我們的結(jié)果證實(shí)在所有三組學(xué)習(xí)公平表示中,有關(guān)方對(duì) ?1 和?2 的選擇,控制了不公平的近似值 C1 和 C2。
圖 6 三個(gè)真實(shí)數(shù)據(jù)集實(shí)驗(yàn)數(shù)據(jù),我們學(xué)到了滿足 C1 ≈ ?1 和 C2 ≈ ?2 的表示
結(jié)果還表明,與現(xiàn)有方法相比,我們的方法可以產(chǎn)生更具表現(xiàn)力的表示。
圖 7 我們的方法(深藍(lán)色),現(xiàn)有的方法(淺藍(lán)色)
并且,我們的方法能夠同時(shí)處理許多公平的概念。
圖 8: 當(dāng)學(xué)習(xí)滿足許多(在人口統(tǒng)計(jì)、幾率均等和機(jī)會(huì)均等上的)公平性約束的成人數(shù)據(jù)集表示時(shí),我們的方法學(xué)習(xí)的表示更具表現(xiàn)力,并且表現(xiàn)比除了一種公平標(biāo)準(zhǔn)外的所有標(biāo)準(zhǔn)都更好。
雖然最后兩個(gè)結(jié)果可能看起來令人驚訝,但它們得出這一結(jié)果的原因是,現(xiàn)有方法要求有關(guān)方多次運(yùn)行學(xué)習(xí)過程直到找到他們認(rèn)為大致滿意的表示為止,而我們的方法直接優(yōu)化了盡可能具有表現(xiàn)力的表示,同時(shí)也同等滿足了所有有關(guān)方對(duì)表示不公平的限制。
總結(jié)
為了補(bǔ)充公司和政府可以選擇使用的公平機(jī)器學(xué)習(xí)模型,這項(xiàng)工作朝著將公平機(jī)器學(xué)習(xí)的控制權(quán)交給關(guān)注公平的一方(如數(shù)據(jù)采集者、社區(qū)組織者或監(jiān)管機(jī)構(gòu)))邁出了一步。我們?yōu)閷W(xué)習(xí)公平表示提供了一種理論方法,使機(jī)器學(xué)習(xí)下游更難以產(chǎn)生歧視性行為,并且提供了一種新方法,使關(guān)注公平的一方能夠通過 ? 來對(duì)不公平性進(jìn)行特定限制從而控制表示的公平性。
研究者在進(jìn)行公平機(jī)器學(xué)習(xí)的研究工作時(shí),認(rèn)識(shí)到局限性和盲點(diǎn)尤為重要;否則就會(huì)冒著開發(fā)出難以實(shí)際應(yīng)用的解決方案的風(fēng)險(xiǎn),同時(shí)掩蓋其他人所同樣付出的努力。我們這項(xiàng)成果的一個(gè)主要限制是,關(guān)注公平的一方的 ? 限制了對(duì)不公平性的近似值,我們也希望未來的工作可以更進(jìn)一步,并能夠?qū)?ε 進(jìn)行映射從而正式保證機(jī)器學(xué)習(xí)下游的公平性。這項(xiàng)成果的另一個(gè)可能存在的限制是,像許多公平機(jī)器學(xué)習(xí)的研究領(lǐng)域一樣,中心人口均等、幾率和機(jī)會(huì)均等等公平概念所帶來的限制。我們認(rèn)為,未來的工作需要與社會(huì)公正所依據(jù)的平等概念建立更深層次的聯(lián)系,這樣才能避免狹隘的技術(shù)解決方案主義,并建立更公平的機(jī)器學(xué)習(xí)。
- 論文:Learning Controllable Fair Representations
- 論文作者:Jiaming Song*, Pratyusha Kalluri*, Aditya Grover, Shengjia Zhao, Stefano Ermon
- 論文下載地址:https://arxiv.org/abs/1812.04218
via http://ai.stanford.edu/blog/controllable-fairness/
來源 | 雷鋒網(wǎng)
作者 | 楊鯉萍