人妻精品久久久久中文字幕2018,久久免费少妇av高潮毛片,国产美女自卫慰视频福利下载,亚洲国产欧美日韩在线等,亚洲天堂在线观看视频,国产特黄精品免费大片,亚洲国产货青视觉盛宴

法治號(hào) 手機(jī)版| 站內(nèi)搜索

網(wǎng)上有害信息舉報(bào)

方濱興:破解隱私保護(hù)與數(shù)據(jù)要素流動(dòng)相悖之局

2022-08-23 12:54:27 來(lái)源:法治網(wǎng) 作者: -標(biāo)準(zhǔn)+

編者按:由中國(guó)行為法學(xué)會(huì)和中國(guó)通信學(xué)會(huì)主辦的第二屆中國(guó)網(wǎng)絡(luò)與數(shù)據(jù)安全法治50人論壇于8月18日在深圳前海成功舉辦,本屆論壇的主題為“構(gòu)建數(shù)據(jù)基礎(chǔ)制度強(qiáng)化數(shù)據(jù)安全治理”。中國(guó)工程院院士方濱興在本屆論壇上發(fā)表了題為“破解隱私保護(hù)與數(shù)據(jù)要素流動(dòng)相悖之局”的主旨演講,方濱興院士提出了數(shù)據(jù)不動(dòng)程序動(dòng)、數(shù)據(jù)可用不可見(jiàn)、分享價(jià)值不分享數(shù)據(jù)、數(shù)據(jù)使用權(quán)和所有權(quán)相分離的數(shù)據(jù)要素流動(dòng)的實(shí)現(xiàn)機(jī)理,引起參會(huì)嘉賓的關(guān)注。以下根據(jù)方院士的錄音整理,并經(jīng)本人審閱的主旨演講中主要內(nèi)容發(fā)表,以饗讀者。

現(xiàn)在的應(yīng)用系統(tǒng)都可以產(chǎn)生大數(shù)據(jù),這些大數(shù)據(jù)通過(guò)數(shù)據(jù)要素流動(dòng)就可以產(chǎn)生價(jià)值。與此同時(shí),這些數(shù)據(jù)還能夠反映出一些隱私信息。國(guó)家陸續(xù)出臺(tái)了一系列法律法規(guī),包括數(shù)據(jù)安全法、個(gè)人信息保護(hù)法,都反復(fù)提到要堅(jiān)持?jǐn)?shù)據(jù)分類(lèi)分級(jí)的安全保護(hù)制度,保護(hù)個(gè)人信息,堅(jiān)持保障數(shù)據(jù)安全與促進(jìn)數(shù)據(jù)安全開(kāi)放并重利用,以數(shù)據(jù)安全來(lái)保障數(shù)據(jù)開(kāi)發(fā)利用和產(chǎn)業(yè)發(fā)展。

一、平衡數(shù)據(jù)要素流動(dòng)與隱私保護(hù)的沖突

大數(shù)據(jù)的形成,使得我們面臨著兩種不同的目標(biāo)函數(shù):隱私保護(hù)和數(shù)據(jù)流動(dòng)。當(dāng)兩個(gè)相悖的目標(biāo)函數(shù)同時(shí)存在時(shí),想獲得兩者最優(yōu)解是比較困難的。要想隱私保護(hù)保護(hù)得很好,數(shù)據(jù)基本上就不能流動(dòng);如果數(shù)據(jù)要素流動(dòng)得很好,隱私保護(hù)就很難實(shí)現(xiàn),這意味著隱私保護(hù)與數(shù)據(jù)流動(dòng)難以兼得。如何在大數(shù)據(jù)場(chǎng)景下讓隱私保護(hù)與數(shù)據(jù)挖掘的矛盾得到解決,如何在保護(hù)數(shù)據(jù)隱私的前提下,最大限度地挖掘數(shù)據(jù)價(jià)值?這就帶來(lái)一個(gè)命題,是否能求得一個(gè)最優(yōu)解,既能夠讓隱私盡可能保護(hù)好,也能讓數(shù)據(jù)要素盡可能流動(dòng)起來(lái)。這是一個(gè)具有挑戰(zhàn)的命題。

二、隱私保護(hù)與數(shù)據(jù)流動(dòng)共存

我們要構(gòu)造一個(gè)最優(yōu)目標(biāo),這就是讓隱私保護(hù)與數(shù)據(jù)流動(dòng)共存。在數(shù)據(jù)安全領(lǐng)域,已經(jīng)提出各種各樣的研究方法來(lái)努力實(shí)現(xiàn)這一命題。我們可以在兩個(gè)維度討論:第一,從數(shù)據(jù)流動(dòng)的維度,要么是數(shù)據(jù)流出,要么是數(shù)據(jù)不流出。第二,從計(jì)算方法的維度,或者是集中計(jì)算,或者是協(xié)同計(jì)算。按照這種分類(lèi)法,隱私保護(hù)與數(shù)據(jù)流動(dòng)共存的方法可以有四種類(lèi)型。

首先,從數(shù)據(jù)流動(dòng)的角度,要確保數(shù)據(jù)可用不可見(jiàn)。有兩種方法:

1.從集中計(jì)算的角度,有隱私計(jì)算。中科院李鳳華教授在該領(lǐng)域做了很多工作。隱私計(jì)算就是強(qiáng)調(diào)通過(guò)隱私泄露代價(jià)和概率的計(jì)算模型來(lái)求得所能接受的計(jì)算方法與保護(hù)結(jié)果,讓隱私泄露最小,通過(guò)這種計(jì)算模型來(lái)獲取數(shù)據(jù)價(jià)值。K匿名、差分保護(hù)等都屬于隱私計(jì)算的具體方法。隱私計(jì)算可以讓數(shù)據(jù)在流通過(guò)程實(shí)現(xiàn)“可用不可見(jiàn)”。隱私計(jì)算也有局限性,如隱私計(jì)算有可能容易被攻擊,容易推測(cè)出隱私結(jié)果。但如果隱私計(jì)算的保護(hù)強(qiáng)度過(guò)強(qiáng),數(shù)據(jù)價(jià)值又會(huì)被淹沒(méi)。

2.安全多方計(jì)算。從協(xié)同計(jì)算的角度,安全多方計(jì)算是經(jīng)典理論,這也是姚期智院士長(zhǎng)期研究的。安全多方計(jì)算是允許多個(gè)數(shù)據(jù)所有者在互不信任的情況下進(jìn)行協(xié)同計(jì)算,并輸出計(jì)算結(jié)果。像混淆電路、不經(jīng)意傳輸、同態(tài)加密等都是安全多方計(jì)算的具體實(shí)現(xiàn)方法。安全多方計(jì)算的保護(hù)強(qiáng)度很大,但成本與代價(jià)都很大,所謂的多方,恐怕也就能多到4個(gè)。

其次,從數(shù)據(jù)不流出的角度,做到“數(shù)據(jù)不動(dòng)程序動(dòng)”。這也有兩種方法。

3.聯(lián)邦學(xué)習(xí)。楊強(qiáng)教授在這領(lǐng)域是一個(gè)典型代表。這主要是采用聯(lián)邦學(xué)習(xí)框架,將機(jī)器學(xué)習(xí)算法程序流動(dòng)到擁有數(shù)據(jù)的各方,然后再將訓(xùn)練參數(shù)回傳。僅就人工智能算法訓(xùn)練而言,有人也稱(chēng)之為“數(shù)據(jù)不動(dòng)模型動(dòng)”。當(dāng)然,這樣說(shuō)也只能討論機(jī)器學(xué)習(xí)本身了。其實(shí)這種方法還可以做更多事情,就是說(shuō)數(shù)據(jù)不動(dòng)程序動(dòng)的范圍應(yīng)該更寬泛一些。

4.模型加工場(chǎng)。從集中計(jì)算角度,我們提出一個(gè)模型加工場(chǎng)的方法,即通過(guò)構(gòu)建一個(gè)安全可控區(qū)域,通過(guò)數(shù)據(jù)不動(dòng)程序動(dòng),數(shù)據(jù)可用不可見(jiàn)來(lái)保證隱私。由于是基于靶場(chǎng)的思路來(lái)解決AI的問(wèn)題,所以我們也稱(chēng)之為AI靶場(chǎng)。其基本思想是要構(gòu)造一個(gè)可信的執(zhí)行環(huán)境。這個(gè)可信的執(zhí)行環(huán)境不完全等同于傳統(tǒng)的可信執(zhí)行環(huán)境TEE。傳統(tǒng)的可信執(zhí)行環(huán)境是強(qiáng)調(diào)計(jì)算環(huán)境可信,不會(huì)被攻擊。在這里把一些人為的因素放在里面,把社會(huì)工程因素放在里面,以構(gòu)建一個(gè)安全可控的區(qū)域。這個(gè)安全可控包括人員可控,能落實(shí)責(zé)任制。如在政府部門(mén)或者國(guó)企里構(gòu)造一個(gè)安全可控區(qū)域,再通過(guò)“數(shù)據(jù)不動(dòng)程序動(dòng)”“數(shù)據(jù)可用不可見(jiàn)”的方法來(lái)保證隱私。在這個(gè)模型架構(gòu)中,數(shù)據(jù)擁有方需要把數(shù)據(jù)放到模型加工場(chǎng)里。為什么敢放過(guò)來(lái)?因?yàn)檫@里是可信的,不會(huì)出賣(mài)、盜用數(shù)據(jù)。同時(shí),數(shù)據(jù)所有者可以決定數(shù)據(jù)是否能夠被平臺(tái)所使用。

三、將數(shù)據(jù)放到可信機(jī)構(gòu)中,讓程序動(dòng)起來(lái)

AI靶場(chǎng)的特點(diǎn)是所有程序都可以擺渡到數(shù)據(jù)加工場(chǎng)中來(lái)執(zhí)行,程序需要什么環(huán)境,AI靶場(chǎng)就提供什么環(huán)境。這個(gè)模型需要具有以下四個(gè)特性:

1.保留所有權(quán)交易權(quán)。數(shù)據(jù)所有者可以決定數(shù)據(jù)是否能夠在數(shù)據(jù)加工場(chǎng)中被數(shù)據(jù)挖掘者所使用。

2.數(shù)據(jù)可用不可見(jiàn)。使用embedding算法提取數(shù)據(jù)中間特征,據(jù)此構(gòu)造出具有相同特征的數(shù)據(jù),將其放在調(diào)試環(huán)境中,供用戶(hù)設(shè)計(jì)模型使用,使之既足以反映出全量數(shù)據(jù)的特征,又不會(huì)泄露具體的隱私數(shù)據(jù)。如一個(gè)健康數(shù)據(jù),有姓名、性別、年齡、體檢結(jié)果、血壓、體重,還有CA值、CA199等等各種值,這些值都可以根據(jù)真實(shí)存在的情況來(lái)進(jìn)行構(gòu)造,足以供編程人員參考來(lái)進(jìn)行編程,但實(shí)際上并不存在這樣的個(gè)體。

3.數(shù)據(jù)不動(dòng)程序動(dòng)。可信計(jì)算平臺(tái)像靶場(chǎng)一樣只接收程序的運(yùn)行,編程人員無(wú)法跟隨進(jìn)來(lái)觀(guān)察數(shù)據(jù),從而可以保護(hù)裸數(shù)據(jù)不被獲取以保護(hù)隱私,這就可以允許程序(模型)在全量環(huán)境中運(yùn)行。

4.分享數(shù)據(jù)不分享價(jià)值。調(diào)試好的程序浮動(dòng)到全量數(shù)據(jù)運(yùn)行環(huán)境中無(wú)人化運(yùn)行,所有的數(shù)據(jù)可用來(lái)被加工,但不能被拖走。如果有程序試圖將原始數(shù)據(jù)拖走,則可以通過(guò)數(shù)據(jù)輸出過(guò)濾系統(tǒng)來(lái)進(jìn)行核查攔截,以確保只分享價(jià)值(可帶走參數(shù))不分享數(shù)據(jù)(不能帶走原始數(shù)據(jù))。

四、破局隱私保護(hù)與數(shù)據(jù)挖掘相悖的方法

在這里,支持在隱私保護(hù)前提下的數(shù)據(jù)挖掘主要依賴(lài)4個(gè)核心要素。

1.核心方法:數(shù)據(jù)不動(dòng)程序動(dòng)

怎么做到數(shù)據(jù)不動(dòng)程序動(dòng)?采取網(wǎng)絡(luò)靶場(chǎng)技術(shù),構(gòu)建一個(gè)可信計(jì)算平臺(tái),使得外部程序可以在該平臺(tái)上進(jìn)行運(yùn)行。隱私數(shù)據(jù)可以以裸數(shù)據(jù)的形式放在該平臺(tái)中,由擺渡過(guò)來(lái)的外部程序利用這些數(shù)據(jù)來(lái)進(jìn)行模型加工,程序只能讀取原始數(shù)據(jù)并進(jìn)行運(yùn)算,不能存儲(chǔ)原始數(shù)據(jù)或外傳原始數(shù)據(jù),編程人員也不能進(jìn)入該模型加工場(chǎng)查看調(diào)閱數(shù)據(jù)。

由于AI靶場(chǎng)提供一個(gè)仿真平臺(tái),編程人員所需要的全部環(huán)境AI靶場(chǎng)上都會(huì)提供,這樣擺渡過(guò)來(lái)的程序就可以對(duì)全量裸數(shù)據(jù)進(jìn)行加工,以便在加工中獲取訓(xùn)練參數(shù),以達(dá)到數(shù)據(jù)挖掘的目的,這是AI靶場(chǎng)的核心。

2.輔助模式:數(shù)據(jù)可用不可見(jiàn)

編程人員會(huì)質(zhì)疑看不到原始數(shù)據(jù)就無(wú)法進(jìn)行編程,要求AI靶場(chǎng)為程序員提供支持編程的數(shù)據(jù)樣本。這時(shí),可信計(jì)算平臺(tái)就需要構(gòu)建一個(gè)用戶(hù)程序調(diào)試環(huán)境,并在這個(gè)環(huán)境中為程序員提供足以支持編程的數(shù)據(jù),我們稱(chēng)之為數(shù)據(jù)沙箱。在這里,調(diào)試數(shù)據(jù)由AI靶場(chǎng)來(lái)根據(jù)全量數(shù)據(jù)的情況進(jìn)行生成。使用者根據(jù)所提供的經(jīng)過(guò)變換的樣本數(shù)據(jù)來(lái)進(jìn)行潛在價(jià)值的挖掘分析,以便確定從平臺(tái)數(shù)據(jù)中能夠生成什么樣的模型,進(jìn)而判斷是否要進(jìn)入模型加工場(chǎng)進(jìn)行數(shù)據(jù)挖掘。

也就是說(shuō),我們要做一個(gè)構(gòu)造,最簡(jiǎn)單的構(gòu)造是簡(jiǎn)單置換,使得數(shù)據(jù)項(xiàng)中的所有取值都是在合理范圍內(nèi),沒(méi)有影響到embedding,但所有值都是杜撰的,不是個(gè)人隱私。當(dāng)然不是所有類(lèi)型的數(shù)據(jù)都能做到這一點(diǎn)。健康數(shù)據(jù)可以這么做,語(yǔ)料庫(kù)呢?我們?cè)邬i城實(shí)驗(yàn)室已經(jīng)有大量“一帶一路”的語(yǔ)料庫(kù),都是高價(jià)采購(gòu)的,我們鼓勵(lì)大家到鵬城實(shí)驗(yàn)室去挖掘,但不希望挖掘者把語(yǔ)料庫(kù)拖走。這時(shí)候就需要抽一些簡(jiǎn)單的語(yǔ)料供編程人員調(diào)試程序使用。在這種情況下,通常需要做一個(gè)測(cè)試,抽多少語(yǔ)料才能使得程序挖掘的效果等效于按全量語(yǔ)料挖掘的效果。這是,我們不認(rèn)為給一部分語(yǔ)料算是泄露,這好比你想買(mǎi)我的電影,先讓你看10分鐘,這10分鐘免費(fèi),再想往下看收費(fèi)。當(dāng)然,絕大部分情況下,還是需要通過(guò)構(gòu)造數(shù)據(jù)來(lái)提供調(diào)試用例,我們把這個(gè)叫做輔助模式,數(shù)據(jù)可用不可見(jiàn)。

3.關(guān)鍵手段:分享價(jià)值不分享數(shù)據(jù)

有人擔(dān)心,浮動(dòng)來(lái)的程序本身就是專(zhuān)門(mén)來(lái)獲取隱私數(shù)據(jù),再通過(guò)加密的方式將數(shù)據(jù)拖走,你怎么防范呢?在這里,我們是采取信息過(guò)濾技術(shù),構(gòu)建一個(gè)防水堡,確保外部程序在可信計(jì)算平臺(tái)中計(jì)算之后,向外輸出的只能是參數(shù)之類(lèi)的宏觀(guān)信息,而不能攜帶微觀(guān)的原始數(shù)據(jù)。由此確保該可信計(jì)算平臺(tái)僅僅以模型加工場(chǎng)的形式提供服務(wù),而不會(huì)將隱私信息泄露出去。

面對(duì)采取加密手段攜帶數(shù)據(jù)的現(xiàn)象,可以采取類(lèi)似差分隱私保護(hù)的方法來(lái)進(jìn)行防范。差分隱私保護(hù)方法的核心是施加噪音,防水包就需要在挖掘者帶走的結(jié)果數(shù)據(jù)中給施加噪音。既然編程者要拿走價(jià)值,價(jià)值一定是有一個(gè)表達(dá)區(qū)域,AI靶場(chǎng)不接受加密的表達(dá)形式。例如,挖掘者想知道健康數(shù)據(jù)中人員的健康狀態(tài),并且給出了一個(gè)值域范圍,例如健康狀態(tài)最好是100分,這個(gè)人67分,那個(gè)人75分。但是,挖掘者卻悄悄的將某個(gè)人的個(gè)人身體健康信息進(jìn)行加密,然后再將加密結(jié)果切斷在0到100范圍內(nèi),讓審查者看到的結(jié)果都是在合法的取值范圍內(nèi),不認(rèn)為有什么問(wèn)題。等攜帶出去之后再將該數(shù)值還原就解密了。針對(duì)這類(lèi)情況,可以采取加噪的手段,對(duì)一個(gè)97.1的值,就給改成97.2。97.2和97.1差別不大,不能說(shuō)這種修改引發(fā)了巨大的誤差。你給我93.31,我就變成93.32。通過(guò)這種加噪的方法,挖掘者想再拼回去解密,就不可能了。因?yàn)槊芪氖且晃欢疾荒芨牡模牧司徒獠涣嗣?。這樣就保證挖掘者只能把數(shù)據(jù)拿走,而不能拿走的原始數(shù)據(jù)。

4.擴(kuò)展模式:保留所有權(quán)釋放使用權(quán)

大數(shù)據(jù)交易無(wú)法推廣的一個(gè)主要原因是數(shù)據(jù)所見(jiàn)即所得,數(shù)據(jù)只能進(jìn)行一次性交易所有權(quán),很難進(jìn)行重復(fù)交易。但如果能夠?qū)?shù)據(jù)的所有權(quán)與使用權(quán)相分離,使得數(shù)據(jù)可以不斷地交易使用權(quán),保留所有權(quán),數(shù)據(jù)要素流動(dòng)就變成可變現(xiàn)的手段。就是說(shuō),挖掘者每使用一次就付一次費(fèi),他們不會(huì)因?yàn)槭褂眠^(guò)一次就能夠?qū)?shù)據(jù)拖走。因此,可信計(jì)算平臺(tái)還可提供遠(yuǎn)程控制模式,讓數(shù)據(jù)的所有者來(lái)遠(yuǎn)程決定其所屬數(shù)據(jù)可以向誰(shuí)賦予使用權(quán)。例如,通過(guò)加密網(wǎng)關(guān)將數(shù)據(jù)所有者提交的數(shù)據(jù)加密,只有再所有者授權(quán)后才能夠自動(dòng)解密讀出,以此達(dá)到數(shù)據(jù)所有者只交易使用權(quán)不交易所有權(quán)的目的。還可以由數(shù)據(jù)所有者提供訪(fǎng)問(wèn)權(quán)限的方式,來(lái)決定哪個(gè)挖掘者可以被授予訪(fǎng)問(wèn)數(shù)據(jù)的權(quán)限。

顯然,這一點(diǎn)是最重要的。大數(shù)據(jù)交易早就在推廣了,但沒(méi)聽(tīng)說(shuō)有多少成功的交易。為什么交易不成功?核心原因是數(shù)據(jù)的特征是所見(jiàn)即所得。它不像物體,物體的復(fù)制是有成本的;而數(shù)據(jù)的復(fù)制邊際成本為零,一旦看到了,就可以大量復(fù)制。所以大數(shù)據(jù)的售價(jià)就不能太低,可太高了人家就不買(mǎi),所以數(shù)據(jù)所有權(quán)交易是不太成立的。但如果能夠僅交易數(shù)據(jù)的使用權(quán)就易于推廣了。比如這個(gè)筆記本借給你用,一天收20塊錢(qián),你再還給我。那數(shù)據(jù)能不能也做到這一點(diǎn)?數(shù)據(jù)借給人家用再還回來(lái),大家說(shuō)不可能,因?yàn)閿?shù)據(jù)所見(jiàn)即所得。可是在愛(ài)奇藝平臺(tái)看電影,你想把電影拷出去是不可能的,你要讓別人看,別人也得有愛(ài)奇藝的賬戶(hù),也得付費(fèi)才行。這表明愛(ài)奇藝做到了數(shù)據(jù)只能使用、不能帶走。

如果成功做到數(shù)據(jù)只能使用不能帶走,所有權(quán)和使用權(quán)相分離,這種交易馬上就活躍起來(lái)了。使用時(shí)可以適當(dāng)收費(fèi),交易剛開(kāi)始先免費(fèi)試用,發(fā)現(xiàn)好,就可以花錢(qián)來(lái)挖掘;效果好了別人也會(huì)跟著來(lái)做,數(shù)據(jù)沒(méi)有辦法拿走,要想挖掘只能到AI、靶場(chǎng)來(lái)。一旦大數(shù)據(jù)要素流動(dòng),數(shù)據(jù)交易才能真正實(shí)現(xiàn)。

五、模型加工場(chǎng):只分享價(jià)值的可信平臺(tái)

要做這件事,需要三個(gè)層次:一是需要有數(shù)據(jù)擁有方。數(shù)據(jù)擁有方的目的是在隱私保護(hù)的前提下充分發(fā)揮數(shù)據(jù)最大價(jià)值。模型加工場(chǎng)就是要合法合規(guī)安全的開(kāi)放數(shù)據(jù),來(lái)實(shí)現(xiàn)多元數(shù)據(jù)的融合分析。二是數(shù)據(jù)需求方,也就是數(shù)據(jù)挖掘者,他們對(duì)需要數(shù)據(jù)進(jìn)行分析,以便獲得一個(gè)最優(yōu)模型。三是模型加工場(chǎng)。需求方和數(shù)據(jù)方中間夾著模型加工場(chǎng),數(shù)據(jù)所有者把數(shù)據(jù)所有權(quán)提交給模型加工場(chǎng),模型加工場(chǎng)在對(duì)外提供數(shù)據(jù)挖掘的時(shí)候進(jìn)行收費(fèi)。模型加工場(chǎng)所獲得的收益可以留一部分作為平臺(tái)傭金,例如15%-20%,剩下的80%-85%都給數(shù)據(jù)擁有方。數(shù)據(jù)擁有方通過(guò)這一點(diǎn)達(dá)到交易收益,就愿意提供數(shù)據(jù)。數(shù)據(jù)需求方通過(guò)對(duì)數(shù)據(jù)進(jìn)行建模,從而實(shí)現(xiàn)增值,也就愿意為此而付費(fèi)。

模型加工場(chǎng)是一種用于加工模型的安全可控分析平臺(tái),基于“數(shù)據(jù)不動(dòng)程序動(dòng),數(shù)據(jù)可用不可見(jiàn)”的新理念,可以破解隱私保護(hù)和數(shù)據(jù)挖掘間的矛盾。

在這個(gè)體系中,首先是數(shù)據(jù)提供者把數(shù)據(jù)導(dǎo)給模型加工場(chǎng)平臺(tái),在這里有數(shù)據(jù)授權(quán)管理,數(shù)據(jù)擁有者說(shuō)不能用時(shí),平臺(tái)也沒(méi)法提供給別人用,數(shù)據(jù)擁有者還可以通過(guò)加密解密來(lái)進(jìn)行遠(yuǎn)程管理。所以這個(gè)授權(quán)管理機(jī)制,支撐了“保留所有權(quán)、交易使用權(quán)”的屬性。

在這里面有一個(gè)針對(duì)內(nèi)部管理人員的訪(fǎng)問(wèn)控制,我們稱(chēng)之為“云匣子”。本質(zhì)上這就是一個(gè)內(nèi)部管理機(jī)制,所有敏感類(lèi)型的操作,如讀寫(xiě)文件、關(guān)機(jī)等等,都會(huì)自動(dòng)彈給用戶(hù)和上級(jí)管理者,由上級(jí)管理者來(lái)確認(rèn)該不該操作,同時(shí),該操作也會(huì)根據(jù)情況來(lái)提交給數(shù)據(jù)擁有著進(jìn)行備案。這樣就確保了模型加工場(chǎng)具有“可信計(jì)算平臺(tái)”的屬性,管理者也不能隨便亂動(dòng)。

對(duì)數(shù)據(jù)操作而言,需要先將數(shù)據(jù)做一個(gè)置換,然后將置換過(guò)的數(shù)據(jù)提供給數(shù)據(jù)沙箱,目的是要支撐數(shù)據(jù)分析的開(kāi)發(fā)平臺(tái),以便讓研究者在數(shù)據(jù)沙箱上調(diào)試程序。因?yàn)閿?shù)據(jù)是置換的,所以數(shù)據(jù)都能用,但實(shí)際上沒(méi)看到過(guò)真正的數(shù)據(jù),這就保證了“數(shù)據(jù)可用不可見(jiàn)”的屬性。當(dāng)然,這里還需要有數(shù)據(jù)分析的框架,已確保程序能調(diào)成功。

一旦挖掘者的程序調(diào)試成功,就需要把程序浮動(dòng)到集群里,只要到集群里才可以看到全量數(shù)據(jù)?,F(xiàn)在看到全量數(shù)據(jù),但是程序移動(dòng)過(guò)來(lái)的,人沒(méi)跟過(guò)來(lái),所以全量數(shù)據(jù)也不會(huì)被人拿走,因?yàn)槌绦蛱幚硗陻?shù)據(jù)之后就會(huì)拋棄掉,并沒(méi)有存儲(chǔ),存儲(chǔ),也帶不走。這就實(shí)現(xiàn)了“數(shù)據(jù)不動(dòng)程序動(dòng)”的屬性。

當(dāng)計(jì)算結(jié)果需要被拿走時(shí),可以通過(guò)防水堡系統(tǒng)來(lái)進(jìn)行過(guò)濾,確保只能拿走參數(shù),不能拿走原始數(shù)據(jù),這就保障了“分享價(jià)值不分享數(shù)據(jù)”的屬性。

這就是模型加工場(chǎng)的整體工作原理。

六、打造基于鵬城云腦的數(shù)據(jù)信托模式

鵬城實(shí)驗(yàn)室建設(shè)了一個(gè)鵬城云腦,目前是全球性能最好的智能計(jì)算平臺(tái)。我們?cè)邬i城云腦上構(gòu)造了鵬城AI靶場(chǎng),目的是打造數(shù)據(jù)信托模式。多個(gè)城市大數(shù)據(jù)局可將政務(wù)數(shù)據(jù)安全托管到鵬城云腦,通過(guò)模型加工場(chǎng)安全開(kāi)放政務(wù)數(shù)據(jù),數(shù)據(jù)需求方可在模型加工場(chǎng)調(diào)試環(huán)境,查看樣本數(shù)據(jù)形成數(shù)據(jù)分析程序,將程序發(fā)送至模型加工場(chǎng)-運(yùn)行環(huán)境,經(jīng)過(guò)反復(fù)調(diào)試后得到較好結(jié)果,實(shí)現(xiàn)“數(shù)據(jù)不動(dòng)程序動(dòng)、數(shù)據(jù)可用不可見(jiàn)、分享價(jià)值不分享數(shù)據(jù)、交易使用權(quán)不交易所有權(quán)”數(shù)據(jù)要素流通交易模式。

2021年有關(guān)部門(mén)做了一個(gè)中國(guó)網(wǎng)民網(wǎng)絡(luò)安全感滿(mǎn)意度調(diào)查,獲得了200多萬(wàn)份調(diào)查信息,每個(gè)調(diào)查有200多項(xiàng)數(shù)據(jù)。這些數(shù)據(jù)涉及到個(gè)人的信息而不宜公開(kāi),但這里面隱藏大量網(wǎng)民的個(gè)性化的反映,如對(duì)網(wǎng)絡(luò)社會(huì)的感知、對(duì)網(wǎng)絡(luò)狀態(tài)認(rèn)可情況等有價(jià)值信息需要挖掘。

挖掘靠什么?我們把整個(gè)數(shù)據(jù)都放到鵬城云腦上,同時(shí),基于鵬城云腦構(gòu)建了AI靶場(chǎng),來(lái)支持?jǐn)?shù)據(jù)不動(dòng)程序動(dòng)的人工智能模型挖掘模式。我們組織數(shù)據(jù)挖掘和人工智能建模大賽,有127支隊(duì)伍報(bào)名參賽,最后進(jìn)行了有效的挖掘,獲得了相對(duì)共識(shí)的網(wǎng)民建議。

總之,數(shù)據(jù)擁有者使用模型加工場(chǎng)對(duì)外開(kāi)放數(shù)據(jù),就可以有效地促進(jìn)數(shù)據(jù)要素流動(dòng)。通過(guò)這個(gè)例子可以證明把數(shù)據(jù)放在模型加工場(chǎng)上,別人拿不走數(shù)據(jù),但確實(shí)可以獲得價(jià)值。

謝謝大家!

編輯:李曉慧

審核: