作為一種新事物,人們通常對區(qū)塊鏈都存在或多或少的誤解,其中最具爭議的莫過于區(qū)塊鏈的安全性。有些人認為區(qū)塊鏈是劃時代的創(chuàng)造,通過一系
作為一種新事物,人們通常對區(qū)塊鏈都存在或多或少的誤解,其中最具爭議的莫過于區(qū)塊鏈的安全性。
有些人認為區(qū)塊鏈是劃時代的創(chuàng)造,通過一系列先進的密碼學機制保障了整個系統(tǒng)的安全性;而有些人則認為,區(qū)塊鏈只具有化名性而沒有匿名性,所以區(qū)塊鏈是不安全的。
為什么會產(chǎn)生這種撕裂呢?因為此“安全”非彼“安全”,這些人對區(qū)塊鏈安全的定義是不同的,自然得不到統(tǒng)一的結論。
那什么才是區(qū)塊鏈的安全?區(qū)塊鏈又是否安全,讓“互聯(lián)網(wǎng)安全教母”,加州大學伯克利分校計算機系教授 Dawn Song 為你揭開區(qū)塊鏈安全的神秘面紗。
Dawn Song,加州大學伯克利分校計算機系教授,Oasis Labs創(chuàng)始人兼CEO,被媒體譽為“互聯(lián)網(wǎng)安全教母”。研究方向包括深度學習、機算機和網(wǎng)絡安全、區(qū)塊鏈等。
曾獲麥克阿瑟獎 (MacArthur Fellowship),古根海姆獎(GuggenheimFellowship),斯隆研究獎 (Alfred P. Sloan Research Fellowship),《麻省理工科技評論》“35歲以下科技創(chuàng)新35人”獎 (TR-35 Award)等;是計算機安全領域中論文被引用次數(shù)最多的學者(AMinerAward)。
針對上文人們對于“安全”定義的感官撕裂,作為安全教母,Dawn Song和她的團隊不久前發(fā)表了一篇博文,力求撥亂反正,讓開發(fā)者真正了解區(qū)塊鏈安全的本質。
下面我們就一起跟著Dawn Song教授和她的團隊,一起看看她的思考。原文雖然只有短短2000來字,卻一語道破了區(qū)塊鏈安全面臨的尷尬處境。
以下為原文。
安全是計算機科學體系中老生常談的一個話題,尤其在區(qū)塊鏈領域中。當一個項目大肆宣傳安全性時,它提供了怎樣的安全保證呢?換句話說,現(xiàn)有的區(qū)塊鏈是否在核心的安全性方面仍存然很欠缺?
要回答這些問題,首先我們需要清晰地定義什么是安全性。
在這篇文章中,我們主要討論以下3個話題:
當前區(qū)塊鏈的安全性;
為什么說保密性和隱私性是當前區(qū)塊鏈最核心但也是最欠缺的屬性,以及,
我們該如何來完善區(qū)塊鏈。
安全性的經(jīng)典定義
在安全性的經(jīng)典定義中,我們假設 Alice 和 Bob 想要共同運行程序 f(x,y)。該程序的輸入是保密的:其中 Alice 僅知道 x ,Bob 僅知道 y 。
這里的挑戰(zhàn)在于 Alice 和 Bob 都希望在不讓對方知曉自己輸入數(shù)據(jù)的情況下得到計算的結果。
如果我們有一個想象中的可信第三方( Trusted Third Party,TTP )存在,這個問題就會簡單地多,這個可信第三方會同時接收 Alice 和 Bob 的輸入數(shù)據(jù),誠實地執(zhí)行該程序,并可靠地向雙方返回計算結果。
除了這些操作之外,這個可信第三方不會做任何其他事情,特別是,可信第三方不會告訴別人任何有關 x 和 y 的信息。
Alice 和 Bob 在可信第三方(TTP)的幫助下使用保密的輸入運行程序 f(x,y)
所以,定義協(xié)議安全性的一種方法,就是將其與這個可信第三方進行比較。上述可信第三方定義的安全性具有以下三個關鍵屬性(有時它們被稱為 CIA 屬性):
保密性( Confidentiality ):Alice 和 Bob 除了各自的輸入數(shù)據(jù)和計算的結果之外,得不到任何有關計算的信息;
誠實性( Integrity ):可信第三方返回的結果是程序 f(x,y) 在給定輸入下的正確計算;
可用性( Availability ):Alice 和 Bob 可以隨時訪問這個可信第三方。
但在現(xiàn)實世界中是否真的存在我們想象中的可信第三方呢?事實上,并不存在。
但如果我們做出一些具體的假設,就可以近似得到一些可信第三方。比如說,銀行和政府部門的聲譽、社會地位以及其他相關因素,讓許多人將他們視為可信第三方。
另一方面,智能合約是在不需要信任中心化實體的情況下實現(xiàn)可信第三方的核心手段。但智能合約并不是萬能的,在有些情況下,智能合約面對某些情況也無能無力。
智能合約的短板
當人們談論比特幣和以太坊的安全性時,實際上他們只是在談論區(qū)塊鏈的誠實性( integrity )和可用性( availability ),而不是保密性( confidentiality )和隱私性( privacy )。
比如說,以太坊擁有一個由數(shù)千個節(jié)點組成的區(qū)塊鏈網(wǎng)絡,每個節(jié)點都獨立維護著以太坊區(qū)塊鏈的完整備份。當你通過以太坊網(wǎng)絡上的某一賬戶執(zhí)行智能合約時,在智能合約被記錄在區(qū)塊鏈中之前,它的執(zhí)行將被所有挖礦節(jié)點驗證。
因此,如果大多數(shù)的哈希算力都由遵守以太坊協(xié)議的誠實節(jié)點掌控,那么你智能合約的運行結果將會是正確的,這種正確計算實現(xiàn)了區(qū)塊鏈的誠實性。
以太坊網(wǎng)絡還提供了一些可用性保證:與中心化實體(多臺服務器可能位于同一個數(shù)據(jù)中心中)不同,以太坊網(wǎng)絡的“服務器”去中心化地分布在世界各地。因此,雖然說某些節(jié)點可能會因為某些突發(fā)情況宕機,但所有節(jié)點同時宕機的情況不太可能發(fā)生。
但以太坊和許多其他區(qū)塊鏈項目缺乏的都是保密性和隱私性。
人們通常都對區(qū)塊鏈存在一個錯誤的認識,就是說因為參與到區(qū)塊鏈網(wǎng)絡中不需要提供姓名和身份證號,所以它是隱私的。不幸的是,這是一種極具誤導性甚至是危險性的謬論。
僅僅因為人們使用假名并不意味著他們在區(qū)塊鏈上的活動是不可見的。實際上,由于交易活動中的每一個數(shù)據(jù)(例如在以太坊上:交易雙方的地址,交易金額,燃料價格等信息)都被記錄在公共賬本之上并向所有人公開,因此有一些方法可以用來推斷出用戶的隱私信息(就比如說,使用交易網(wǎng)絡結構來檢索明文交易信息)。
此外,隨著越來越多復雜的去中心化應用程序的上線,用戶的數(shù)據(jù)逐漸成為信用評分,保險業(yè)務和身份管理等去中心化應用的重要推動力,而在以太坊上,智能合約的輸入數(shù)據(jù)需要被保存在區(qū)塊鏈上并向所有人公開,因為只有這樣所有節(jié)點才可以執(zhí)行交易的驗證。
在過去的幾年中,許多加密貨幣項目試圖通過使用諸如零知識證明之類的密碼學技術來解決區(qū)塊鏈上數(shù)據(jù)保密性不足的問題。但其中許多項目都聚焦于簡單的支付交易,而不是像機器學習和數(shù)據(jù)分析這類更為復雜的應用。
數(shù)據(jù)隱私性如何實現(xiàn)?
上文中提到的保密性是實現(xiàn)數(shù)據(jù)隱私性的重要先決條件,但需要指出的一點是保密性通常不足以實現(xiàn)數(shù)據(jù)的隱私性。
具體而言,保密性側重于保護在計算過程中不泄漏敏感信息,它保證除了計算的輸出之外,計算過程中不會泄露任何內容。但是它并沒有解決計算輸出中存在的潛在數(shù)據(jù)泄漏。
換句話說,即使有完全保密的計算過程,攻擊者仍可能會從其輸出中復原出有關敏感輸入的信息。
再回到上文中提到的 Alice 和 Bob 的例子,保密性意味著 Alice 和 Bob 只能得到計算的結果 f(x,y) ,而攻擊者什么都得不到。除此之外,數(shù)據(jù)的隱私性還要求,不能從計算結果 f(x,y) 中復原出 x 和/或 y 。
一個簡單的反例是 f(x,y)= x + y ,其中 Alice (知道她的輸入 x )可以在給定結果 x + y 的情況下立即推算出 Bob 的輸入 y 。舉一個我們最近和Google一起研究的例子,機器學習模型可能會泄漏出訓練數(shù)據(jù)中的敏感信息。我們將那些不會通過計算結果泄漏出輸入數(shù)據(jù)的計算稱為隱私性的計算。例如,差分隱私( Differential Privacy , DP )是實現(xiàn)隱私性計算的一種方法。
那么區(qū)塊鏈上的數(shù)據(jù)隱私性該如何實現(xiàn)呢?一個想法是,在區(qū)塊鏈上構建一個隱私第一的云計算平臺。為了實現(xiàn)數(shù)據(jù)的隱私性,開發(fā)者可以在云計算平臺的每一層都建立了隱私保護措施,在計算層中啟用了保密性措施保護智能合約的執(zhí)行,以防止在計算過程中泄漏任何敏感信息,并在應用層中實現(xiàn)了隱私保護的數(shù)據(jù)分析和機器學習,包括差分隱私,以防止在計算輸出中泄露敏感的輸入信息。
關鍵詞: 區(qū)塊鏈 數(shù)據(jù)泄漏 差分隱私