保護資料/ 保障企業

Published by admin on

資料私隱是一個全球關注的議題。作為一個數據科學家,我們會把資料的安全性放到較高位置。

對於敏感資料而言,這些都是重要的保護對象如加密及遮蓋。我們希望分享一些現有市場內的方案:

  1. 資料遮蓋工具
  2. 資料虛擬化

為了應付不同的需要,敏感的資訊如個人資料,包括了Excel表、關係資料表,甚或是大數據Hadoop。我們協助線上及線下零售商去保護個人資料如聯絡人資料及其方案。

資料遮蓋(Data Masking)工具

市場上有很多保安工具去提供數據加密功能。舉一個例子,IRI(一間有40年的軟件公司)致力生產不同的資料遮蓋軟件,如FieldShield把資料去身份化,並附合世界法規包括CIPSEA、DPA、FERPA、GDPR、GLBA、HIPAA、PCI、POPI等。在香港,我們必須比對其功能是否合乎本地的個人資料(私隱)條例(PDPO),這產品完全附合相關法規,並細緻到每一個欄位。

圖示 1. 資料遮蓋例子

Data Masking

總括來說,資料遮蓋是把特定敏感資料加密,讓其他沒有授權的人無法看得明白。對於今天的IRI工具,它們不單能夠遮蓋資料庫的欄位,但也可以應用到Excel檔案上。在Excel表的欄位加密是該公司現時在市場上的獨家功能。(直至2019年8月13日)

資料虛擬化(Data Virtualization)

資料虛擬化近來已經大為普及。這是其中一個最佳方法去處理「資料筒倉」問題。相反地,基於資料虛擬化,資料存取管理是其中一項關鍵。滙智數據科學的團隊,建議在多於三個資料來源時使用才值得使用資料虛擬化。

方案包括了幾個範疇:

  1. 提供多重存取管理,橫跨不同資料庫、表、列、欄。
  2. 以政策為本的保安及工序管理(強制執行賬戶政策來確實保安及工序的要點得以貫切)
  3. 擔當成單一的存取接點,不論多少個資料來源,都只透過一個接口而不用產生大量煩瑣的連線。

圖示 2. 資料虛擬化例子

Denodo-Data Virtualization

其他市場上保安的方案

除了資料遮蓋/資料虛擬化,有更多不同工具去保護資料如資料庫保安及企業保安政策。我們建議加入保火牆或代理伺服器如一些專職伺服器去保障重要的資料庫或其他資料儲存如HBase。

建議具備以下的功能:

  • 管理特定脹戶及群組在資料庫的存取(在資料庫架構上)
  • 使用黑/白名單來批准SQL活動(查詢及流程)
  • 監控資料庫系統,無論是在線上或線下進行
  • 日誌、報告及儀表板上的個人資料存取、活動及警示詳情
  • 做選擇性的動態的資料遮蓋(DDM)
  • 查明及保護日誌被修改/偽造
  • 遵守香港及國際的資料私隱法例

圖示 3. 資料庫代理的例子

IRI Database proxy example

結論

總括而言,這是現時一個重大的挑戰以保護特大數量的資料作為分析用途。坊間有不同類型的資料,當中以個人資訊最受到關注,包括個人身份、病人醫療記錄等。再者,企業應該在收集時已經開始好好保護資料,沒有管理人員會希望自己的企業因為資料洩密而「見報」。