SKEE: A Lightweight Secure Kernel-level Execution Environment for ARM

SKEE: A Lightweight Secure Kernel-level Execution Environment for ARM

出处:NDSS 2016

作者:Ahmed M. Azab,1 Kirk Swidowski,1Rohan Bhutkar, Jia Ma, Wenbo Shen, Ruowen Wang, and Peng Ning

单位:Samsung KNOX R&D, Samsung Research America

原文:http://dx.doi.org/10.14722/ndss.2016.23009

概述

SKEE有如下特性:

  1. 基于ARM平台;
  2. 与操作系统具有相同的特权级;
  3. 隔离的轻量级的执行环境;
  4. 在这个新的执行环境上支持对操作系统内核进行安全检测和保护。

痛点

如果将整个操作系统内核作为可信基(TCB),内核级安全保护机制一旦被绕过,攻击者将能获得整个系统的内存资源,这是非常危险的。因此,需要使用安全工具(security tools)来监控和保护内核,并且安全工具需要隔离的执行环境,以防遭受内核漏洞利用的破坏。

先前工作

  1. 基于虚拟化的方法。将安全工具执行在虚拟管理层(hypervisor)进而对内核监控和保护,然而hypervisor的TCB太大以至于自身易受攻击,从而处于hypervisor的安全工具也并不安全。
  2. 一些不依赖于hypervisor的隔离的方法。microhypervisors,虽然缩小了TCB,但是不能满足较大的代码基础的安全工具;沙箱,虽然可以提供安全工具环境,但是需要hypervisor的介入来管理,同样TCB太大会带来自身的安全问题;硬件保护,在ARM中没有类似Intel的SGX保护机制,ARM中提供的TrustZone同样存在TCB太大而导致的自身安全问题。

SKEE的设计

  1. 隔离:要保证即使内核被攻击了SKEE也是安全的。
    在系统启动时,首先,修改系统的内存布局,创建一块保护的虚拟地址空间给SKEE,通过修改内核用的内存转换表,该表项中不予设置SKEE区域的转换入口,来达到SKEE执行环境所用到内存保护区域与内核能访问的内存区域分离开来;其次,限制内核对内存管理单元(MMU)的访问权限,SKEE将完全控制MMU和内存转换表,并将其放在受保护的地址空间,内核无权修改。
  2. 安全的上下文切换接口:提供内核环境和SKEE环境的切换。
    由于SKEE与内核处于相同的特权级,因此它不能通过原始的切换内存转换表来实现(这只适用于如内核到用户进程这样高特权级到低特权级的转换),SKEE采用一种新的方法强制内核通过其设计的转换门跳转到隔离环境。当然这个门具有原子性和确定性,原子性保证该过程不被内核获得控制权,确定性保证每次转换都能到达安全检查的入口点,这两个特性防止将SKEE的地址空间暴露给内核。32-bit ARMv7 和64-bit ARMv8的实现方法不同。
  3. 检测并保护内核:要提供给安全工具执行环境来审查内核状态并抵御攻击。
    SKEE提供安全工具的执行环境,安全工具来实现具体的内核检测和保护。

威胁模型

根据攻击意图将内核攻击分为三类:

  1. 旨在修改内核执行的攻击。此类攻击可以防范,因为SKEE会限制未通过审核的恶意代码在内核模式的运行。
  2. 利用漏洞改变内核数据或控制流导致现有内核代码出现异常的恶意行为,如实现提权、ROP攻击。SKEE安全执行环境中存放的安全工具来抵御这些攻击(具体的检测攻击由安全工具决定,不在这篇文章的研究范围)。
  3. 旨在破坏隔离环境进而破坏内核检测保护工具。SKEE可以保证这些攻击不能破坏隔离也不会饶过监控。

假设

  1. 整个系统可以安全的启动(安全的创建了受保护的地址空间并且设置内核访问权限)。
  2. 内核支持W⊕X,硬件平台实现Privileged eXecute Never (PXN)。
  3. 在32-bit ARMv7平台,内核只能使用TTBR0,TTBR1专门给SKEE 使用,低于2GB的虚拟空间给没有特权的用户空间代码。
  4. 在64-bit ARMv8平台,要求物理地址0x0的内存页专门给SKEE使用。

实验

环境:

  1. 32-bit ARMv7架构的Samsung Note4手机,Qualcomm 的Sanspdragon APQ8084 处理器。
  2. 64-bit ARMv8架构的Samsung Galaxy S6和Samsung Galaxy Note5,Samsung System LSI 的Exynos 7420 处理器。
  3. 操作系统:Android Lollipop version 5.0,Linux kernel version 3.10.61。
    设计两组实验(纯粹的SKEE开销和安全检查的开销)。第一组 SKEE收到内核请求不进行安全检查;第二组 SKEE检查模拟请求是否以不利于隔离的方式修改内存布局。

仿真系统事件的开销

首先,对比安全工具运行在SKEE里面和外部的开销。由于SKEE和内核是同级,所以他们的执行开销是相同的,真实受影响的是进出SKEE所带来的开销;其次,在SKEE放置了安全工具之后带来的开销。

三个设备:未修改的安卓系统、清除TLB的SKEE系统和使用ASID的SKEE系统。

  1. 转换到SKEE的开销:

    用ARM cycle count register (CCNT)来衡量。

    1.png

    结果分析:使用ASID明显降低开销;ASID v8比v7开销更少,因为v8的实现只要一个原子操作 而v7需要一系列步骤。

  2. Benchmark 性能开销:

    仅仅实验了清除TLB的情况,测试了7个不同的benchmark安全工具。结果发现两种架构下SKEE的性能均有所降低,不同工具降低程度不同,我们分析是TLB不同频率的缺失导致的不同的系统状态。

    2.png
    3.png

  3. 加载APPs延迟

    衡量 按下app到其完全加载 的时间,选择了一些二进制文件很大并且需要很多图像处理的需要加载很久的游戏app。结果在预期范围内, SKEE的存在对app的加载带来了额外的时间开销。

    4.png
    5.png

  4. 设备启动时间

    启动时SKEE的最糟糕的情况,因为需要大量的内存分配,在32-bit ARMv7中,原生系统平均启动时间是21.35秒,而SKEE是23.10秒(增加了8.2%);在64-bit ARMv8中,原生是21.72秒,而SKEE是24.30秒(增加了11.9%)。

安全检查样例开销

三个比较:原生、没有执行安全检查的SKEE和执行了检查框架的SKEE。

6.png

结果分析,表7和表4的SKEE的降低程度也是不同的,比如表7中Vellamo Browser是8.65% 而表4是14.88%,解释是TLB缺失的影响是不确定的,它与原生系统的设置有关;跟之前一样,观察到不同的安全工具对性能开销的影响也不同;总的来说,加入安全框架对性能的影响在小于10%。

同样测量了启动时间,原生是30.15秒,没有执行检查的SKEE是33.80秒(增加了11.7%),执行安全检查的SKEE是35.12秒(增加了4.9%)。

增强性能

通过一些诸如TZ-RKP的技术可以减少上下文切换次数进而提高性能。

感谢支持~