Discusión:Traducción en progreso a Secure Deletion... de Peter Guttmann

De Indymedia México

Borrado Seguro de Datos de Dispositivos Magnéticos y Estado Sólido

Peter Gutmann
Departamento de Informática
Universidad de Auckland
pgut001@cs.auckland.ac.nz

Este artículo fue publicado por primera vez en el Sexto Simposio sobre seguridad de USENIX, San Jose, California, del 22 al 25 de julio de 1996

Varias personas que han trabajado en programas para borrado de datos han pedido permiso de utilizar o incluir este documento con su trabajo, para hacer este más fácil lo he puesto bajo de la licencia Creative Commons.

Resumen

Con el uso de los sistemas cada vez más sofisticados de cifrado, para un atacante que desea acceder a los datos sensibles es más fácil buscar en otra parte para la información. Un ataque muy accesible es la recuperación de datos supuestamente borrados en soportes magnéticos (Discos Duros, Diskettes) o de la memoria de acceso aleatorio (RAM). Este artículo cubre algunos de los métodos disponibles para recuperar datos borrados y presenta esquemas para hacer esta recuperación considerablemente más difícil.



Tabla de contenidos

[editar] Introducción

Mucha investigación ha entrado el diseño de los sistemas altamente seguros del cifrado previstos para proteger la información sensible. Sin embargo el trabajo sobre métodos de asegurar (o por lo menos con seguridad de suprimirla) la forma original del plaintext de los datos cifrados contra nuevas técnicas sofisticadas del análisis se parece difícil de encontrar. En los años 80 un cierto trabajo fue hecho en la recuperación de datos borrados de los soportes magnéticos [1] [2] [3], pero hasta la fecha de la fuente principal de la información están los estándares del gobierno que cubren la destrucción de datos. Hay dos problemas principales con estas pautas oficiales para esterilizar medios. El primer es que él es a menudo algo viejo y puede predate más nuevas técnicas para los datos de la grabación sobre los medios y para recuperar los datos registrados. Por ejemplo la mayor parte de las pautas actuales en la esterilización de soportes magnéticos predate el salto en densidades de grabación, la adopción de early-90 de las técnicas sofisticadas tales como PRML, el uso de la codificación del canal de la microscopia magnética de la fuerza para el análisis de soportes magnéticos, y los estudios recientes de ciertas características de los soportes magnéticos que registran por ejemplo el comportamiento de borran vendas. El segundo problema con estándares oficiales de la destrucción de los datos es que la información en ellos puede ser parcialmente inexacta en un intento por engañar las agencias de inteligencia de oposición (que es probablemente porqué se clasifica un grande muchas pautas en la esterilización de medios). Deliberadamente minimisando los requisitos para el sanitization de los medios en guías público-disponibles, las agencias de inteligencia pueden preservar sus capacidades de información-acopio mientras que al mismo tiempo protegen sus propios datos usando técnicas clasificadas.

Este papel representa una tentativa de analizar los problemas inherentes en intentar borrar datos de medios del disco magnético y memoria de acceso aleatorio sin el acceso al equipo especializado, y sugiere los métodos para asegurarse de que la recuperación de datos de estos medios se pueda hacer tan difícil como sea posible para un atacante.

[editar] Métodos de recuperación para los datos almacenados en soportes magnéticos

La microscopia magnética de la fuerza (MFM) es una técnica reciente para los patrones de la magnetización de la proyección de imagen con la preparación de alta resolución y mínima de la muestra. La técnica se deriva de la microscopia de la punta de prueba de la exploración (SPM) y de las aplicaciones una extremidad magnética aguda unida a un voladizo flexible colocado cerca de la superficie que se analizará, donde obra recíprocamente con el campo perdido que emana de la muestra. Una imagen del campo en la superficie es formada moviendo la extremidad a través de la superficie y midiendo la fuerza (o el gradiente de la fuerza) en función de la posición. La fuerza de la interacción es medida supervisando la posición del voladizo usando un interferómetro óptico o haciendo un túnel el sensor.

La microscopia magnética el hacer un túnel de la exploración de la fuerza (STM) es una variante más reciente de esta técnica que utilice una extremidad de la punta de prueba hecha típicamente plateando el níquel puro sobre a prepatterned la superficie, pelando la película fina que resulta del substrato que fue plateada sobre y plateándolo con una capa delgada del oro para reducir al mínimo la corrosión, y montándola en una punta de prueba donde se pone en un cierto potencial diagonal pequeño (típicamente algunos tenths de un nanoamp en la C.C. de algunos voltios) de modo que los electrones de la superficie bajo prueba puedan hacer un túnel a través del boquete a la extremidad de la punta de prueba (o viceversa). La punta de prueba se explora a través de la superficie que se analizará como sistema de la regeneración ajusta continuamente la posición vertical para mantener una corriente constante. La imagen entonces se genera de la misma forma que para MFM [4] [5]. Otras técnicas que se han utilizado en el pasado para analizar soportes magnéticos son el uso del ferrofluid conjuntamente con los microscopios ópticos (que, con densidad de grabación del gigabit/pulgada cuadrada es no más tan factibles que las características magnéticas son más pequeñas que la longitud de onda de la luz visible) y un número de técnicas exóticas que requieren la preparación significativa de la muestra y el equipo costoso. En la comparación, MFM se puede realizar a través del sobretodo protector aplicado a los soportes magnéticos, requiere poco o nada de preparación de la muestra, y puede producir resultados en un muy a corto plazo.

Incluso para un usuario relativamente inexperto la época de comenzar a conseguir las imágenes de los datos sobre un disco de la impulsión es cerca de 5 minutos. Comenzar a conseguir imágenes útiles de una pista particular requiere más que un conocimiento que pasa de los formatos del disco, pero éstos están bien documentados, y una vez que la localización correcta en el disco se encuentre una sola imagen tomaría aproximadamente 2-10 minutos dependiendo de la habilidad del operador y de la resolución requeridos. Con uno de el MFM más costoso es posible automatizar una secuencia de la colección y teóricamente posible recoger una imagen del disco entero cambiando el software del regulador de MFM.

Hay, de figuras de las ventas de fabricantes, vario mil SPM funcionando en el campo hoy, algo de el cual tiene características especiales para analizar los discos del accionamiento de disco, tales como las tiradas del vacío para los discos estándares del accionamiento de disco junto con el modo de operación especializado para el análisis de los soportes magnéticos. Estos SPM se pueden utilizar con los reguladores y el software programables sofisticados del análisis para permitir la automatización del proceso de la recuperación de los datos. Si SPM disponibles en el comercio se consideran demasiado costosos, es posible construir un SPM razonablemente capaz para alrededor US$1400, usando una PC como regulador [6].

Hecho frente con técnicas tales como MFM, verdad suprimir datos de soportes magnéticos es muy difícil. El problema miente en el hecho de que cuando los datos se escriben al medio, la cabeza de escribir fija la polaridad de la mayoría, pero no todos los, dominios magnéticos. Esto es parcialmente debido a la inhabilidad del dispositivo de la escritura de escribir en exactamente la misma localización cada vez, y parcialmente debido a las variaciones en sensibilidad de los medios y en un cierto plazo la fuerza del campo y entre los dispositivos.

En términos convencionales, cuando el se escribe al disco los expedientes de los medios el, y cuando un cero se escribe los medios registra un cero. Sin embargo el efecto real está más cercano a obtener un 0.95 cuando un cero se sobreescribe con el, y un 1.05 en que el se sobreescribe con el. El trazado de circuito normal del disco se fija encima de para leer ambos estos valores como unos, pero con el trazado de circuito especializado que es posible resolverse qué “capas anteriores” contuvo. La recuperación por lo menos de uno o dos capas de datos sobreescritos no es demasiado dura de realizarse leyendo la señal de la electrónica principal análoga con un osciloscopio digital de alta calidad del muestreo, descargando la forma de onda muestreada a una PC, y analizándola en software para recuperar la señal previamente registrada. Qué lo hace el software es genera un “ideal” lee la señal y la resta de qué fue leída realmente, dejando como la diferencia el remanente de la señal anterior. Puesto que el trazado de circuito análogo en una impulsión dura comercial está en ninguna parte cerca de la calidad del trazado de circuito en el osciloscopio usado para muestrear la señal, la capacidad existe para recuperar muchos de la información adicional que no es explotada por la electrónica de la impulsión dura (aunque con más nuevas técnicas de la codificación del canal tales como PRML (explicado más lejos encendido) que requieren cantidades extensas de proceso de señal, el uso de herramientas simples tales como un osciloscopio de recuperar directamente los datos es no más posible).

Usando MFM, podemos ir incluso más futuros que esto. Durante repaso normal, una cabeza convencional hace un promedio de la señal sobre la pista, y cualquier magnetización el remanente en los bordes de la pista contribuye simplemente un porcentaje pequeño del ruido a la señal total. La región del muestreo es demasiado amplia detectar distintamente la magnetización el remanente en los bordes de la pista, para no poder recuperarse los datos sobreescritos que todavía está presente al lado de los nuevos datos sin el uso de técnicas especializadas tales como MFM o STM (de hecho una de las aplicaciones “oficiales” de MFM o de STM es evaluar la eficacia de los mecanismos de servo-colocación) del accionamiento de disco [7]. La mayoría de las impulsiones son capaces de microstepping las cabezas para los propósitos internos de la recuperación del diagnóstico y de error (las estrategias típicas de la recuperación de error consisten en el rereading de pistas con compensaciones levemente cambiantes del umbral y de la ventana de los datos y el variar de la cabeza que coloca por algunos por ciento a cualquier lado de la pista), pero escritura a los medios mientras que la cabeza es apagado-pista para borrar la señal el remanente lleva demasiado riesgo de hacer pistas vecinas ilegibles para ser útiles (por esta razón la capacidad microstepping es hecha muy difícil de tener acceso por medios externos).

Estas técnicas especializadas también permiten que los datos sean recuperados de soportes magnéticos de largo después de que el jefe de lectura/grabación de la impulsión sea incapaz de la lectura cualquier cosa útil. Por ejemplo un experimento en borradura de la CA implicó el conducir de la cabeza de escribir con una onda del cuadrado de 40 megaciclos con una corriente inicial de 12 mA que fue caído en 2 pasos del mA a un nivel final de 2 mA en pasos sucesivos, una orden de la magnitud más que el generalmente escriben la corriente que se extiende de los altos microamperios a los miliamperios bajos. Cualquier configuración de bits el remanente dejada por este proceso que borraba era demasiado débil lejano que se detectará por la cabeza leída, pero se podría todavía observar el usar de MFM [8].

Incluso con un proceso de la borradura de la C.C., los rastros de la señal previamente registrada pueden persistir hasta que el campo aplicado de la C.C. es varias veces el coercivity de los medios [9].

Las desviaciones en la posición de la cabeza de la impulsión de la pista original pueden salir de las porciones significativas de los datos anteriores a lo largo del borde de la pista relativamente sin tocar. Los datos nuevamente escritos, presente como ancho alternando vendas ligeras y oscuras en imágenes de MFM y de STM, son a menudo los datos previamente registrados sobrepuestos del excedente que persiste en los bordes de la pista. Las regiones donde coinciden los viejos y nuevos datos crean la magnetización continua entre los dos. Sin embargo, si la nueva transición es fuera de fase con la anterior, algunos micrones de borran la venda sin la magnetización definida se crean en la juntura de las pistas viejas y nuevas. El campo del escribir en la venda del borrar está sobre el coercivity de los medios y cambiaría la magnetización en estas áreas, pero su magnitud no es arriba bastante crear nuevas transiciones bien definidas. Un experimento implicó el escribir de un patrón fijo de el 1 con un intervalo del pedacito del µm 2.5, moviendo la apagado-pista de la cabeza de escribir por aproximadamente mitad de una anchura de pista, y después escribiendo el patrón otra vez con una frecuencia levemente más alta que la de la pista previamente registrada para un intervalo del pedacito del µm 2.45 para crear todas las diferencias de fase posibles entre las transiciones en las pistas viejas y nuevas. Usar una cabeza ancha de 4.2 µm produjo una venda del borrar de aproximadamente 1 µm en anchura cuando las pistas viejas y nuevas eran 180° fuera de fase, cayendo casi nada cuando las dos pistas eran en fase. Escribir datos en una frecuencia más alta con el intervalo del pedacito de las pistas originales en 0.5 µm y el nuevo intervalo del pedacito de las pistas en 0.49 µm permite que una sola imagen de MFM contenga todas las diferencias de fase posibles, demostrando un aumento dramático en la anchura de la venda del borrar mientras que las dos pistas se mueven desde en fase a 180° de la fase [10].

Además, la nueva anchura de pista puede exhibir la modulación que depende de la relación de la fase entre los viejos y nuevos patrones, permitiendo que los datos anteriores sean recuperados aunque los viejos datos se modeló es no más distinta. El funcionamiento del sobreescribir también depende de la posición de la cabeza de escribir concerniente a la pista originalmente escrita. Si la cabeza se alinea directamente con la pista, sobreescribir el funcionamiento es relativamente bueno; pues la cabeza mueve el offtrack, el funcionamiento cae marcado mientras que los componentes el remanente de los datos originales se leen detrás junto con la señal nuevo-escrita. Este efecto es menos sensible pues los aumentos de la frecuencia del escribir debido a la mayor atenuación del campo con la distancia [11].

Cuando se combinan todos los factores antedichos resulta que cada pista contiene una imagen de todo escrito siempre a ella, pero que la contribución de cada “capa” consigue progresivamente más pequeño la parte posteriora posterior fue hecha. Las organizaciones de la inteligencia tienen muchos de maestría en la recuperación de estas imágenes palimpsestuous.

[editar] Borrado seguro de los datos almacenados en soportes magnéticos

El concepto general detrás de un esquema de sobreescritura es alterar de un tirón cada dominio magnético en el disco hacia ceros y unos tanto como sea posible (ésta es la idea básica detrás del degaussing) sin escribir el mismo patrón dos veces en una fila. Si los datos fuesen escritos directamente, podríamos elegir simplemente sobreescribir el patrón de unos y de ceros y lo escribimos en varias ocasiones. Sin embargo, los discos utilizan generalmente una cierta forma de codificación funcional limitada-longitud (RLL en inglés: Run-Lenght-Limited), de modo que las adyacentes no sean escritas. Esta codificación se utiliza para asegurarse de que las transiciones no están puestas demasiado cerca o demasiado apartadas unas de otras, ya que significaría muy a menudo para el sistema electrónico de los discos perder la pista de donde estaban los datos.

Para borrar soportes magnéticos, necesitamos sobreescribir muchas veces con patrones que se alternen para exponer los dominios a una campo magnético que oscila rápidamente, lo bastante para que altere de un tirón los dominios magnéticos en una cantidad de tiempo razonable. Desafortunadamente, se complica generar la señal que necesitamos para saturar la superficie de disco a la profundidad más grande posible, y de muy alta frecuencia solamente “rasguña la superficie” del soporte magnético (este fenómeno fue utilizado a buen efecto cuando los videocassetes de alta fidelidad fueron introducidos escribiendo la audioseñal estérea de FM en una frecuencia más baja debajo de la señal video de la alto-frecuencia, esta técnica era conocida como grabación de profundidad múltiplex). Los fabricantes de mecanismos de disco, al intentar alcanzar densidades siempre-más altas, utilizan las frecuencias más altas posible, mientras que realmente requerimos la frecuencia más baja que un mecanismo de disco puede producir. Incluso esto sigue siendo algo alto. Lo mejor que podemos hacer es utilizar la frecuencia más baja posible para sobreescribir, para penetrar tan profundamente como sea posible en el medio de grabación.

La frecuencia de escritura también determina con eficacia los datos anteriores pueden ser sobreescrito debido a la dependencia del campo necesitado para causar la conmutación magnética en la longitud del tiempo que se aplica el campo. Las pruebas en un número de cabezas típicas del accionamiento de disco han demostrado que una diferencia de DB hasta 20 adentro sobreescribe funcionamiento cuando los datos registrados en el kFCI 40 (cambios de flujo por pulgada), típico de accionamientos de disco recientes, se sobreescriben con una señal que varía a partir el kFCI la 0 a 100. El mejor funcionamiento medio para las varias cabezas aparece estar con una señal del sobreescribir del kFCI alrededor 10, con el funcionamiento peor estando en el kFCI 100 [12]. La pista escribe anchura también es afectada por la frecuencia del escribir - mientras que la frecuencia aumenta, la anchura del escribir disminuye para las cabezas de SR. y de TFI. De [13] había una disminución adentro escribe anchura de el alrededor 20% como la frecuencia del escribir fue aumentada a partir de la 1 al kFCI 40, con la disminución siendo la más marcada en el alto extremo de la gama de frecuencia. Sin embargo, la disminución adentro escribe anchura es balanceada por un aumento correspondiente en las dos vendas de la borradura lateral de modo que la suma de la constante de dos restos casi con frecuencia y el igual a la C.C. borren la anchura para la cabeza. El coercivity de los medios también afecta la anchura del escribir y borra vendas, con su anchura cayendo mientras que el coercivity aumenta (éste es una de las explicaciones para el coercivity cada vez mayor impulsiones más nuevas, de la alto-densidad).

Para intentar escribir a la frecuencia posible más baja nos debemos determinarnos qué descifró datos para escribir al producto una señal codificada de baja frecuencia.

Para entender la teoría detrás de la opción de los patrones de los datos para escribir, es necesario hechar una ojeada breve los métodos de la grabación usados en accionamientos de disco. El límite principal en densidad de grabación es que como se aumenta la densidad de pedacito, los picos en la señal análoga registrada en los medios están leídos en una tarifa que pueda hacerlos aparecer traslaparse, creando interferencia de intersímbolo que conduzca a los errores de los datos. El detector máximo tradicional leyó los canales intenta reducir la posibilidad de interferencia de intersímbolo cifrando datos de una manera tal que los picos de la señal análoga estén separados lo más lejos posible. El trazado de circuito leído puede entonces detectar exactamente los picos (la cabeza sí mismo detecta realmente solamente transiciones en la magnetización, así que el código más simple de la grabación utiliza una transición para codificar un 1 y la ausencia de una transición para codificar un 0. La transición causa un positivo/de cresta negativa en el voltaje principal de la salida (así el “el canal leído detector máximo conocido”). Para recuperar los datos, distinguimos la salida y buscamos los pasos a cero). Puesto que una secuencia larga de 0 hará registrar difícil, necesitamos fijar un límite en el número consecutivo máximo de 0. La separación de picos se pone en ejecución como cierta forma de funcionar-longitud-limitado, o de RLL, cifrando.

La codificación de RLL usada en las impulsiones más actuales es descrita por pares de los límites de la funcionar-longitud (d, k), donde está el número d mínimo de los símbolos 0 que deben ocurrir entre cada 1 símbolo en los datos codificados, y k es el máximo. Los parámetros (d, k) se eligen para colocar 1 adyacente suficientemente lejos aparte para evitar problemas con interferencia de intersímbolo, pero no hasta ahora aparte ésa que perdemos la sincronización.

El abuelo de todos los códigos de RLL era FM, que escribió un bit de datos del usuario seguido por un pedacito del reloj, de modo que un 1 pedacito fuera codificado como dos transiciones (1 longitud de onda) mientras que los 0 pedacitos fueron codificados como una transición (“longitud de onda). Un diverso acercamiento fue tomado en FM modificado (MFM), que suprime el pedacito del reloj a menos que entre 0 adyacente (la ambigüedad en el uso del término MFM es desafortunada. Aquí encendido de él será utilizado referir a FM modificado más bien que a microscopia magnética de la fuerza). Tomando tres secuencias 0000, 1111, y 1010 del ejemplo, éstos serán codificados como 0 (1) 0 (1) 0 (1) 0, 1 (0) 1 (0) 1 (0) 1, y 1 (0) 0 (0) 1 (0) 0 (donde () está los pedacitos el s del reloj insertados por el proceso de codificación). El tiempo máximo entre los pedacitos 1 ahora es tres pedacitos 0 (de modo que los picos no sean no más de cuatro períodos codificados aparte), y hay siempre por lo menos un 0 pedacitos (de modo que los picos en la señal análoga sean por lo menos dos períodos codificados aparte), dando por resultado código de a (1.3) RLL. (1.3) RLL/MFM es el más viejo código todavía en general utiliza hoy, pero realmente se utiliza solamente en las impulsiones flojas que necesitan seguir siendo al revés-compatibles.

Estos apremios ayudan a evitar interferencia de intersímbolo, pero la necesidad de separar los picos reduce la densidad de grabación y por lo tanto la cantidad de datos que se puedan almacenar en un disco. Para aumentar la densidad de grabación, MFM fue substituido gradualmente por (2.7) RLL (el formato original de “RLL”), y ése alternadamente por (1.7) RLL, que pusieron menos apremios en la señal registrada.

Usando nuestro conocimiento de cómo se codifican los datos, podemos ahora elegir que descifraron patrones de los datos para escribir para obtener la señal codificada deseada. Los tres métodos de codificación descritos arriba cubren a mayoría extensa de accionamientos de disco magnético. Sin embargo, cada uno de éstos tiene varias variantes posibles. Con MFM, solamente uno se utiliza con cualquier frecuencia, pero los más nuevo (1.7) códigos de RLL tienen por lo menos media docena de las variantes funcionando. Para MFM con a lo más cuatro veces del pedacito entre las transiciones, el más bajos escriben la frecuencia posible son logrados escribiendo a los patrones descifrados de repetición de los datos 1010 y 0101. Éstos tienen un 1 pedacito cada otro pedacito de los “datos”, y los pedacitos del “reloj que intervienen” son el 0. También quisiéramos patrones con cada otro sistema del pedacito del reloj a 1 y todos los otros fijan a 0, pero éstos no son posibles en la codificación de MFM (tales “violaciones” se utilizan para generar marcas especiales en el disco para identificar límites del sector). El mejor que podemos hacer aquí es tres veces del pedacito entre las transiciones, que es generada repitiendo los patrones descifrados 100100, 010010 y 001001. Debemos utilizar varios pasos con estos patrones, como las impulsiones de MFM son las más viejas, bajo-densidad conducimos alrededor (ésta es especialmente verdad para las impulsiones flojas de la muy-bajo-densidad). Como tal, son el más fáciles recuperar datos con del equipo moderno y necesitamos tomar la mayoría del cuidado con ellos.

De MFM saltamos al caso más simple siguiente, que es (1.7) RLL. Aunque puede haber tanto como 8 veces del pedacito entre las transiciones, la frecuencia sostenida más baja que podemos tener en la práctica es 6 veces del pedacito entre las transiciones. Esto es una característica deseable desde el punto de vista del trazado de circuito de la reloj-recuperación, y todos los (1.7) códigos de RLL se parecen tener esta característica. Ahora necesitamos encontrar una manera de escribir el patrón deseado sin saber (los 1.7) códigos particular de RLL usados. Podemos hacer esto mirando la manera las impulsiones que el sistema error-correction trabaja. La corrección de error se aplica a los datos descifrados, aun cuando errores ocurre generalmente en los datos codificados. Para hacer este trabajo bien, la codificación de los datos debe haber limitado la amplificación del error, de modo que un pedacito codificado erróneo deba afectar solamente un número pequeño, finito de pedacitos descifrados.

Los pedacitos descifrados por lo tanto dependen solamente de pedacitos codificados próximos, de modo que un patrón de repetición de pedacitos codificados corresponda a un patrón de repetición de pedacitos descifrados. El patrón de repetición de pedacitos codificados es 6 pedacitos de largo. Puesto que el índice del código es 2/3, éste corresponde a un patrón de repetición de 4 pedacitos descifrados. Hay solamente 16 posibilidades de este patrón, haciéndolo factible para escribir todos durante el proceso del borrar. Para alcanzar tan buen sobreescribir (de 1.7) discos de RLL, escribimos los patrones 0000, 0001, 0010, 0011, 0100, 0101, 0110, 0111, 1000, 1001, 1010, 1011, 1100, 1101, 1110, y 1111. Estos patrones también cubren convenientemente dos de los que está necesitados para MFM sobreescriben, aunque debemos agregar algunas más iteraciones de los patrones MFM-específicos por las razones dadas arriba.

Finalmente, tenemos (2.7) impulsiones de RLL. Éstos son similares a MFM en que una señal del ocho-pedacito-tiempo se puede escribir en algunas fases, pero no todos. Una señal del seis-pedacito-tiempo completará las grietas restantes. Usando de “tarifa codificación, una señal del ocho-pedacito-tiempo corresponde a un patrón de repetición de 4 bits de datos. (Los 2.7) códigos más común de RLL se demuestran abajo:

(Los 2.7) códigos más común de RLL

[editar] Datos descifrados

(2.7) Datos codificados RLL

00    1000 
01    0100 
100   001000 
101   100100 
111   000100 
1100  00001000
1101  00100100 

Los segundo (2.7) códigos común de RLL son iguales pero con los “datos descifrados” complementados, que no altera estos patrones. Escribir los datos codificados requeridos se puede alcanzar para cada otra fase usando patrones de 0x33, de 0x66, de 0xCC y de 0x99, que se escriben ya para (1.7) impulsiones de RLL.

los patrones del Seis-pedacito-tiempo se pueden escribir usando el pedacito 3 que repite patrones. Los todos-cero y todos-uno patrones se traslapan con (los 1.7) patrones de RLL, saliendo de seis otros:

     001001001001001001001001 2 4 9 2 4 9

en binario o 0x24 0x92 0x49, 0x92 0x49 0x24 y 0x49 0x24 0x92 en tuerca hexagonal, y

     011011011011011011011011 6 D B 6 D B

en binario o 0x6D 0xB6 0xDB, 0xB6 0xDB 0x6D y 0xDB 0x6D 0xB6 en tuerca hexagonal. Los primeros tres son iguales que los patrones de MFM, así que necesitamos solamente tres patrones adicionales cubrir (2.7) impulsiones de RLL.

Aunque (1.7) es más popular en las impulsiones recientes (post-1990), algunas más viejas impulsiones duras el uso inmóvil (2.7) RLL, y con la confiabilidad cada vez mayor de más nuevas impulsiones es probable que sigan siendo funcionando por un cierto tiempo para venir, a menudo siendo pasado abajo a partir de una máquina a otra. Los tres patrones antedichos también cubren cualquier problema con las ediciones del endianness, que no eran una preocupación en los dos casos anteriores, pero estarían en este caso (realmente, agradece a la influencia fuerte de las impulsiones del chasis de IBM, toda se parece ser uniformemente grande-endian dentro de octetos, con el pedacito más significativo que es escrito al disco primero).

Las impulsiones de alta densidad más últimas utilizan métodos como la codificación de la probabilidad máxima de la Parcial-Respuesta (PRML), que se puede comparar áspero a la codificación del enrejado hecha por los módems V.32 en que es eficaz pero de cómputo costoso. Los códigos de PRML son códigos inmóviles de RLL, pero con apremios algo diversos. Un código típico pudo tener (0.4.4) apremios en los cuales el 0 significa que 1 en una secuencia de datos puede ocurrir a la derecha al lado de 0 (para no separar picos en la señal análoga del repaso), los primeros 4 significa que no puede haber no más de cuatro 0 entre 1 en una secuencia de datos, y los segundos 4 especifica el número máximo de 0 entre 1 en ciertos subsequences del símbolo. Los códigos de PRML evitan errores intersímbolos de la influencia usando técnicas de filtración digitales para formar la señal leída de exhibir desearon la frecuencia y las características que miden el tiempo (ésta es la pieza de la “respuesta parcial” de PRML) seguidas por la detección digital de los datos de la probabilidad máxima para determinar la secuencia más probable de los bits de datos que fue escrita al disco (ésta es la pieza de la “toda probabilidad” de PRML). Los canales de PRML alcanzan la misma tarifa de error baja de pedacito que métodos estándares de la pico-detección, pero con densidades de grabación mucho más altas, mientras que usan las mismas cabezas y medios. Varios fabricantes se contratan actualmente a mover sus líneas de productos pico-detección-basadas a través a PRML, dando a un excedente del aumento de la densidad 30-40% los canales estándares de RLL [14].

Puesto que los códigos de PRML no intentan separar los picos de la misma forma que lo hacen los códigos del non-PRML RLL, todos lo que podemos hacer son escribir una variedad de patrones al azar porque el proceso dentro de la impulsión es demasiado complejo a la segunda conjetura. Afortunadamente, empuje de estas impulsiones que los límites impulsiones magnéticas de los soportes mucho más que de las más viejas hicieron siempre codificando datos con dominios magnéticos mucho más pequeños, más cercano a la capacidad física de los soportes magnéticos (el estado plus ultra actual en impulsiones de PRML tiene una densidad de la pista de alrededor 6700 TPI (pistas por pulgada) y una densidad de la grabación de datos 170 del kFCI, casi doble el (de los 1.7) equivalentes más cercano de RLL. Un efecto secundario conveniente de estas densidades de grabación muy altas es que una transición escrita puede experimentar los ciclos del campo del escribir para las transiciones sucesivas, especialmente en la pista afila donde está mucho más amplia la distribución del campo [15]. Puesto que aquí es también donde están más probable los datos el remanente ser encontrado, éste puede ayudar solamente en la reducción de la recuperabilidad de los datos). Si estas impulsiones requieren el proceso de señal sofisticado apenas leer los datos lo más recientemente posible escritos, la lectura de capas sobreescritas es también correspondientemente más difícil. El buen fregar con datos al azar hará sobre tan bien como puede esperar.

Ahora hacemos que un sistema de 22 sobreescriba los patrones que deben borrar todo, sin importar la codificación cruda. El borrador básico del disco puede ser mejorado levemente agregando pasos al azar antes y después el proceso del borrar, y realizando los pasos deterministas en orden al azar para hacerla más difícil de conjeturar cuáles de los pasos sabidos de los datos fueron hechos en qué punto. Para tratar de todo el esto en el proceso del sobreescribir, utilizamos la secuencia de 35 consecutivos escribimos demostrado abajo:

[editar] Sobreescribir los datos

Pasar no.

Datos escritos

El esquema de codificación apuntó

 1   Al azar 
 2   Al azar 
 3   Al azar 
 4   Al azar 
 5   01010101 01010101 01010101 0x55   (1.7) RLL  MFM 
 6   10101010 10101010 10101010 0xAA   (1.7) RLL  MFM 
 7   10010010 01001001 00100100 0x92 0x49 0x24  (2.7) RLL  MFM 
 8   01001001 00100100 10010010 0x49 0x24 0x92  (2.7) RLL  MFM 
 9   00100100 10010010 01001001 0x24 0x92 0x49  (2.7) RLL  MFM 
 10  00000000 00000000 00000000 0x00   (1.7) RLL  (2.7) RLL
 11  00010001 00010001 00010001 0x11   (1.7) RLL
 12  00100010 00100010 00100010 0x22   (1.7) RLL
 13  00110011 00110011 00110011 0x33   (1.7) RLL  (2.7) RLL
 14  01000100 01000100 01000100 0x44   (1.7) RLL
 15  01010101 01010101 01010101 0x55   (1.7) RLL  MFM 
 16  01100110 01100110 01100110 0x66   (1.7) RLL  (2.7) RLL
 17  01110111 01110111 01110111 0x77   (1.7) RLL
 18  10001000 10001000 10001000 0x88   (1.7) RLL
 19  10011001 10011001 10011001 0x99   (1.7) RLL  (2.7) RLL
 20  10101010 10101010 10101010 0xAA   (1.7) RLL  MFM 
 21  10111011 10111011 10111011 0xBB   (1.7) RLL
 22  11001100 11001100 11001100 0xCC   (1.7) RLL  (2.7) RLL
 23  11011101 11011101 11011101 0xDD   (1.7) RLL
 24  11101110 11101110 11101110 0xEE   (1.7) RLL
 25  11111111 11111111 11111111 0xFF   (1.7) RLL  (2.7) RLL
 26  10010010 01001001 00100100 0x92 0x49 0x24  (2.7) RLL  MFM 
 27  01001001 00100100 10010010 0x49 0x24 0x92  (2.7) RLL  MFM 
 28  00100100 10010010 01001001 0x24 0x92 0x49  (2.7) RLL  MFM 
 29  01101101 10110110 11011011 0x6D 0xB6 0xDB  (2.7) RLL
 30  10110110 11011011 01101101 0xB6 0xDB 0x6D  (2.7) RLL
 31  11011011 01101101 10110110 0xDB 0x6D 0xB6  (2.7) RLL
 32  Al azar 
 33  Al azar 
 34  Al azar 
 35  Al azar 

Los patrones MFM-específicos se repiten dos veces porque las impulsiones de MFM tienen la densidad más baja y son así particularmente fáciles de examinar. Los patrones deterministas entre el al azar escriben se permutan antes de que se realice el escribir, para hacerlo más difícil para que un opositor utilice el conocimiento de los datos de la borradura escritos para procurar recuperar los datos sobreescritos (de hecho necesitamos utilizar un generador cryptographically fuerte del número al azar para realizar las permutaciones para evitar el problema de un opositor que pueda leer el último sobreescriba el paso que puede predecir los pasos anteriores y “los pasos de la cancelación del eco” restando sabido sobreescriben datos).

Si el dispositivo que es escrito a las ayudas que depositan o que protegen de los datos, éste se inhabilita para asegurarse de que el disco físico escribe está realizado para cada paso en vez de todo solamente el paso pasado que es perdido en el buffering. Por ejemplo el acceso de disco físico puede ser forzado durante SCSI-2 el grupo 1 escribe comandos fijando el pedacito del acceso de la unidad de la fuerza en el bloque del comando de SCSI (aunque por lo menos una impulsión popular tiene un insecto que cause todo escriba para ser no hecho caso cuando se fija este pedacito - recuerda probar tu sobreescribe esquema antes de que lo despliegues). Otra consideración que necesita considerado al intentar borrar datos a través de software es que las impulsiones conforme a algunos de los protocolos de alto nivel tales como los varios estándares de SCSI son relativamente libremente interpretar los comandos enviados a ellos en cualquier manera eligen (mientras todavía se conforman con la especificación de SCSI). Así algo conduce, si está enviada un comando de la UNIDAD del FORMATO puede volver inmediatamente sin la ejecución de ninguna acción, puede realizar simplemente una prueba leída en el disco entero (la opción más común), o puede escribir realmente datos al disco (el estándar de SCSI- 2 incluye una opción del patrón de la inicialización (IP) para el comando de la UNIDAD del FORMATO, no obstante esto no es apoyada necesariamente por las impulsiones existentes).

Si los datos son muy sensibles y se almacenan en diskette, pueden ser destruidos lo más mejor posible quitando los medios del trazador de líneas del disco y quemándose los, o quemándose el disco, el trazador de líneas y el todo enteros (la mayoría de las diskettes se queman notable bien - no obstante con cantidades de humo aceitoso - y salen de residuo muy pequeño).

[editar] Otros métodos de borrar soportes magnéticos

La sección anterior se ha concentrado en los métodos de la borradura que no requieren ningún equipo especializado realizar la borradura. Medios alternativos de borrar los medios que requieren el equipo especializado degaussing (un proceso en el cual los medios de la grabación se vuelven a su estado inicial) y física destrucción. Degaussing es los medios razonablemente eficaces de purgar datos de medios del disco magnético, e incluso trabajará a través de la mayoría de los casos de la impulsión (la investigación ha demostrado que las cubiertas del aluminio de la mayoría de los accionamientos de disco atenúan el campo degaussing por DB solamente cerca de 2 [16]).

La conmutación de una partícula magnética del solo-dominio a partir de una dirección de la magnetización a otra requiere la superación de una barrera de la energía, con un campo magnético externo ayudando a bajar esta barrera. La conmutación depende no sólo de la magnitud del campo externo, pero también de la longitud del tiempo la cual se solicita. Para los medios típicos del accionamiento de disco, el campo a corto plazo necesitado para mover de un tirón bastantes de los dominios magnéticos para ser útil en la registración de una señal es cerca de 1/3 más alto que el coercivity de los medios (la figura exacta varía con diversos tipos de medios) [17].

Sin embargo, borrar con eficacia un medio hasta el punto de la recuperación de datos de ella llegue a ser poco económica requiere una fuerza magnética de cerca de cinco veces el coercivity del medio [18], aunque incluso los campos magnéticos externos pequeños son suficientes trastornar la operación normal de un disco duro (típicamente algún gauss en la C.C., cayendo a algunos milligauss en 1 megaciclo). El Coercivity (medido en los oerstedes, Oe) es una característica del material magnético y se define pues la cantidad de campo magnético necesaria para reducir la inducción magnética en el material a cero - cuanto más alto es el coercivity, más duro es borrar datos de un medio. Las figuras típicas para los varios tipos de soportes magnéticos se dan abajo: Figuras típicas del Coercivity de los medios

 Medio                    Coercivity 
 5.25" 360K floppy disk    300 Oe 
 5.25" 1.2M floppy disk    675 Oe 
 3.5" 720K floppy disk     300 Oe 
 3.5" 1.44M floppy disk    700 Oe 
 3.5" 2.88M floppy disk    750 Oe 
 3.5" 21M floptical disk   750 Oe 
 Older (1980's) hard disks   900-1400 Oe 
 Newer (1990's) hard disks   1400-2200 Oe
 1/2" magnetic tape   300 Oe 
 1/4" QIC tape   550 Oe 
 8 mm metallic particle tape  1500 Oe 
 DAT metallic particle tape   1500 Oe 

US Government guidelines class tapes of 350 Oe coercivity or less as low-energy or Class I tapes and tapes of 350-750 Oe coercivity as high-energy or Class II tapes. Degaussers are available for both types of tapes. Tapes of over 750 Oe coercivity are referred to as Class III, with no known degaussers capable of fully erasing them being known [19], since even the most powerful commercial AC degausser cannot generate the recommended 7,500 Oe needed for full erasure of a typical DAT tape currently used for data backups.

Degaussing of disk media is somewhat more difficult - even older hard disks generally have a coercivity equivalent to Class III tapes, making them fairly difficult to erase at the outset. Since manufacturers rate their degaussers in peak gauss and measure the field at a certain orientation which may not be correct for the type of medium being erased, and since degaussers tend to be rated by whether they erase sufficiently for clean rerecording rather than whether they make the information impossible to recover, it may be necessary to resort to physical destruction of the media to completely sanitise it (in fact since degaussing destroys the sync bytes, ID fields, error correction information, and other paraphernalia needed to identify sectors on the media, thus rendering the drive unusable, it makes the degaussing process mostly equivalent to physical destruction). In addition, like physical destruction, it requires highly specialised equipment which is expensive and difficult to obtain (one example of an adequate degausser was the 2.5 MW Navy research magnet used by a former Pentagon site manager to degauss a 14" hard drive for 1« minutes. It bent the platters on the drive and probably succeeded in erasing it beyond the capabilities of any data recovery attempts [20]).

[editar] Further Problems with Magnetic Media

A major issue which cannot be easily addressed using any standard software-based overwrite technique is the problem of defective sector handling. When the drive is manufactured, the surface is scanned for defects which are added to a defect list or flaw map. If further defects, called grown defects, occur during the life of the drive, they are added to the defect list by the drive or by drive management software. There are several techniques which are used to mask the defects in the defect list. The first, alternate tracks, moves data from tracks with defects to known good tracks. This scheme is the simplest, but carries a high access cost, as each read from a track with defects requires seeking to the alternate track and a rotational latency delay while waiting for the data location to appear under the head, performing the read or write, and, if the transfer is to continue onto a neighbouring track, seeking back to the original position. Alternate tracks may be interspersed among data tracks to minimise the seek time to access them.

A second technique, alternate sectors, allocates alternate sectors at the end of the track to minimise seeks caused by defective sectors. This eliminates the seek delay, but still carries some overhead due to rotational latency. In addition it reduces the usable storage capacity by 1-3%.

A third technique, inline sector sparing, again allocates a spare sector at the end of each track, but resequences the sector ID's to skip the defective sector and include the spare sector at the end of the track, in effect pushing the sectors past the defective one towards the end of the track. The associated cost is the lowest of the three, being one sector time to skip the defective sector [21].

The handling of mapped-out sectors and tracks is an issue which can't be easily resolved without the cooperation of hard drive manufacturers. Although some SCSI and IDE hard drives may allow access to defect lists and even to mapped-out areas, this must be done in a highly manufacturer- and drive-specific manner. For example the SCSI-2 READ DEFECT DATA command can be used to obtain a list of all defective areas on the drive. Since SCSI logical block numbers may be mapped to arbitrary locations on the disk, the defect list is recorded in terms of heads, tracks, and sectors. As all SCSI device addressing is performed in terms of logical block numbers, mapped-out sectors or tracks cannot be addressed. The only reasonably portable possibility is to clear various automatic correction flags in the read-write error recovery mode page to force the SCSI device to report read/write errors to the user instead of transparently remapping the defective areas. The user can then use the READ LONG and WRITE LONG commands (which allow access to sectors and extra data even in the presence of read/write errors), to perform any necessary operations on the defective areas, and then use the REASSIGN BLOCKS command to reassign the defective sections. However this operation requires an in-depth knowledge of the operation of the SCSI device and extensive changes to disk drivers, and more or less defeats the purpose of having an intelligent peripheral.

The ANSI X3T-10 and X3T-13 subcommittees are currently looking at creating new standards for a Universal Security Reformat command for IDE and SCSI hard disks which will address these issues. This will involve a multiple-pass overwrite process which covers mapped-out disk areas with deliberate off-track writing. Many drives available today can be modified for secure erasure through a firmware upgrade, and once the new firmware is in place the erase procedure is handled by the drive itself, making unnecessary any interaction with the host system beyond the sending of the command which begins the erase process.

Long-term ageing can also have a marked effect on the erasability of magnetic media. For example, some types of magnetic tape become increasingly difficult to erase after being stored at an elevated temperature or having contained the same magnetization pattern for a considerable period of time [22]. The same applies for magnetic disk media, with decreases in erasability of several dB being recorded [23]. The erasability of the data depends on the amount of time it has been stored on the media, not on the age of the media itself (so that, for example, a five-year-old freshly-written disk is no less erasable than a new freshly-written disk).

The dependence of media coercivity on temperature can affect overwrite capability if the data was initially recorded at a temperature where the coercivity was low (so that the recorded pattern penetrated deep into the media), but must be overwritten at a temperature where the coercivity is relatively high. This is important in hard disk drives, where the temperature varies depending on how long the unit has been used and, in the case of drives with power-saving features enabled, how recently and frequently it has been used. However the overwrite performance depends not only on temperature-dependent changes in the media, but also on temperature-dependent changes in the read/write head. Thankfully the combination of the most common media used in current drives with various common types of read/write heads produce a change in overwrite performance of only a few hundredths of a decibel per degree over the temperature range -40°C to + 40°C, as changes in the head compensate for changes in the media [24].

Another issue which needs to be taken into account is the ability of most newer storage devices to recover from having a remarkable amount of damage inflicted on them through the use of various error-correction schemes. As increasing storage densities began to lead to multiple-bit errors, manufacturers started using sophisticated error-correction codes (ECC's) capable of correcting multiple error bursts. A typical drive might have 512 bytes of data, 4 bytes of CRC, and 11 bytes of ECC per sector. This ECC would be capable of correcting single burst errors of up to 22 bits or double burst errors of up to 11 bits, and can detect a single burst error of up to 51 bits or three burst errors of up to 11 bits in length [25]. Another drive manufacturer quotes the ability to correct up to 120 bits, or up to 32 bits on the fly, using 198-bit Reed-Solomon ECC [26]. Therefore even if some data is reliably erased, it may be possible to recover it using the built-in error-correction capabilities of the drive. Conversely, any erasure scheme which manages to destroy the ECC information (for example through the use of the SCSI-2 WRITE LONG command which can be used to write to areas of a disk sector outside the normal data areas) stands a greater chance of making the data unrecoverable.

[editar] Sidestepping the Proble m

The easiest way to solve the problem of erasing sensitive information from magnetic media is to ensure that it never gets to the media in the first place. Although not practical for general data, it is often worthwhile to take steps to keep particularly important information such as encryption keys from ever being written to disk. This would typically happen when the memory containing the keys is paged out to disk by the operating system, where they can then be recovered at a later date, either manually or using software which is aware of the in-memory data format and can locate it automatically in the swap file (for example there exists software which will search the Windows swap file for keys from certain DOS encryption programs). An even worse situation occurs when the data is paged over a network, allowing anyone with a packet sniffer or similar tool on the same subnet to observe the information (for example there exists software which will monitor and even alter NFS traffic on the fly which could be modified to look for known in-memory data patterns moving to and from a networked swap disk [27]).

To solve these problems the memory pages containing the information can be locked to prevent them from being paged to disk or transmitted over a network. This approach is taken by at least one encryption library, which allocates all keying information inside protected memory blocks visible to the user only as opaque handles, and then optionally locks the memory (provided the underlying OS allows it) to prevent it from being paged [28]. The exact details of locking pages in memory depend on the operating system being used. Many Unix systems now support the mlock()/munlock() calls or have some alternative mechanism hidden among the mmap()-related functions which can be used to lock pages in memory. Unfortunately these operations require superuser privileges because of their potential impact on system performance if large ranges of memory are locked. Other systems such as Microsoft Windows NT allow user processes to lock memory with the VirtualLock()/VirtualUnlock() calls, but limit the total number of regions which can be locked.

Most paging algorithms are relatively insensitive to having sections of memory locked, and can even relocate the locked pages (since the logical to physical mapping is invisible to the user), or can move the pages to a "safe" location when the memory is first locked. The main effect of locking pages in memory is to increase the minimum working set size which, taken in moderation, has little noticeable effect on performance. The overall effects depend on the operating system and/or hardware implementations of virtual memory. Most Unix systems have a global page replacement policy in which a page fault may be satisfied by any page frame. A smaller number of operating systems use a local page replacement policy in which pages are allocated from a fixed (or occasionally dynamically variable) number of page frames allocated on a per- process basis. This makes them much more sensitive to the effects of locking pages, since every locked page decreases the (finite) number of pages available to the process. On the other hand it makes the system as a whole less sensitive to the effects of one process locking a large number of pages. The main effective difference between the two is that under a local replacement policy a process can only lock a small fixed number of pages without affecting other processes, whereas under a global replacement policy the number of pages a process can lock is determined on a system-wide basis and may be affected by other processes.

In practice neither of these allocation strategies seem to cause any real problems. Although any practical measurements are very difficult to perform since they vary wildly depending on the amount of physical memory present, paging strategy, operating system, and system load, in practice locking a dozen 1K regions of memory (which might be typical of a system on which a number of users are running programs such as mail encryption software) produced no noticeable performance degradation observable by system- monitoring tools. On machines such as network servers handling large numbers of secure connections (for example an HTTP server using SSL), the effects of locking large numbers of pages may be more noticeable.

[editar] Methods of Recovery for Data stored in Random-Access Memory

Contrary to conventional wisdom, "volatile" semiconductor memory does not entirely lose its contents when power is removed. Both static (SRAM) and dynamic (DRAM) memory retains some information on the data stored in it while power was still applied. SRAM is particularly susceptible to this problem, as storing the same data in it over a long period of time has the effect of altering the preferred power-up state to the state which was stored when power was removed. Older SRAM chips could often "remember" the previously held state for several days. In fact, it is possible to manufacture SRAM's which always have a certain state on power-up, but which can be overwritten later on - a kind of "writeable ROM".

DRAM can also "remember" the last stored state, but in a slightly different way. It isn't so much that the charge (in the sense of a voltage appearing across a capacitance) is retained by the RAM cells, but that the thin oxide which forms the storage capacitor dielectric is highly stressed by the applied field, or is not stressed by the field, so that the properties of the oxide change slightly depending on the state of the data. One thing that can cause a threshold shift in the RAM cells is ionic contamination of the cell(s) of interest, although such contamination is rarer now than it used to be because of robotic handling of the materials and because the purity of the chemicals used is greatly improved. However, even a perfect oxide is subject to having its properties changed by an applied field. When it comes to contaminants, sodium is the most common offender - it is found virtually everywhere, and is a fairly small (and therefore mobile) atom with a positive charge. In the presence of an electric field, it migrates towards the negative pole with a velocity which depends on temperature, the concentration of the sodium, the oxide quality, and the other impurities in the oxide such as dopants from the processing. If the electric field is zero and given enough time, this stress tends to dissipate eventually.

The stress on the cell is a cumulative effect, much like charging an RC circuit. If the data is applied for only a few milliseconds then there is very little "learning" of the cell, but if it is applied for hours then the cell will acquire a strong (relatively speaking) change in its threshold. The effects of the stress on the RAM cells can be measured using the built-in self test capabilities of the cells, which provide the ability to impress a weak voltage on a storage cell in order to measure its margin. Cells will show different margins depending on how much oxide stress has been present. Many DRAM's have undocumented test modes which allow some normal I/O pin to become the power supply for the RAM core when the special mode is active. These test modes are typically activated by running the RAM in a nonstandard configuration, so that a certain set of states which would not occur in a normally-functioning system has to be traversed to activate the mode. Manufacturers won't admit to such capabilities in their products because they don't want their customers using them and potentially rejecting devices which comply with their spec sheets, but have little margin beyond that.

A simple but somewhat destructive method to speed up the annihilation of stored bits in semiconductor memory is to heat it. Both DRAM's and SRAM's will lose their contents a lot more quickly at Tjunction = 140°C than they will at room temperature. Several hours at this temperature with no power applied will clear their contents sufficiently to make recovery difficult. Conversely, to extend the life of stored bits with the power removed, the temperature should be dropped below -60°C. Such cooling should lead to weeks, instead of hours or days, of data retention.

[editar] Erasure of Data stored in Random-Access Memory

Simply repeatedly overwriting the data held in DRAM with new data isn't nearly as effective as it is for magnetic media. The new data will begin stressing or relaxing the oxide as soon as it is written, and the oxide will immediately begin to take a "set" which will either reinforce the previous "set" or will weaken it. The greater the amount of time that new data has existed in the cell, the more the old stress is "diluted", and the less reliable the information extraction will be. Generally, the rates of change due to stress and relaxation are in the same order of magnitude. Thus, a few microseconds of storing the opposite data to the currently stored value will have little effect on the oxide. Ideally, the oxide should be exposed to as much stress at the highest feasible temperature and for as long as possible to get the greatest "erasure" of the data. Unfortunately if carried too far this has a rather detrimental effect on the life expectancy of the RAM.

Therefore the goal to aim for when sanitising memory is to store the data for as long as possible rather than trying to change it as often as possible. Conversely, storing the data for as short a time as possible will reduce the chances of it being "remembered" by the cell. Based on tests on DRAM cells, a storage time of one second causes such a small change in threshold that it probably isn't detectable. On the other hand, one minute is probably detectable, and 10 minutes is certainly detectable.

The most practical solution to the problem of DRAM data retention is therefore to constantly flip the bits in memory to ensure that a memory cell never holds a charge long enough for it to be "remembered". While not practical for general use, it is possible to do this for small amounts of very sensitive data such as encryption keys. This is particularly advisable where keys are stored in the same memory location for long periods of time and control access to large amounts of information, such as keys used for transparent encryption of files on disk drives. The bit-flipping also has the convenient side-effect of keeping the page containing the encryption keys at the top of the queue maintained by the system's paging mechanism, greatly reducing the chances of it being paged to disk at some point.

[editar] Conclusion

Data overwritten once or twice may be recovered by subtracting what is expected to be read from a storage location from what is actually read. Data which is overwritten an arbitrarily large number of times can still be recovered provided that the new data isn't written to the same location as the original data (for magnetic media), or that the recovery attempt is carried out fairly soon after the new data was written (for RAM). For this reason it is effectively impossible to sanitise storage locations by simple overwriting them, no matter how many overwrite passes are made or what data patterns are written. However by using the relatively simple methods presented in this paper the task of an attacker can be made significantly more difficult, if not prohibitively expensive.

[editar] Epilogue

In the time since this paper was published, some people have treated the 35-pass overwrite technique described in it more as a kind of voodoo incantation to banish evil spirits than the result of a technical analysis of drive encoding techniques. As a result, they advocate applying the voodoo to PRML and EPRML drives even though it will have no more effect than a simple scrubbing with random data. In fact performing the full 35-pass overwrite is pointless for any drive since it targets a blend of scenarios involving all types of (normally-used) encoding technology, which covers everything back to 30+-year-old MFM methods (if you don't understand that statement, re-read the paper). If you're using a drive which uses encoding technology X, you only need to perform the passes specific to X, and you never need to perform all 35 passes. For any modern PRML/EPRML drive, a few passes of random scrubbing is the best you can do. As the paper says, "A good scrubbing with random data will do about as well as can be expected". This was true in 1996, and is still true now.

Looking at this from the other point of view, with the ever-increasing data density on disk platters and a corresponding reduction in feature size and use of exotic techniques to record data on the medium, it's unlikely that anything can be recovered from any recent drive except perhaps one or two levels via basic error-cancelling techniques. In particular the the drives in use at the time that this paper was originally written have mostly fallen out of use, so the methods that applied specifically to the older, lower-density technology don't apply any more. Conversely, with modern high-density drives, even if you've got 10KB of sensitive data on a drive and can't erase it with 100% certainty, the chances of an adversary being able to find the erased traces of that 10KB in 80GB of other erased traces are close to zero.

[editar] Acknowledgments

The author would like to thank Nigel Bree, Peter Fenwick, Andy Hospodor, Kevin Martinez, Colin Plumb, and Charles Preston for their advice and input during the preparation of this paper.

References

[1] "Emergency Destruction of Information Storing Media", M.Slusarczuk et al, Institute for Defense Analyses, December 1987.
 [2] "A Guide to Understanding Data Remanence in Automated Information Systems", National Computer Security Centre, September 1991.
 [3] "Detection of Digital Information from Erased Magnetic Disks", Venugopal Veeravalli, Masters thesis, Carnegie-Mellon University, 1987.
 [4] "Magnetic force microscopy: General principles and application to longitudinal recording media", D.Rugar, H.Mamin, P.Guenther, S.Lambert, J.Stern, I.McFadyen, and T.Yogi, Journal of Applied Physics, Vol.68, No.3 (August 1990), p.1169.
 [5] "Tunneling-stabilized Magnetic Force Microscopy of Bit Tracks on a Hard Disk", Paul Rice and John Moreland, IEEE Trans.on Magnetics, Vol.27, No.3 (May 1991), p.3452.
 [6] "NanoTools: The Homebrew STM Page", Jim Rice, NanoTools: The Homebrew STM Page (now defunct). This page became Angstrom Tools LLC, the best equivalent of the old NanoTools page is the General STM Info page. 
[7] "Magnetic Force Scanning Tunnelling Microscope Imaging of Overwritten Data", Romel Gomez, Amr Adly, Isaak Mayergoyz, Edward Burke, IEEE Trans.on Magnetics, Vol.28, No.5 (September 1992), p.3141.
 [8] "Comparison of Magnetic Fields of Thin-Film Heads and Their Corresponding Patterns Using Magnetic Force Microscopy", Paul Rice, Bill Hallett, and John Moreland, IEEE Trans.on Magnetics, Vol.30, No.6 (November 1994), p.4248.
 [9] "Computation of Magnetic Fields in Hysteretic Media", Amr Adly, Isaak Mayergoyz, Edward Burke, IEEE Trans.on Magnetics, Vol.29, No.6 (November 1993), p.2380.
 [10] "Magnetic Force Microscopy Study of Edge Overwrite Characteristics in Thin Film Media", Jian- Gang Zhu, Yansheng Luo, and Juren Ding, IEEE Trans.on Magnetics, Vol.30, No.6 (November 1994), p.4242.
 [11] "Microscopic Investigations of Overwritten Data", Romel Gomez, Edward Burke, Amr Adly, Isaak Mayergoyz, J.Gorczyca, Journal of Applied Physics, Vol.73, No.10 (May 1993), p.6001.
 [12] "Relationship between Overwrite and Transition Shift in Perpendicular Magnetic Recording", Hiroaki Muraoka, Satoshi Ohki, and Yoshihisa Nakamura, IEEE Trans.on Magnetics, Vol.30, No.6 (November 1994), p.4272.
 [13] "Effects of Current and Frequency on Write, Read, and Erase Widths for Thin-Film Inductive and Magnetoresistive Heads", Tsann Lin, Jodie Christner, Terry Mitchell, Jing-Sheng Gau, and Peter George, IEEE Trans.on Magnetics, Vol.25, No.1 (January 1989), p.710.
 [14] "PRML Read Channels: Bringing Higher Densities and Performance to New-Generation Hard Drives", Quantum Corporation, 1995.
 [15] "Density and Phase Dependence of Edge Erase Band in MR/Thin Film Head Recording", Yansheng Luo, Terence Lam, Jian-Gang Zhu, IEEE Trans.on Magnetics, Vol.31, No.6 (November 1995), p.3105.
 [16] "A Guide to Understanding Data Remanence in Automated Information Systems", National Computer Security Centre, September 1991.
 [17] "Time-dependant Magnetic Phenomena and Particle-size Effects in Recording Media", IEEE Trans.on Magnetics, Vol.26, No.1 (January 1990), p.193.
 [18] "The Data Dilemna", Charles Preston, Security Management Journal, February 1995.
 [19] "Magnetic Tape Degausser", NSA/CSS Specification L14-4-A, 31 October 1985.
 [20] "How many times erased does DoD want?", David Hayes, posting to comp.periphs.scsi newsgroup, 24 July 1991, message-ID 1991Jul24.050701.16005@sulaco.lone star.org.
 [21] "The Changing Nature of Disk Controllers", Andrew Hospodor and Albert Hoagland, Proceedings of the IEEE, Vol.81, No.4 (April 1993), p.586.
 [22] "Annealing Study of the Erasability of High Energy Tapes", L.Lekawat, G.Spratt, and M.Kryder, IEEE Trans.on Magnetics, Vol.29, No.6 (November 1993), p.3628.
 [23] "The Effect of Aging on Erasure in Particulate Disk Media", K.Mountfield and M.Kryder, IEEE Trans.on Magnetics, Vol.25, No 5 (September 1989), p.3638.
 [24] "Overwrite Temperature Dependence for Magnetic Recording", Takayuki Takeda, Katsumichi Tagami, and Takaaki Watanabe, Journal of Applied Physics, Vol.63, No.8 (April 1988), p.3438.
 [25] Conner 3.5" hard drive data sheets, 1994, 1995.
 [26] "Technology and Time-to-Market: The Two Go Hand-in-Hand", Quantum Corporation, 1995.
 [27] "Basic Flaws in Internet Security and Commerce", Paul Gauthier, posting to comp.security.unix newsgroup, 9 October 1995, message-ID gauthier.813274073@espresso.cs.ber keley.edu.
 [28] "cryptlib Free Encryption Library", Peter Gutmann, cryptlib.

Secure Deletion of Data from Magnetic and Solid-State Memory / Peter Gutmann / pgut001@cs.auckland.ac.nz

Herramientas personales