
Relacionado con un disco duro, SMART (Self Monitoring Analysis and Reporting Technology) es una tecnológica predictiva que tiene como función principal reportar toda una serie de variables vinculadas al correcto funcionamiento del disco duro.
La finalidad de esta tecnología es notificar determinadas situaciones de riesgo, para que podamos anticiparnos a un posible daño en el disco y la posterior perdida de información.
Como funciona
La tecnología SMART es meramente informativa, no genera ningún proceso correctivo, son pronósticos a corto plazo de errores en disco. Esta información es almacenada en el propio disco.
Se basa en la monitorización de una serie de parámetros preestablecidos (cambian según la tecnología del disco y el fabricante) que el disco duro registra a medida que suceden. Los mas importantes son:la velocidad de los platos del disco, incremento en la cantidad de sectores defectuosos, errores de calibración, errores de CRC, distancias medias entre el cabezal y el plato, temperatura del disco, etc.
Para que la tecnología SMART sea capaz de notificar los fallos encontrados al usuario, el ordenador debe de tener activada la opción del SMART en su bios.
A través de los registros SMART que generan los disco duros, el ordenador cada vez que inicia lee dichos registros y si sus valores han alcanzado un valor de umbral determinado, mostrara una advertencia en pantalla indicando que dicho disco esta en situación de riesgo y hay que cambiarlo.
Es importante tener en cuenta que aunque un disco duro no presente problemas aparentes y pase de forma correcto algunas pruebas genericas de SMART, valores cerca del umbral podrán predecir un fallo inmediato.
Para poder comprobar los valores de SMART hay infinidad de programas que leen los registros y nos muestran de una manera clara y concisa el estado de cada valor.
Esta tecnología es capaz de predecir toda una serie de fallos (casi siempre mecánicos) pero no es capaz de predecir situaciones de avería electrónica, agentes externos, etc..
Parámetros o atributos SMART
Los parámetros o atributos que gestiona el protocolo SMART pueden cambiar según el fabricante del disco y la tecnología de dicho disco.
Los parámetros SMART no tienen valores específicos, sino que cada atributo tiene un valor que va de 1 al 253 en función de su correcto funcionamiento. Cuanto más alto sea el valor, mejor es el estado del disco respecto a ese atributo.
Cada atributo SMART tiene tres valores:
- Value: Valor comprendido entre 1 y 253. Cuanto mas alteo mejor el estado de dicho parámetro.
- Threshold / Warning: Es el límite o humbral que puede alcanzar el atributo. Si el valor value es inferior, deberíamos plantearnos que el disco puede fallar. Si este valor es 0, significa que el atributo es sólo informativo. Si es 255, significa que el atributo esta fallando y no debería ser considerado.
- Worst: Es el peor valor alcanzado por este atributo del disco.
Los principales valores a monitorizar que indicaran la integridad del disco serán los siguientes:
- Temperatura del disco: El aumento de la temperatura a menudo es señal de problemas de motor del disco o problemas de ventilación del ordenador.
- Velocidad de lectura de datos: Problemas que producen una reducción en la tasa de transferencia del disco.
- Spinup Time: Cambios que se producen en el tiempo de inicio del disco duro (tiempo que tardan los platos del disco en alcanzar la máxima velocidad).
- Reallocated sector count: El disco detecta errores físicos (sectores defectuosos) y los reasigna, si esta cantidad es elevada, se podría estar ante un fallo inminente del disco. Este es un parámetro importante en la integridad de los datos del disco.
- Velocidad de búsqueda (Seek time): Si la velocidad de búsqueda es elevada existirá algún tipo de error lógico o físico.
- Altura de vuelo del cabezal: Si se aprecia que el disco tiene una tendencia a decrecer en la altura de vuelo del cabezal, éste podría terminar tocando el plato, ocasionando un grave problema fisico e irrecuperable.
- Uso de ECC y Conteo de errores: El número de errores detectados por la unidad, aunque se corrijan internamente, suele señalar problemas futuros con ese disco. La tendencia suele ser más importante que el conteo real.
- G-sense error rate: Número de errores como resultado de impactos detectados. Importante en el análisis de incidencias.
- Write error rate:Frecuencia de errores en operaciones de escritura.
Actualmente los disco duros presentan un nivel de fallos elevados (generalmente mecánicos) debidos a factores de: producción, de mercado, de obsolescencia programada, etc.. por lo que la predicción de errores y las politicas de seguridad (redundancia en datos y backup) cobran una importancia vital para preservar la integridad de nuestros datos.
Lista completa de atributos SMART
ID/Hex |
Atributo |
Descripción |
1/01 |
Raw Read Error Rate |
Frecuencia de errores en una lectura RAW desde disco. |
2/02 |
Throughput performance |
Eficiencia media del disco duro. |
3/03 |
Spin up time |
Tiempo necesario para girar. |
4/04 |
Start/Stop count |
Número de inicios y paradas del eje del disco. |
5/05 |
Reallocated sector count |
Cantidad de sectores remapeados por defectos. |
6/06 |
Read channel margin |
Reserva de canales en operaciones de lectura. |
7/07 |
Seek error rate |
Frecuencia de errores en posicionamiento. |
8/08 |
Seek timer performance |
Eficiencia media de operaciones de posicionamiento. |
9/09 |
Power-on hours count |
Número de horas transcurridas en funcionamiento. |
10/0A |
Spin retry count |
Número de intentos de giro. |
11/0B |
Calibration retry count |
Número de intentos de calibración del dispositivo. |
12/0C |
Power cycle count |
Número de eventos de encendido. |
13/0D |
Soft read error rate |
Frecuencia de errores de lectura vía software. |
191/BF |
G-sense error rate |
Frecuencia de errores como resultado de impactos internos. |
192/C0 |
Power-off retract count |
Número de eventos de apagado. |
193/C1 |
Load/Unload cycle count |
Número de ciclos Load/Unload. |
194/C2 |
HDA temperatura |
Informativo. Muestra la temperatura del disco. |
195/C3 |
Hardware ECC recovered |
Número de errores recuperados on-the-fly (En discos MAXTOR). |
196/C4 |
Reallocation count |
Número de operaciones de remapeado. |
197/C5 |
Current pending sector count |
Número de sectores inestables (esperando por remapeado). |
198/C6 |
Offline scan uncorrectable count |
Número de errores sin corregir. |
199/C7 |
UDMA CRC error rate |
Número de errores de CRC durante modo UltraDMA. |
200/C8 |
Write error rate |
Frecuencia de errores en operaciones de escritura. |
201/C9 |
Soft read error rate |
Número de errores al intentar acceder a la pista siguiente. |
202/CA |
Data Address Mark errors |
Número de errores de Marca de datos (DAM). |
203/CB |
Run out cancel |
Número de errores de detección de memoria. |
204/CC |
Soft ECC correction |
Número de errores corregidos por un software de detección de errores. |
205/CD |
Thermal asperity rate (TAR) |
Número de errores de temperatura. |
206/CE |
Flying height |
Altura de las cabezas sobre la superficie del disco. |
207/CF |
Spin high current |
Cantidad más alta actual para girar el dispositivo. |
208/D0 |
Spin buzz |
Número de rutinas para girar el dispositivo. |
209/D1 |
Offline seek performance |
Rendimiento de búsqueda durante operaciones de apagado. |
220/DC |
Disk shift |
Cambio de disco. |
221/DD |
G-sense error rate |
Número de errores como resultado de impactos detectados. |
222/DE |
Loaded hours |
Número de horas en estado operacional. |
223/DF |
Load/unload retry count |
Carga causada por operaciones de recurrencia (lectura, grabación, posicionamiento, ...). |
224/E0 |
Load friction |
Carga causada por la fricción mecánica. |
225/E1 |
Load/Unload cycle count |
Número total de ciclos de carga. |
226/E2 |
Load-in time |
Tiempo de carga en disco. |
227/E3 |
Torque amplification count |
Cantidad de rotaciones. |
228/E4 |
Power-off retract count |
Número de eventos de apagado. |
230/E6 |
GMR head amplitude |
Amplitud de las cabezas (GMR-head). |
231/E7 |
Temperature |
Temperatura de la unidad. |
240/F0 |
Head flying hours |
Tiempo transcurrido en operaciones de posicionamiento. |
250/FA |
Read error retry rate |
Número de errores en operaciones de lectura. |