La tasa de fallos (habitualmente indicada por la letra griega λ) es la frecuencia con la que falla un sistema o componente de ingeniería. Se expresa normalmente como fallos por unidad de tiempo (por ejemplo, fallos por hora) y es una medida central en la teoría de la fiabilidad. En la práctica, el tiempo medio entre fallos (MTBF) se utiliza con frecuencia como parámetro operativo para componentes y sistemas de alta calidad.
Concepto técnico y relación con funciones de fiabilidad
Más formalmente, la tasa de fallos puede verse como la función de riesgo o hazard λ(t), que describe la probabilidad instantánea de fallo en el instante t dado que el elemento ha sobrevivido hasta ese instante. Si f(t) es la función de densidad de probabilidad del tiempo hasta el fallo y R(t) (o S(t)) la función de supervivencia, entonces
λ(t) = f(t) / R(t)
Para el caso particular en que la probabilidad de fallo es constante en el tiempo (λ constante), la distribución del tiempo hasta el fallo es exponencial y la función de supervivencia es R(t)=exp(−λ t). En ese caso simplificado se cumple la relación
MTBF = 1 / λ
y la fiabilidad a tiempo t es R(t)=exp(−t/MTBF).
MTBF, unidades y ejemplos prácticos
- MTBF (Mean Time Between Failures) es la esperanza matemática del tiempo entre fallos sucesivos en sistemas reparables o, en sistemas no reparables, el tiempo medio hasta el fallo.
- Las unidades habituales son horas; en electrónica se utiliza también la unidad FIT (Failures In Time): 1 FIT = 1 fallo por 10^9 horas.
- Ejemplo numérico: si λ = 0,0001 fallos/hora, entonces MTBF = 1 / 0,0001 = 10 000 horas ≈ 1,14 años.
- Disponibilidad operativa: para un sistema reparable, una aproximación práctica es
Disponibilidad ≈ MTBF / (MTBF + MTTR)
donde MTTR es el tiempo medio de reparación. Por ejemplo, con MTBF = 10 000 h y MTTR = 10 h, la disponibilidad ≈ 10 000 / 10 010 ≈ 0,999 = 99,9%.
Variación temporal: la curva de bañera y fases de vida
La tasa de fallos suele depender del tiempo y del ciclo de vida del producto. Un corolario intuitivo es que la tasa cambia a lo largo de la vida útil: fases típicas son
- Infant mortality (falla temprana): tasa alta al inicio por defectos de fabricación o errores de diseño.
- Período de vida útil (tasa aproximadamente constante): fallos aleatorios a tasa baja y relativamente estable.
- Desgaste o wear-out: tasa creciente con la edad por fatiga, corrosión, desgaste mecánico, etc.
Por ejemplo, a medida que un automóvil envejece, la tasa de fallos en su quinto año puede ser mucho mayor que en su primer año (no se espera sustituir un tubo de escape o revisar los frenos en un vehículo nuevo con la misma frecuencia que en uno antiguo). El MTBF sólo se relaciona directamente con λ mediante la inversa cuando λ es constante; si λ(t) varía, hay que usar integrales y modelos apropiados.
Medición, estimación y modelos estadísticos
Estimar la tasa de fallos exige datos (ensayos acelerados, pruebas de vida, registros de campo) y técnicas estadísticas que manejan censura y truncamiento. Modelos habituales:
- Distribución exponencial: λ constante (sencilla pero limitada).
- Distribución de Weibull: muy usada para identificar fases de fallo (forma que permite tasas crecientes o decrecientes).
- Métodos de máxima verosimilitud, análisis de supervivencia y herramientas de Weibull plotting para estimar parámetros a partir de datos reales.
En entornos industriales se usan tablas y normas de predicción de fiabilidad (p. ej., MIL‑HDBK‑217 o modelos comerciales) y se realizan pruebas aceleradas para inferir comportamiento a largo plazo.
Importancia práctica, mantenimiento y normativa
El MTBF y la tasa de fallos son parámetros clave en el diseño y operación de sistemas críticos: ingeniería aeroespacial, diseño de automóviles, arquitectura naval, centrales eléctricas, etc. Estos indicadores fundamentan decisiones sobre redundancia, inspecciones y intervalos de mantenimiento. Por ejemplo, muchas prácticas de seguridad y mantenimiento —y la normativa que las regula— derivan de la necesidad de reducir la probabilidad de fallos que puedan causar pérdidas de vidas o costes elevados; así se define la frecuencia de inspecciones y revisiones de un avión o los ciclos de mantenimiento de una planta industrial (ingeniería en general).
Las estrategias de mantenimiento incluyen:
- Mantenimiento preventivo: intervenciones programadas basadas en MTBF o calendarios.
- Mantenimiento predictivo: uso de monitorización y análisis (vibraciones, temperatura, análisis de aceite) para actuar antes del fallo.
- Mantenimiento correctivo: reparación tras el fallo; su coste y impacto se ponderan frente a MTBF y MTTR.
Métricas alternativas y aplicaciones en transporte
En transporte se usan variaciones adaptadas a las condiciones operativas: un ratio similar es la "distancia media entre fallos", común en el ferrocarril y el transporte por carretera, que intenta correlacionar las distancias recorridas y las cargas reales con necesidades y prácticas de fiabilidad equivalentes. Estas métricas permiten planificar mantenimiento y evaluar flotas cuando la unidad de exposición más relevante no es el tiempo sino la distancia o el número de ciclos.
Limitaciones y consideraciones finales
- La interpretación de MTBF y λ exige cuidado: MTBF no predice el momento exacto del próximo fallo, sino un valor medio estadístico.
- Para sistemas con tasas de fallo no constantes, λ = 1/MTBF no es aplicable; hay que modelar λ(t) explícitamente.
- Los datos de campo pueden contener sesgos (p. ej., mantenimiento proactivo que evita fallos) y requieren análisis estadístico riguroso.
- En sistemas críticos conviene combinar diseño redundante, monitorización y procedimientos de mantenimiento basados en análisis de riesgo y normativa aplicable (IEC 61508, ISO 26262, reglamentación aeronáutica, etc.).
En resumen, la tasa de fallos (λ) y el MTBF son herramientas esenciales para cuantificar y gestionar la fiabilidad. Su correcta estimación e interpretación permiten diseñar sistemas más seguros, planificar mantenimiento eficaz y reducir costes operativos y riesgos.