El tiempo de espera promedio le dice lo que ocurrió ayer. El P90 le dice lo que realmente vivieron sus ciudadanos con peor atención — y si su operación cumple un estándar de servicio defendible.
El tiempo de espera P90 es el punto por debajo del cual cae el 90 por ciento de los tiempos de espera durante un período definido. Es la métrica estándar utilizada en acuerdos de servicio gubernamentales, indicadores de referencia de atención médica y SLA de centros de contacto para medir la calidad del servicio. No es un concepto nuevo. La mayoría de las plataformas de gestión de filas han estado registrando los datos necesarios para calcularlo desde el día de implementación. Los informes estándar no lo muestran. Esa brecha es donde la mayoría de los equipos de operaciones trabajan a ciegas.
Una Pregunta que No Pude Responder
Antes me daba pena cuando los clientes me preguntaban por qué solo reportábamos el tiempo de espera promedio.
Pasé ocho años como ingeniero de implementación y preventas en Qmatic. La pregunta surgió más de una vez. Un director o gerente de operaciones veía el reporte, me veía a mí, y preguntaba: ¿por qué es un solo promedio? ¿Por qué no podemos ver lo que la gente realmente vivió?
La respuesta honesta es que los tiempos de espera reportados en la mayoría de los sistemas de filas son estimaciones, no mediciones directas. Se derivan de las ventanillas disponibles, la profundidad de la fila y la duración esperada de cada trámite, una proyección de lo que debería durar la espera, no un registro de lo que fue. El cálculo tiende a aproximar la experiencia de alguien cerca del frente de la fila. No representa a la persona a la mitad, y tampoco representa a la persona que acaba de llegar.
El cliente que me hizo esa pregunta nunca recibió una respuesta satisfactoria. La métrica correcta para responderla no formaba parte del paquete de reportes estándar.
Lo que sé ahora y no sabía entonces es que existe una métrica más adecuada para lo que ese director realmente estaba preguntando. Tampoco te da el tiempo de espera real de cada persona. Nada precalculado puede hacerlo, porque las filas cambian minuto a minuto. Pero se calcula a partir de algo fundamentalmente diferente: registros reales de transacciones completadas. Cada visita que ocurrió, de principio a fin, medida después del hecho.
Esa métrica es P90. Y los datos que tu sistema de filas ha estado registrando desde que entró en operación son exactamente lo que necesitas para calcularla.
Qué Significa Realmente P90
P90 representa el percentil 90 de los tiempos de espera durante un período definido.
En términos simples: si su tiempo de espera P90 para un martes por la mañana es de 34 minutos, eso significa que el 90 por ciento de los ciudadanos que llegaron durante esa ventana esperaron 34 minutos o menos. El 10 por ciento restante esperó más que eso.
Ese último grupo es de donde provienen las quejas. Es de donde proviene el ciudadano que esperó 52 minutos mientras la estimación publicada decía 20 minutos. Es de donde vienen la escalada al supervisor, la consulta del director de servicios y la confrontación en la recepción.
El tiempo de espera promedio no le muestra en absoluto que ese grupo existe. Los incorpora a un número que hace que la operación parezca más consistente de lo que es.
El P90 los aísla. Le da un umbral, una línea en los datos, que define cuándo su operación cruza de lo aceptable a un territorio que produce experiencias negativas para los ciudadanos.
Por Qué Esto Es Diferente del Promedio que Muestran Sus Informes
El tiempo de espera promedio que muestran la mayoría de los informes del sistema de filas no se calcula a partir de registros de visitas completadas después del hecho. Es una estimación modelada, calculada en tiempo real a partir de variables de la fila: cuántos mostradores están activos, cuántas personas están esperando y cuál es el tiempo de transacción esperado para el tipo de servicio en esa fila.
Ese es un enfoque razonable para mostrar una espera estimada a un ciudadano que acaba de llegar. No es la herramienta adecuada para medir la calidad del servicio después de que termina el día.
El P90, calculado a partir de registros de transacciones sin procesar, se computa a partir de duraciones de espera reales completadas. No estimaciones. No modelos. La marca de tiempo de cuando se llamó a un ticket menos la marca de tiempo de cuando se emitió, en cada transacción del período que está analizando. Eso es una medición de lo que ocurrió, no una proyección de lo que se esperaba.
La distinción importa porque la estimación y la medición responden preguntas diferentes. Un promedio estimado responde: ¿cuánto tiempo debería esperar la próxima persona? Un P90 calculado a partir de registros completados responde: ¿qué experimentaron realmente las personas que más esperaron, y con qué frecuencia ocurre eso?
No son la misma pregunta. Y en una revisión operacional, la segunda es la que su liderazgo está haciendo.

Por Qué P90 Es el Estándar en Todas las Demás Industrias
P90 y su pariente cercano P95 no se originaron en la gestión de filas. Provienen de campos donde la prestación de servicios está definida contractualmente y necesita ser defendible.
En telecomunicaciones, los contratos de SLA especifican que un técnico debe llegar dentro de una ventana definida para al menos el 90 por ciento de las llamadas de servicio. No todas las llamadas. El 90 por ciento. El 10 por ciento restante se rastrea, se informa y se utiliza para desencadenar acciones correctivas o penalidades.
En las operaciones de centros de contacto, el estándar a menudo se formula como un objetivo de nivel de servicio: el 80 por ciento de las llamadas respondidas en 20 segundos, o el 90 por ciento en 30. El porcentaje y el umbral varían. La lógica de percentil no.
En el sector salud, el Servicio Nacional de Salud del Reino Unido rastrea el rendimiento del tiempo de espera en urgencias frente a un umbral definido e informa qué porcentaje de pacientes son atendidos dentro de ese plazo. Eso es lógica de percentil aplicada a una fila de servicio.
En el rendimiento web, los Core Web Vitals de Google miden la experiencia de carga de páginas en el percentil 75 de las visitas reales de usuarios, precisamente porque los promedios ocultan la experiencia de los usuarios más lentos.
El patrón en cada una de estas industrias es el mismo. Las métricas de rendimiento promedio fueron reemplazadas, o complementadas, por métricas de percentil porque los promedios no podían responder la pregunta que importaba: ¿cuál es la peor experiencia que tiene una parte significativa de nuestros usuarios?
Las operaciones de servicio gubernamentales han sido más lentas en adoptar este enfoque. Los datos para sustentarlo existen. La infraestructura de informes no los ha expuesto.
Lo que P90 le Dice que el Tiempo de Espera Promedio No Dice
Considere un centro de servicio con la siguiente distribución de tiempos de espera durante un bloque de tres horas por la mañana: la mayoría de los ciudadanos esperan entre 8 y 18 minutos. Un grupo más pequeño, que llega entre las 9:15 y las 10:00, espera entre 35 y 50 minutos porque dos miembros del personal no estaban disponibles y la fila absorbió un retraso de una apertura lenta. El tiempo de espera promedio para el bloque completo: 19 minutos. El tiempo de espera P90 para el mismo bloque: 44 minutos.
El promedio le dice al gerente de operaciones que la mañana estuvo dentro de un rango aceptable. El P90 les dice que aproximadamente uno de cada diez ciudadanos tuvo una experiencia más del doble de lo que la operación aparentemente entregó sobre el papel.
Esas no son la misma conclusión. Y no conducen a la misma decisión de personal.
El tiempo de espera promedio sugiere que no se necesita ninguna acción. El P90 revela una ventana específica — de 9:15 a 10:00 — donde la operación no pudo absorber estructuralmente la demanda. Un solapamiento de turno o una apertura más temprana habría reducido directamente el número de ciudadanos que experimentaron esperas superiores a 35 minutos.
Eso es un hallazgo accionable. El promedio no produce ninguno.
Los Datos Ya Están Ahí
La mayoría de las plataformas de gestión de filas registran datos de transacciones individuales a nivel de registro. Hora de llegada, duración de espera, inicio del servicio, fin del servicio. Los datos existen. Han existido desde el día de implementación.
P90 es un cálculo realizado sobre esos datos sin procesar. No es un nuevo tipo de dato. No es una función que necesite activarse. Es aritmética aplicada a registros que su sistema ya ha recopilado.
La razón por la que la mayoría de los equipos de operaciones no están mirando el P90 no es un problema de datos. Es un problema de informes.
Los informes estándar prediseñados están construidos para resumir. Agregan registros individuales en promedios, totales y recuentos. Esos formatos son fáciles de leer en un informe mensual de operaciones, pero colapsan exactamente la varianza que hace útil el análisis de percentiles. Para llegar al P90, necesita acceso a los registros de transacciones subyacentes, no al resultado resumido.
Si ese acceso existe depende de su plataforma y su licencia actual. Esa es una conversación que vale la pena tener antes de asumir que los datos están fuera de alcance.
La infraestructura existe. Los datos existen. La métrica es estándar. La brecha está en la capa de informes entre ellos.
Cómo Se Ve Esto en la Práctica
Una vez que el P90 se calcula y se rastrea, cambia las preguntas que un gerente de operaciones puede hacer y responder con sus datos.
- En lugar de "¿cuál fue nuestro tiempo de espera promedio esta semana?", la pregunta se convierte en "¿cuál fue nuestro P90 por hora en los días con mayor volumen?"
- En lugar de "¿estuvimos dentro del objetivo?", la pregunta se convierte en "¿en qué momento del día nuestro P90 cruzó el umbral que nuestro estándar de servicio define como inaceptable, y cuánto tiempo permaneció así?"
- En lugar de justificar una solicitud de personal con un promedio en aumento, un gerente de operaciones puede mostrar al liderazgo una ventana específica donde el P90 superó los 40 minutos durante dos horas consecutivas, tres días de cinco, en un tipo de servicio específico. Ese es un argumento defendible y respaldado por datos para un ajuste de turno.
El tiempo de espera promedio no puede producir ese argumento. El P90 sí puede.
La pregunta no es si su operación está funcionando bien en promedio. La pregunta es cómo se ve la peor experiencia que tienen sus ciudadanos, y si ocurre con suficiente frecuencia como para definir la calidad de su servicio a sus ojos.
Conclusión
P90 no es una métrica sofisticada o exótica. Es el estándar que la mayoría de las industrias de servicios ya utilizan para definir la línea entre un rendimiento aceptable e inaceptable. No se ha adoptado ampliamente en las operaciones de filas gubernamentales porque las herramientas de informes en las que confían la mayoría de las agencias no fueron construidas para mostrarlo.
Esa no es una razón para seguir trabajando sin él.
Si su agencia está ejecutando un sistema de filas hoy, los registros de transacciones necesarios para calcular el P90 ya existen. La pregunta es si sus informes actuales están traduciendo esos datos en un número que refleje lo que sus ciudadanos realmente experimentaron, o si están produciendo un promedio estimado que hace que la operación parezca más consistente de lo que es.
El tiempo de espera promedio le dice si la operación está mejorando o declinando con el tiempo. El P90 le dice si las personas que tuvieron la peor experiencia estaban teniendo un mal día o uno sistémico. Ambos tienen un papel. Pero solo uno de ellos le permite defender una decisión de personal, establecer un objetivo de nivel de servicio o identificar las condiciones específicas que producen sus esperas más largas. Si no está midiendo el P90, está gestionando el resumen, no la operación.
