El algoritmo facial de SAFR se hizo aún más rápido

Entre los algoritmos que superan el 96% de precisión, SAFR es el modelo más rápido y ligero.

19 de Julio de 2019, por Dan Grimm, GM y VP Computer Vision.

El Instituto Nacional de Estándares y Tecnología (NIST) de los EE. UU. realiza una batería de pruebas continua, conocida como Prueba de Reconocimiento Facial del Vendedor (FRVT) para medir las principales características de los algoritmos de reconocimiento facial, incluyendo la precisión, el rendimiento y el sesgo. Las empresas y las instituciones académicas tienen la oportunidad de presentar uno o más algoritmos para que el NIST aplique un conjunto de pruebas. Los dos resultados de la prueba FRVT más recientes tienen más de 370 páginas y se publicaron en Abril de 2019 y Julio de 2019.

Los resultados del NIST del mes de Julio 2019 encontraron que SAFR fue el más rápido y más compacto entre los algoritmos de reconocimiento facial de wild faces con precisión de primera línea: tasa de falso Non-Match menor que 0, 0335. En comparación con otros algoritmos de alta precisión, SAFR es 2 veces más rápido que el promedio y 35% más pequeño que el segundo algoritmo más pequeño. SAFR fue el algoritmo más rápido probado en los resultados del NIST de Abril de 2019 y su velocidad mejoró en un 30% en los nuevos resultados de Julio. El SAFR tiene una precisión probada del 99.87% en la prueba de rostro marcado en el mundo real de la Universidad de Massachusetts.

El NIST no solo mide las características específicas de los algoritmos faciales, como el rendimiento, la precisión y el sesgo, sino que los estándares de medición informan los atributos por tipo de imagen, como fotos planteadas, fotos de cámaras web o imágenes de situaciones reales. Imágenes de situaciones reales (wild images) son caras desconocidas captadas por las imágenes de vídeo: son imágenes complejas porque las caras pueden variar en ángulo y inclinación; sin mencionar que puede haber muchas caras dentro del mismo cuadro de video. Las imágenes salvajes (wild images) desafían las cualidades faciales porque están incrustadas en condiciones del mundo real, para las que se diseñó SAFR. NIST realiza sus pruebas de reconocimiento facial utilizando fotografías fijas. El reconocimiento facial en video en vivo requiere una optimización combinada en captura, precisión y velocidad. El NIST no solo mide las características específicas de los algoritmos faciales, como el rendimiento, la precisión y el sesgo, sino que los estándares de medición informan los atributos por tipo de imagen, como fotos planteadas, fotos de cámaras web o imágenes de situaciones reales.

SAFR de RealNetworks es el algoritmo de reconocimiento facial de alto rendimiento más preciso para video en vivo, según lo probado por NIST.

Los proveedores, investigadores e instituciones académicas pueden optimizar sus soluciones a la prueba FRVT de NIST y no enviar con precisión su algoritmo de reconocimiento facial comercial y real, lo que puede conducir a resultados engañosos. Un proveedor o académico puede presentar un algoritmo que funcione bien con precisión pero que, en condiciones comerciales reales, puede ser tan costoso desde el punto de vista informático que resulta poco práctico. Por ejemplo, en los resultados de FRVT de Julio de 2019, varios algoritmos lograron marcas de wild faces de alta precisión, pero funcionaron tan lentamente – de 1.5 a 55 veces más lento que el algoritmo SAFR – que sería poco práctico en muchas condiciones del mundo real, que requeriría un poder de cómputo extremadamente costoso, un tiempo excesivo para reconocer una cara y ser abrumado por muchas caras en el video.

Algunos de los algoritmos probados por NIST se pueden comparar con los autos de Fórmula 1: están diseñados para funcionar bien en un circuito dado, pero no reflejan el mundo real de los negocios, lo que requiere un equilibrio en las condiciones de manejo, ruido, frenado, capacidad de alcance, seguridad y comodidad.

Entonces, ¿cómo se desempeñó SAFR contra el algoritmo más preciso en el informe de Julio? El algoritmo más preciso del informe de Ju;op tiene un puntaje para wild faces de 0.0271, pero es 3.6 veces más lento y 7 veces más pesado que el algoritmo SAFR, que tiene un puntaje de 0.0334. Varios algoritmos funcionan bien en precisión, pero en comparación con SAFR en una implementación comercial a gran escala en el mundo real, se necesitaría significativamente más hardware en el sitio para lograr resultados que serían de 3 a 4 veces más lentos, como se ilustra en el cuadro a continuación. El aumento de la precisión de wild faces en 0.0064 tiene un efecto debilitante en el rendimiento y el costo.

El alto rendimiento marca una gran diferencia, ya que aumenta el número de oportunidades de reconocimiento en un sistema computacionalmente restringido. En el grupo de algoritmos que exceden el 96% de precisión, SAFR es el modelo más rápido y ligero. Esto significa que SAFR puede identificar una cara varias veces durante el mismo período de tiempo que otros algoritmos, componiendo posteriormente la precisión de la plataforma.

SAFR es altamente competitivo para la precisión de la fotografía. El NIST mide la coincidencia de una sola imagen con una sola imagen para wild faces, mientras que en la vida real las personas que se mueven dentro de un cuadro de video se mueven constantemente. SAFR utiliza inteligencia de vanguardia para seleccionar la imagen correcta desde de cientos de cuadros de video. Esto significa que la precisión de SAFR es en realidad más alta que la medida por NIST, ya que SAFR monitorea continuamente el video para capturar y enviar el mejor cuadro para el reconocimiento. NIST no usa video en sus pruebas.

El SAFR se diferencia de otros algoritmos de reconocimiento facial, ya que logra resultados con una fracción de la potencia computacional requerida por la mayoría de los algoritmos de su clase. Muchas empresas que están sujetas a NIST están optimizados para la alta precisión, pero no pueden encontrar un equilibrio entre el rendimiento y la precisión.

SAFR de RealNetworks se compromete a proporcionar la mejor precisión y rendimiento con un sesgo mínimo, utilizando hardware fácilmente disponible para reconocer personas en condiciones del mundo real.

SAFR es la plataforma principal para el reconocimiento facial en el mundo real.