La implementación de los proyectos de alta tecnología siempre empieza con elaboración del plan escalonado que también debe de incluir costo total de propiedad (Costo Total de Propiedad o simplemente CTP) del software y la infraestructura apropiada. El problema de la mayoría de los integradores y usuarios finales sucede cuando se trata de sistemas de hardware / software de múltiples proveedores existen muchos costos ocultos que pueden pasarse por alto en las primeras etapas de planificación.

Por lo que somos un equipo con una experiencia amplia de la integración de las soluciones basadas en la tecnología de reconocimiento facial decidimos compartir esta experiencia con ustedes y contar que sorpresas pueden encontrar realizando su proyecto. Les daremos unas sugerencias de como escoger un software para reconocimiento facial que les permitirán obtener el máximo resultado con el mínimo CTP.


El precio de licencia — no es CTP

Algunos piensan que es suficiente escoger un software de reconocimiento de un proveedor que ofrece el precio de adquisición de licencia más bajo. Sin embargo, es un enfoque equivocado y puede costar varias veces más que una solución con un costo de licencia más alto. Los costos imprevistos pueden comenzar con soporte técnico no incluido en el precio de la licencia y terminar con severas limitaciones del sistema basadas en dicho software al intentar cambiar, agregar o eliminar algo.

Es importante comprender que el éxito del proyecto depende de la elección de la solución, y cualquier detalle que no se tenga en cuenta puede provocar un colapso. Por lo tanto, es necesario escoger un software flexible que funcione de manera estable, que originalmente fue diseñado tomando en cuenta toda la gama de tareas realizadas y los posibles cambios en el futuro.


Recuerde siempre del hardware

Además de la licencia del software cualquier sistema de reconocimiento también implica el hardware, que incluye cámaras, kilómetros de cables, conmutadores, servidores de procesamiento de video y almacenamiento de datos. A menudo el “hardware” es el elemento principal de los gastos de capital y operación. Entonces, en un proyecto grande, en un territorio enorme, el principal elemento de gasto en general puede ser un cable de alta calidad y no servidores o cámaras. Al mismo tiempo, al calcular el costo de un proyecto, no se debe descartar la importancia del software, ya que la elección de un proveedor de solución de software afecta directamente a los costos para proporcionar la potencia informática requerida.

No compre hardware “demasiado ajustado", se debe tener un margen de potencia, ya que en la etapa de evaluación y diseño no siempre es posible evaluar completamente los requerimientos del hardware. El negocio se está desarrollando y hay un problema de falta de servidores, el producto de software recibe nuevas funciones útiles; esto puede requerir una gran potencia informática. Por lo tanto, desde el inicio, no se debe intentar de comprimir el proyecto a las características más bajas posibles para su lanzamiento.

Al tomar la decisión a favor de tal o cual software para el sistema de reconocimiento se adquiere una base confiable, predecible a cualquier escala, o se obtiene una solución fallida que requiere inyecciones interminables de fondos. ¿Qué diferencia a la solución correcta del software contra la que genera muchos gastos ocultos a su alrededor? Según nuestra práctica, la consideración y optimización son los factores de ahorro claves en la implementación de varios proyectos que incluyen análisis de video.

Es importante considerar cómo el software utiliza los recursos asignados. Por ejemplo, tanto la CPU como la GPU se pueden usar para procesar flujos de video. La implementación de una solución usando solo CPU puede parecer más fácil (como es más común, muchos tienen experiencia con ella) y más barata (ya que el costo mínimo de dicho equipo es menor). Sin embargo, al alcanzar un cierto número de flujos procesados, esta solución se vuelve cada vez más cara.

Por ejemplo, si estamos hablando de funcionamiento con una o dos cámaras, incluso un NUC compacto con intel core i5 puede cumplir fácilmente con esta tarea; sin embargo, para procesar 20 cámaras, ya se necesita un servidor con 24 núcleos de CPU y luego los requisitos solo crecerán.

Si hablamos de una solución basada en GPU, entonces el costo de “empezar” con una solución de este tipo es mucho mayor, pero el rendimiento de dichas soluciones también es mayor. Por ejemplo, para las mismas 20 cámaras de video que pueden cerrar las necesidades en reconocimiento facial en un centro comercial pequeño, solo una tarjeta de video “personalizada” de la serie RTX 2080Ti y una CPU de 4 núcleos serán suficientes, y lo más importante, el costo solo seguirá disminuyendo aún más.


Cuando hablamos de grandes soluciones para cientos de flujos de video, la diferencia ya será muy significativa. Por ejemplo, comparemos soluciones para 100 cámaras dentro de un centro comercial entre GPU y CPU en el formato de control de flujo y trabajo con listas negras. Cuando reconocemos un rostro, cuya pista aún no se ha terminado, esto implica funcionar en “tiempo real”. Este escenario es el más difícil para el sistema, ya que impone altas exigencias a la velocidad de trabajo y mantiene la carga constante. En tales escenarios, el sistema puede producir 1,000,000 de reconocimientos por día y el número de rostros reconocidos simultáneamente llega a 300.

Para proporcionar una velocidad de reacción decente, necesitaríamos unos 200 núcleos de procesador, con una frecuencia de al menos 2,8 GHz. Un servidor típico con dos Intel Xeons tiene solo 40 núcleos (los hilos no se cuentan). Entonces tenemos un sistema bastante complejo de 5 servidores, aproximadamente 5 unidades de altura, con la correspondiente generación de calor y consumo de energía, y un precio de aproximadamente 5 millones de rublos (incluye todos los componentes).

Para el mismo escenario, cuando usamos una GPU, obtenemos 1 servidor en 4U, en el que se instalarán 8 GPU Tesla T4, y una CPU económica con 8 núcleos para atender solicitudes. Tal solución costará desde 3 millones de rublos, que es mucho más barato tanto en términos de precio como en términos de mantenimiento y consumo de energía.

Obviamente, una solución diseñada para trabajar en una CPU costará más, ya que la densidad de procesadores por servidor es mucho menor que la de las tarjetas de video. La configuración basada en GPU hace que el sistema sea más compacto, flexible y eficiente. Es por eso que FindFace Security está diseñado para funcionar con GPU que permite reprocesar más flujos de video a menor costo.

Otro factor de costo es la capacidad del software seleccionado para integrarse con la infraestructura existente y trabajar con una amplia gama de equipos. Muchos clientes que ya poseen un sistema extenso de videovigilancia simplemente quieren complementarlo con reconocimiento facial. Desafortunadamente, no todos los proveedores de sistemas de reconocimiento están listos para hacer un compromiso, ya que esto conducirá a una disminución notable en la eficiencia del reconocimiento. A menudo, la implementación del reconocimiento facial significa una actualización completa del equipo, que es mucho más costoso que una superestructura sobre las instalaciones existentes, y no se habla de ahorro.

El equipo de desarrollo de NtechLab crea productos de software que pueden operar en una amplia gama de equipos. No existe ningún vínculo con el fabricante del equipo del servidor ni con las cámaras especializadas para el reconocimiento facial. Lo principal es que las características del hardware son suficientes para ejecutar el software, y las cámaras se instalan teniendo en cuenta los requerimientos de reconocimiento facial. Gracias a los algoritmos que pueden detectar rostros humanos de manera efectiva, solo 30 píxeles son suficientes para capturar un rostro.


Elija un software con escalabilidad predecible

La escalabilidad es una de las características claves de los sistemas de reconocimiento biométrico. Los proyectos que involucran el uso de tales sistemas pueden localizarse en una sola cámara o terminal, o ser a gran escala, cubriendo megaciudades enteras con una red de cámaras. Además, hay que tener en cuenta que en cualquier proyecto siempre se debe prever la posibilidad de ampliación, para lo cual se requiere un alto grado de flexibilidad del sistema.
Con el crecimiento de las necesidades comerciales, la ampliación del sistema de reconocimiento es inevitable, lo que coloca a algunos clientes en una situación en la que se requiere una “actualización”. Y aquí mucho depende del proveedor particular de software, ya que el costo puede ser no lineal. Muchos fabricantes de sistemas de reconocimiento facial tienen restricciones de software para escalar, por ejemplo, cuando un servidor no puede servir para más de un cierto número de flujos de video o el número total de servidores de detección para el sistema es limitado. Esto conduce a un aumento significativo en la complejidad de la arquitectura de la solución final y el costo de su instalación, operación y soporte. Según nuestra práctica el software de reconocimiento no optimizado puede costar entre 2 y 3 veces más que una solución con una arquitectura bien pensada y un alto grado de optimización durante la escalabilidad.

Para los sistemas de reconocimiento, también hay un detalle adicional que incluye la velocidad de búsqueda de imágenes y su comparación con imágenes de una base de datos, cuyo tamaño puede variar de decenas de miles a mil millones de rostros. Con un aumento en la cantidad de datos, la velocidad de búsqueda de soluciones no optimizadas disminuye, mientras que para el software especializado permanece invariablemente alta. Por ejemplo, la solución FindFace Security es capaz de buscar imágenes en 0,025 segundos para 100.000 registros, y la escala horizontal lineal (fragmentación) permite la expansión a cualquier tamaño sin pérdida de rendimiento.

Considere las características de arquitectura del futuro sistema

Los grandes proyectos donde sea implementado el reconocimiento facial suelen involucrar una gran cantidad de objetos que se encuentran distantes entre sí. Por ejemplo, si hablamos de producción con extracción y procesamiento de recursos naturales, los objetos se pueden ubicar a kilómetros entre sí, y naturalmente se requerirán canales de comunicación muy amplios y confiables para establecer la interacción de todos los elementos de la red.

La transmisión de flujos de video desde las cámaras al servidor de procesamiento requiere alta velocidad, por lo que este lujo no es barato para distancias largas. ¿Sería valido proporcionar un sistema de 30 cámaras, cada una de las cuales requiere un ancho de banda de al menos 4 Mbps para una cámara HD y 8 Mbps para una cámara FullHD, y más de 120 Mbps y 240 Mbps en total? Por lo general, estos costos no se consideran, lo que puede aumentar significativamente el CTP en el futuro. Este problema no está previsto por todos los desarrolladores de software, por lo que no es posible cambiar la configuración del sistema para que se adapte a las necesidades del cliente.

Una de las formas de reducir los costos de comunicación es mover los servidores de preprocesamiento de video directamente al sitio de instalación de la cámara. El servidor local puede recibir el flujo de video directamente, analizarla y enviar solo imágenes relevantes al servidor principal. Enviar una imagen requerirá mucho menos ancho de banda y con poco tráfico, incluso 2−4 cámaras pueden funcionar con una conexión de 1−2 Mbps.

Pero a veces incluso esta velocidad es difícil de proporcionar o puede haber requerimientos para la velocidad de respuesta, que, con una conexión de 1−2 Mbit / s, no será la más rápida, o la conexión es completamente inestable. Para tales sistemas, es posible construir una red de instalaciones independientes, completamente autónomas, pero con sincronización con la base de datos de perfiles. Así, el sistema contará con una base de datos de rostros actualizada y sincronizada, una alta velocidad de respuesta, ya que todos los componentes se ubican localmente, y no hay dependencia de la estabilidad de la conexión a Internet.

Es importante elegir una solución que tenga la capacidad de funcionar en cualquier combinación híbrida sin sacrificar la eficiencia.


¿Cómo calcular el CTP?


Calcular el Costo Total de Propiedad de un proyecto con reconocimiento es una tarea compleja que solo pueden realizar especialistas con muchos años de experiencia en la integración de sistemas biométricos. Siempre puede ponerse en contacto con los expertos de nuestra empresa, quienes seleccionarán el integrador adecuado para usted, teniendo en cuenta todos los detalles y posibles obstáculos. Solo hay que llenar el formulario de contacto con una descripción de su proyecto y esperar una respuesta.