Pré-requisitos de surgimento de algoritmos de reconhecimento de atividades

A história do reconhecimento usando redes neurais começou na segunda metade do século XX, mas remonta ao século XIX, quando o cientista Santiago Ramon y Cajal descreveu pela primeira vez a estrutura das células nervosas e seus seguidores tentaram reproduzir essa estrutura. Leia mais sobre isso no artigo sobre tecnologias na base do reconhecimento facial.

Durante todo o desenvolvimento da tecnologia, ela cumpriu um enorme conjunto de tarefas novas tais como: reconhecer mais (rostos no quadro), reconhecer com mais precisão, reconhecer com mais rapidez. Em 2015, o nível global de desenvolvimento da biometria facial era bastante alto. A NtechLab representou a Rússia na posição de liderança, demonstrando melhores resultados do que o Google e outras empresas conhecidas na competição internacional de algoritmos.

Agora quando a precisão do reconhecimento facial (até 99%) e a velocidade (menos de 0,5 segundo) são tão altas, seria apropriado pensar em como desenvolver ainda mais a tecnologia. A batalha entre concorrentes por frações de segundos e pequenos incrementos na porcentagem de precisão certamente continuará, mas os resultados existentes já permitem resolver a maioria das tarefas complexas com conjuntos de bilhões de dados, cobrindo todas as áreas de aplicação, tanto para segurança pública quanto para negócios. Então o que vem depois?

Tendências de desenvolvimento das tecnologias do reconhecimento

Há alguns anos nossos engenheiros começaram buscar por uma resposta, o que levou à criação de algoritmos de reconhecimento de silhueta. O rastreamento por silhueta — que também é um conjunto exclusivo de características humanas — permite detectar e contar instantaneamente quase qualquer número de pessoas na zona de rastreamento, mesmo com as costas voltadas para a câmera. Também é capaz de rastrear suas rotas dentro da cidade com base em dados de diferentes câmeras de vigilância.

Em 2018, a solução FindFace ficou entre os três primeiros na competição de detecção de pedestres e ciclistas da Amazon. Logo depois, a NtechLab participa em uma competição internacional de detecção de atividades, onde reconhece, com precisão excepcional 17 atividades diferentes em um fluxo de vídeo, como falar pelo telefone, digitar uma mensagem de texto, sair do veículo, mover um objeto pesado e outros, e no final ocupa o II lugar.

Como parte da competição, os participantes foram solicitados a acompanhar o início e o final da atividade no fluxo de vídeo não processado e enviar uma notificação aos organizadores. Segundo Artyom Kuharenko, a arquitetura da rede neural convolucional desenvolvida pelos engenheiros é tal, que após o treinamento necessário, o algoritmo é capaz de reconhecer quase qualquer atividade no fluxo de vídeo.

Evidentemente, os estrategistas da NtechLab veem o desenvolvimento adicional de algoritmos de identificação por meio de redes neurais na possibilidade de não apenas reconhecer a pessoa, mas também rastrear suas rotas de movimento, estimar atividades do ponto de vista da segurança pública ou outros critérios, antecipar situações perigosas e eliminá-las.

Em outras palavras, não apenas o fato do reconhecimento em si é de grande valor, mas também a análise de vídeo, com a ajuda da qual é possível resolver várias tarefas úteis para as empresas, o estado e a sociedade como um todo.

Cenários da aplicação do reconhecimento de atividades

Em relação aos cenários mais óbvios da aplicação do reconhecimento de atividades, vale mencionar, em primeiro lugar, a importância da prevenção de ameaças à segurança pública: rastrear a origem dos conflitos na multidão. É igualmente importante registrar casos em que alguém deixe um objeto em um local público e enviar uma notificação instantânea aos serviços responsáveis.

Em seguida, tem a manutenção da ordem pública. O uso da tecnologia permitirá combater com sucesso o fumo em espaços públicos ou o uso de um celular enquanto estiver dirigindo.

O reconhecimento de atividades também é um método eficaz de controle de conteúdo indesejado, cujo rastreamento manual leva mais tempo, custa mais e expõe os funcionários ao estresse mental.

Uma sequência de cenários de controle pode ser continuada com um caso de uso em instituições médicas: o algoritmo monitorará a conformidade com as regras de atendimento ao paciente e enviará uma notificação imediata se um paciente no hospital cair da cama.

O reconhecimento de atividades tem grandes perspectivas de aplicação em empresas industriais, produção perigosa e muito mais. A NtechLab já está discutindo opções de implementação de soluções com várias empresas industriais, de energia, de petróleo e gás.

Assim, o reconhecimento de atividades é realmente o estágio mais alto do desenvolvimento de algoritmos de reconhecimento usando redes neurais. Esta é uma inovação genuína do setor: a tecnologia permite usar até câmeras de baixa resolução e detectar as atividades de pessoas cujos rostos não podem ser vistos.

No momento, a NtechLab é o único desenvolvedor de reconhecimento de atividades premiado na Rússia. Manteremos você atualizado sobre os últimos desenvolvimentos de nossos engenheiros de laboratório.

Inscreva-se nas novas postagens do blog para se manter informado.