Especialmente para o blog: uma entrevista com a analista chefe da NtechLab Natália Efremova: sobre as redes neurais, aprendizado de máquina, os melhores programadores russos e casas inteligentes para todos.

As mulheres são diferentes e seus interesses, como as profissões, podem ser muito incomuns. Embora hoje todo mundo esteja querendo falar sobre obscurecer as fronteiras entre profissões puramente masculinas e femininas, sobre lutar pela igualdade de gênero na área profissional, a sociedade ainda não está acostumada a ver mulheres entre caminhoneiros ou mecânicos de automóveis. Nossa heroína não dirige caminhões grandes, não fica de macacão sujo sob o capô do carro e, geralmente, seu local de trabalho é só um laptop pessoal, embora sua profissão como programadora seja considerada masculina há muito tempo.

Natália Efremova é a analista da NtechLab e professora do curso «Sistemas Inteligentes de Informação» na Universidade Russa de Economia de Plekhanov, por isso está difícil para ela encontrar tempo livre em uma agenda cheia. No início da primavera, conseguimos conversar com Natália e descobrir alguns detalhes sobre redes neurais, seu passado, presente e futuro.

NtechLab: Bom dia, Natália! Obrigado por concordar em conversar. Antes de tudo, permita-me expressar admiração pelo que você faz, a que dedicou a sua vida — ao estudo de redes neurais. Não é uma profissão típica para as mulheres, embora agora não é comum dividir as profissões por gênero. E, no entanto, a primeira pergunta é simples e lógica: como você chegou à sua profissão, sua ocupação, quando percebeu que quer fazer tudo isso, que é seu, e ama o que faz?

NATÁLIA EFREMOVA: Eu vim para esta área por acaso. Em geral, estudei em uma escola humanitária e estava fazendo, por mais assustador que seja, a literatura inglesa. Depois da escola, entrei na Universidade Estadual Humanitária da Rússia, mas já tinha literatura suficiente na época e fui estudar linguística na faculdade de inteligência artificial. Ao conhecer mais a linguística, entendi muito rápido que isso não era meu. Então tive a oportunidade de lidar com o reconhecimento de linguagem natural, o que acabou me levando a redes neurais. Desde então, já faz 10 anos que me dedico à programação de redes neurais.

NTL: E o que significa «se dedicar a redes neurais»? É necessário ter algumas super habilidades de programação, conhecer matemática muito bem, entender a estrutura do cérebro?

N.: Existem diferentes graus de imersão, eu diria. Cada grau permite que você resolva um problema específico. Acredito que, com o desenvolvimento moderno das redes neurais, não é necessário entender exatamente o que está acontecendo em cada função. As redes neurais agora chegaram a uma etapa quando elas são mais uma ferramenta de produção. Quando usamos um computador, não entendemos completamente como ele funciona, quais processos ocorrem dentro, mas não precisamos disso. A rede neural pode ser montada (como se fosse blocos de Lego) de diferentes componentes e já trabalhar para melhorar ela. Hoje, já existem bibliotecas modernas que podem ser usadas; bibliotecas especialmente configuradas que podem ser usadas para tarefas especiais. Além disso, existe uma opinião definida sobre que tipos de redes neurais são usados para quais tarefas. Existe um entendimento de que tipo de desenvolvimento é necessário para uma tarefa específica, seja um desenvolvimento passo a passo ou end-to-end. No entanto, os especialistas em redes neurais não cansem ​​de sugerir formas não padronizadas de usar algoritmos «tradicionais», como, por exemplo, o uso de redes recorrentes para reconhecimento de padrões (ver mais sobre isso aqui — com. NtechLab).
A base de conhecimento das redes neurais em si é tão ampla e tantas pessoas as usam com sucesso que você não precisa mais ser um especialista nessa área para usá-las. Por exemplo, para construir sozinho uma rede neural simples para reconhecimento de manuscrito, é suficiente ter habilidades básicas de programação em «python», a capacidade de conectar bibliotecas para «python» e o conhecimento de quais bibliotecas existem no momento.

NTL: Como é o seu local de trabalho?

N.: Aqui está o meu local de trabalho (mostrando um laptop — com. NTL.). Ele viaja comigo ao redor do mundo e, quando é necessário eu conecto a servidores da Amazon para realizar alguns cálculos, mas faço minha própria configuração de servidor da Amazon para cada tarefa.

NTL: Diga, é possível explicar o que são redes neuronais de maneira muito simples? Bem simples mesmo, nos dedos.

N .: Sou professora do curso «Redes Neurais» na Academia de Plekhanov e geralmente começo explicar o que são as redes neurais, com uma descrição do episódio do desenho animado «Madagascar». Acho que no segundo desenho de «Madagascar», há um momento em que os pinguins constroem um avião. Eles chamam os macacos para ajudar e dizem: «Macacos, precisamos dos seus dedos grandes e lobos frontais». Os dedos grandes dos macacos são necessários para segurar muitos instrumentos e os lobos frontais — para descobrir como construir um avião que voa com todo o lixo que eles têm em mãos. Por que os lobos frontais? Porque os macacos são as únicas criaturas da Terra que têm a mesma estrutura que os humanos. Os humanos e primatas têm processos de pensamento semelhantes como reconhecimento de padrões e linguagem natural.
O cérebro humano, como de todos os mamíferos, consiste de matéria cinza e branca. A matéria cinza consiste de pequenas células chamadas neurônios. Essas células realizam certos cálculos. Cada célula realize apenas uma função: ela «decide» transmitir um sinal mais adiante ou não, ficar excitada ou não. E muitos sinais de excitação em muitos neurônios do cérebro criam uma rede computacional. Essa rede computacional a cada segundo toma uma decisão sobre o que eu, como uma pessoa, faço a seguir: virar a cabeça, olhar para algum objeto, como interpretar o que eu ouvi. As redes neurais artificiais são organizadas de acordo com o mesmo princípio. Existe um pequeno elemento neuronal que está responsável por cada fragmento mínimo da tarefa e combinando um grande número dos elementos nos permite realizar complexos cálculos paralelos, incluindo, entre outras coisas, reconhecimento de padrões.

NTL: O que podemos chamar de difícil e o que de simples? Digamos, a tarefa de coçar requer cálculos complexos?

N.: Este é um sinal bastante complexo

NTL: E qual é simples?

N.: Um sinal simples é, por exemplo, entender o que eu vejo na minha frente, sem cometer nenhuma ação. Processar o que obtemos dos órgãos sensoriais é provavelmente uma das ações mais fáceis. Já o movimento requer coordenação do que vemos com a ativação de nossas funções motoras, essa já é uma tarefa mais difícil. Treinamos nossos neurônios por toda a vida. Nossa rede abrangente começa a treinar-se no útero, e o processo de aprendizado dura a vida inteira.

NTL: Isso é parecido ao treinamento de uma rede neural artificial (daqui em diante RNA- com. NTL)?

N.: Na RNA, o treinamento também está em andamento, mas é um pouco mais simples, pois dentro da rede a função pode ser descrita pela fórmula. Tudo o que pode ser descrito por fórmulas matemáticas é mais simples que os processos biológicos. Uma rede neural biológica (daqui em diante RNB — com. NTL) é complexa, porque o RNB tem muita redundância, muitos processos paralelos são duplicados, repetidos várias vezes, várias tarefas paralelas. E a RNA está configurada para executar uma tarefa, por exemplo, reconhecimento facial ou reconhecimento de linguagem natural ou controle de drone. Eu não ia comparar os processos de aprendizagem que acontecem no RNB e na RNA. São processos diferentes em vários sentidos. No caso dos humanos, toda a grande rede neural é treinada de uma vez só. E a RNA geralmente treinamos em pedaços. A RNA pode ser comparada com um pedaço do cérebro humano que realiza uma determinada função. Como se o cérebro humano estivesse configurado apenas para reconhecimento de imagens, como um olho-humano.

Explicando sobre redes neurais (daqui em diante RN — com. NTL) com macacos de «Madagascar», eu uso a imagem de seus lobos frontais como um símbolo de pensamento da forma em que a conhecemos: um macaco melhor do que qualquer outro mamífero pode descobrir o que fazer. Cada área do nosso cérebro tem certas funções, por exemplo, RN para reconhecimento da visão será um análogo do córtex visual, RN para reconhecimento de uma linguagem natural será um análogo das zonas responsáveis pela educação e reconhecimento da linguagem natural no cérebro, chamadas Zonas de Wernicke e Broca. Os lobos frontais no cérebro humano estão envolvidos na computação lógica e na tomada de decisões.

NTL: Quão rápido entendem os alunos? Eles não são programadores.

N.: Eles são economistas, mas da faculdade de informática. Eles entendem de maneiras diferentes. Há aqueles que aprendam rápido. Além disso, não entro em detalhes matemáticos, na prova de teoremas e em outras conclusões matemáticas, porque, como eu disse antes, para usar RN hoje isso não é tão importante. Recentemente, li um artigo na Internet onde tinha o seguinte pensamento: você não precisa de doutorado para programar redes neurais. Podemos dizer que isso é assim e não é ao mesmo tempo. Tudo depende da tarefa e do tipo de RN. Às vezes não é fácil até para mim, com meus 10 anos de experiência, entender como funcionam algumas RN.
A propósito, em dezembro eu estava na grande conferência NIPS (Neural Information Processing Systems — com. NTL) em Barcelona. Participaram pelo menos 6 mil especialistas em aprendizado de máquina e, principalmente, na área de RN. Houve muitas apresentações, seminários. Devo admitir que não sabia tudo. Para se tornar um especialista em qualquer área, você precisa sacrificar muitas outras. Obviamente, é possível lidar com todos as RN, mas é muito difícil. Caso você se dedique às RN convolucionais, será um especialista nesta área de RN, e as RN que usam treinamento de reforço não serão mais tão transparentes. Dedico-me ao reconhecimento de padrões, visão computacional, estes são principalmente RN convolucionais.

NTL: Como você começou trabalhar na NtechLab?

N.: Ouvi dizer sobre o NtechLab pela primeira vez no exterior. Naquele tempo li um artigo no The Guardian. E o engraçado é que a empresa apareceu como um certo grupo de hackers russos que lançaram seu próprio algoritmo de reconhecimento facial e fizeram muito barulho nas redes sociais, reconhecer «quem é quem», ajudou alguém e incomodou alguém. Fiquei interessada, investiguei mais profundamente, descobri que este não é apenas um grupo de hackers, mas um laboratório inteiro que lida com reconhecimento facial, o que significa redes neurais. Sempre esteve por perto de mim. Então descobri que a empresa estava formando uma equipe (a Natália do departamento RH me contatou) e logo fui convidada para a empresa. Cheguei e marquei uma reunião com Artem (Artem Kukharenko, fundador da NtechLab — com. NTL). Essa reunião me inspirou completamente, foi muito interessante conversar com uma pessoa inteligente que, como disse, fala a mesma língua. O que mais chamou a minha atenção? O fato de que o algoritmo venceu em MegaFace vale muito. Como eu frequentemente trabalho com desenvolvedores de redes neurais, sei que vencer qualquer «desafio» internacional é muito difícil, há muitos participantes! Essa vitória significa que o sistema é muito legal. Isso, é claro, causou respeito. Me lembro de como os meninos do Imperial College London, quando nos encontramos pela primeira vez, lembraram imediatamente que os programadores russos os haviam ganhado no MegaFace. Em geral, muitos de meus colegas de várias universidades do mundo dizem que os programadores russos são os melhores. De fato, são os russos que vencem em maioria dos «desafios».

NTL: Interessante. Parecia que era um mito muito antigo sobre os melhores programadores russos, e você diz o contrário. Isso é ótimo. Natália, além de ser especialista na área de redes neurais e aprendizado de máquina, assim como a analista chefe da NtechLab, você ainda participa de vários projetos científicos. Fale mais sobre isso.

N.: No momento, como parte de meus estudos em Oxford, eu estou envolvida em pesquisas, que são realizadas em conjunto com a Universidade de Oxford. Este é um projeto de processamento de mapas de satélite para monitorar o suprimento de água potável e prever o esgotamento do suprimento de água potável. Nessa etapa, isso é mais teórico do que a pesquisa aplicada na prática, mas muitas empresas já estão tentando encontrar uma aplicação prática para ela. Estas são principalmente startups localizadas no Vale do Silício. É preciso entender claramente que uma startup hoje não é necessariamente uma equipe de três programadores que coletam dinheiro para iniciar um aplicativo. Por exemplo, eu encontrei com meninos de uma startup que lançam microssatélites no espaço. Agora, existe um grande movimento para lançar microssatélites para obter mais informações de mapas de satélite para uso posterior em fins comerciais. Este projeto de pesquisa em conjunto com Oxford está precisamente relacionado a essa pesquisa e está se dedicado a ajudar as empresas de investimento a calcular os riscos associados ao esgotamento dos recursos naturais.

NTL: Então isso não é somente uma situação humanitária? Procurar fontes de água potável, ajudar a países pobres durante uma seca, etc.

N.: Em geral, esse projeto pode ser dedicado a qualquer coisa, mas agora aparecem mais situações quando as empresas de investimento começam a lidar com questões ambientais. Eles devem calcular todos os riscos associados ao seguro de empreendimentos, pessoas físicas e jurídicas, ao seguro de imóveis, ao movimento geral do mercado. Por exemplo, existem riscos associados a um possível aquecimento e um aumento da temperatura em 3 graus. Existe toda uma indústria que lida exclusivamente com esse problema e calcula os riscos correspondentes.

NTL: O que você acha que podemos esperar do futuro de pesquisas na área de redes neurais? O que exatamente pode ser realizado com a ajuda de tecnologias baseadas em redes neurais em um futuro muito próximo?

N.: Eu acho que nos próximos 2−3 anos vamos ter muitos processos bem automatizados tais como: reconhecimento de linguagem, produção de linguagem natural, diálogo em linguagem natural, reconhecimento de vídeo, previsão de vídeo, etc.

NTL: Como assim a previsão de vídeo?

N.: É quando, desde o início você pode prever o que acontecerá a seguir. Na maior parte da produção de filmes e desenhos animados, onde estão usados os gráficos de computador, tudo será o mais automatizado possível. Por outro lado, acho que vai crescer a área dos chamados internet das coisas. Haverá dispositivos em casa que vão ajudar a minimizar o consumo de energia e água. O sistema será configurado para desligar automaticamente o aquecimento, ferros esquecidos e outros. Agora somente poucas pessoas têm as chamadas casas inteligentes, principalmente pessoas ricas. E no futuro, essas novas coisas «inteligentes» serão baratas, diárias e acessíveis para todos. Eu acho que isso vai acontecer em breve. No momento, muitas empresas de energia estão trabalhando para garantir que as pessoas minimizem o consumo de energia. A transição para o consumo «inteligente» de recursos é inevitável, à medida que estamos nos tornando cada vez mais, e precisamos minimizar nosso impacto no meio ambiente. Isso vai provocar que não só apenas casas inteligentes aparecerão, mas também os carros inteligentes. A técnica se estimará quando for melhor ir ao chuveiro para que tenhamos água quente suficiente. E quanto mais falta de recursos for sentida, melhor será o desenvolvimento de tecnologias para usar esses recursos. Simplesmente não teremos outra escolha, porque a falta de recursos no futuro será sentida cada vez mais, e o que agora parece ser a norma em termos de gasto de recursos será considerado selvageria, ignorância, algo completamente irracional. Idealmente, também calcularemos nossos treinamentos, dietas, etc. No restaurante, você tira fotos do seu prato e recebe informações sobre quantos quilômetros precisa correr para queimar essas calorias. Tais desenvolvimentos já existem, mas serão massivamente, e diariamente utilizados, serão parte integrante de nossa vida.
Os dispositivos serão inventados para alguns casos especiais. Já existem óculos para cegos como um aplicativo que diz a uma pessoa o que está à sua frente. E este é apenas o começo.

NTL: E falando no futuro distante? Você pode imaginar algo que parece absolutamente fantástico até agora, mas que pode ser realizado em algum momento com a ajuda do crescimento de nosso conhecimento de redes neurais?

N.: Quanto ao futuro distante e à ficção científica, falando sobre dispositivos, por exemplo, eu apostaria que tudo será translúcido e fácil de usar. Provavelmente, será algo embutido nos óculos ou usado no pulso, nas lentes de contato, etc. Já estamos avançando nessa direção. Os sistemas de recomendação se tornarão mais inteligentes do que agora, todas essas recomendações sobre saúde, leitura, lazer, sistemas de adivinhação, previsão de desejos.

NTL: O que devemos fazer para que esse futuro chegue?

N.: É absolutamente necessário lidar com redes neurais, porque essa disciplina está agora no ponto de desenvolvimento quando passa da ciência para a tecnologia. Existe um conceito como a tecnologia S-curve [1] [2], que descreve muito bem o desenvolvimento de tecnologias inovadoras. Hoje eles estão no ponto quando começa o desenvolvimento rápido, mas depois de um ano será tarde demais para entrar nessa área, então você precisa fazer isso agora. Se você tem conhecimento, desejo, experiência suficiente, precisa lidar com redes neurais. Seja reconhecimento facial, linguagem natural, análise de imagens de satélite.

NTL: É possível criar artificialmente uma aparência absoluta da vida humana, homem?

N.: Claro que não. Agora isso é impossível, mas acho que isso não é necessário. Se chegarmos ao ponto em que é possível criar uma semelhança absoluta da pessoa, então certamente será possível criar algo melhor, mais perfeito, algum tipo de super-homem, o «quinto elemento», se você quiser. Ou seja, agora precisa pensar não em copiar a nós mesmos, mas em criar uma criatura, digamos, superior.

NTL: Natália, temos uma “pergunta da rua”, vamos chamá-la assim, e não podemos deixar de perguntar: existe alguma razão para temer a singularidade e quando ela virá?

N.: Frequentemente ouço essa pergunta. Em poucas palavras, precisa dizer o que é uma singularidade. É um momento tão hipotético no qual as informações acumuladas se tornam tão complexas que não seremos capazes de entendê-las. Talvez passemos para a próxima etapa de desenvolvimento humano após a criação da inteligência artificial ou a criação de um mecanismo no qual nós mesmos entramos na forma digital e existimos em algum tipo de espaço de informação quando o corpo não é necessário. Os cientistas acreditam que o fim do mundo será assim. Existem várias teorias sobre esse assunto (a minha favorita é a inteligência artificial auto desenvolvida do «Neuromancer» de Gibson). Se você pergunta minha opinião, eu acho que essa é uma percepção um tanto exagerada da realidade. Superpopulação, aquecimento global, esgotamento de recursos, sobre os quais falamos acima, e desastres semelhantes, estão muito mais próximos. Eu acredito mais que, no futuro, os recursos serão tão esgotados que nem sequer podemos comprar computadores, e o problema da singularidade desaparecerá por si só. Vamos viver, cultivar cenouras, repolho, e isso é se tivermos sorte e o aquecimento global não vier. Em geral, eu apostaria menos em uma singularidade do que em uma catástrofe ambiental global, por mais triste que seja.

NTL: Perspectivas muito animadas, não dá para dizer mais nada. E podemos impedir ou superar essa catástrofe global?

N.: Isso vai depender de quando a humanidade vai começar a levar seus problemas a sério. Agora estamos em uma era de negação desses problemas. Espero que isso termine em breve.

NTL: Interessante. Então há esperança e o futuro não é predeterminado. Sabe, Natália, é difícil colocar um ponto na nossa conversa.

N.: Coloque reticência!

NTL: Com prazer. Eu realmente quero continuar nossa conversa em breve. Natália, muito obrigado pela história fascinante, por compartilhar sua opinião com nossos leitores. Desejamos grande sucesso em todos os seus empreendimentos e sequências!

1. Geroski, P.A. (2003). The Evolution of New Markets. Oxford: Oxford University Press
2. Ventresca, M. J & Zhao, M. (2012). Course Note: «System-builders and the evolution of large-scale technology: Lessons for ecosystem and infrastructure».