O Google está empenhado em melhorar a inteligência de seus robôs com o lançamento do modelo de aprendizagem de Inteligência Artificial Robotic Transformer (RT-2).
A empresa chama de Visão-Linguagem-Ação (VLA) o seu mais novo modelo, o RT-2. Esta tecnologia permite que os robôs aprendam melhor a identificar padrões visuais e linguísticos para decodificar ordens e determinar quais itens são mais adequados para a tarefa solicitada.
Os cientistas experimentaram o RT-2 com um braço robótico em um cenário de cozinha de escritório, perguntando ao seu braço robótico para estabelecer o que compõe um martelo improvisado (que foi uma pedra) e selecionar uma bebida para dar a alguém cansado (um Red Bull). Eles também ordenaram ao robô para mover uma lata de Coke para uma imagem de Taylor Swift. O robô é um grande fã dela, o que é uma ótima notícia para a humanidade.
O novo modelo foi treinado usando informações da web e da robótica, reunindo os últimos avanços em modelos de línguas amplos, como o BERT da Google, e combinando-os com dados de robótica (tais como a articulação para movimento). A empresa divulgou isso em um documento. Ele também interpreta instruções em outros idiomas que não sejam o inglês.
Quanto ao meio ambiente, as questões de contaminação estão se tornando cada vez mais comuns.
- O Google está aprimorando os robôs auxiliares da Alphabet para que possam entender melhor os humanos, adicionando habilidades de inteligência artificial.
- O robô Tesla possui a capacidade de se locomover devagar e coletar objetos agora.
- A Alphabet está empenhada em colocar seus protótipos de robôs para trabalhar nas limpezas ao redor das instalações do Google.
Durante muitos anos, cientistas têm tentado ensinar aos robôs uma melhor capacidade de inferir, de modo que eles possam lidar com o ambiente real. James Vincent, do The Verge, aponta que a vida real é inflexível. Os robôs precisam de instruções específicas para fazer algo que nos é fácil, como limpar um derrame. Nós sabemos intuitivamente o que fazer: pegar o copo, obter um material para absorver o líquido, descartar isso, e ter cuidado da próxima vez.
No passado, treinar um robô era uma tarefa demorada. Especialistas tinham que inserir dados manualmente. Porém, com o avanço dos modelos de aprendizado de máquina, como o RT-2, robôs podem acessar uma grande quantidade de informações para decidir qual a próxima ação.
No ano passado, o Google iniciou sua incursão em robôs mais avançados, anunciando que utilizaria seu modelo de linguagem de aprendizado (LLM) e o modelo de língua paralela (PaLM) na robótica. Esse sistema, chamado PaLM-SayCan, foi criado de modo a ligar o LLM com a robótica física.
O New York Times testou a nova criação da Google, que não é infalível. Durante a demonstração, o robô não foi capaz de discriminar sabores de refrigerante e frutas, atribuindo-lhes erroneamente a cor branca.
Dependendo da personalidade de cada pessoa, essa notícia pode ser algo positivo ou nos lembrar dos cães robôs assustadores do Black Mirror. Mesmo assim, devemos nos preparar para o lançamento de um robô ainda mais avançado no próximo ano. Talvez ele seja capaz de limpar derramamentos com poucas instruções.