Um sistema para habilitar robôs para executar linguagem natural com eficácia
Miscelânea / / December 02, 2021
Você está sonhando com um futuro onde os robôs sejam usados para uma variedade de atividades, para que não tenhamos que fazer isso sozinhos?
Vamos, pense nisso! Limpar, cozinhar, fazer todas as nossas tarefas são apenas algumas das possibilidades maravilhosas. Que possibilidade maravilhosa, certo? Infelizmente, no momento, você terá que continuar sonhando.
Enquanto houver alguns robôs incríveis que existem lá fora, os robôs ainda não são adaptáveis o suficiente para realizar uma ampla gama de atividades como essa de forma eficaz. Além disso, embora a tecnologia de reconhecimento de voz tenha avançado aos trancos e barrancos, ainda não é boa o suficiente para uso com robôs.
Sua melhor aposta para fazer com que algo como um robô mordomo hipotético siga suas instruções seria digitar o conjunto de instruções.
Comandos Falados
O problema com os comandos falados é que eles contêm vários níveis de complexidade, embora isso nem sempre esteja claro.
Imagine dizer ao seu robô: “Pegue aquela caixa ali”. Isso parece bastante simples, mas há um problema. Seu robô terá que dividir isso em várias etapas antes de concluir a ação. Um cenário possível para realizar este comando é:
- Ligue o sistema de rastreamento
- Ligue motores ambulantes
- Mude a direção
- Tome as medidas necessárias
- Rodar membros
- Caixa de aperto
- Caixa de elevação
Como você pode ver, isso é na verdade mais complexo do que parecia à primeira vista. Agora imagine esse comando comparado a algo como "Ligue seu sistema de rastreamento". Embora o número de palavras usadas para dar esses 2 comandos seja semelhante, seus níveis de complexidade são muito diferentes.
Como podemos resolver isso? Da forma como está agora, os robôs terão problemas para descobrir os diferentes níveis de complexidade dos comandos falados.
Não tema, uma equipe em Brown University desenvolveu um sistema que melhora a maneira como os robôs lidam com comandos falados.
Como fazer seus robôs obedecerem às suas ordens: um sistema para permitir que os robôs executem os comandos falados com eficácia
Os pesquisadores da Brown usaram os dados obtidos para treinar seu sistema a fim de compreender os diversos níveis de complexidade. O sistema foi então capaz de reunir quais ações precisavam ser realizadas e compreender os níveis de complexidade associados a diferentes estruturas de sentenças.
A equipe da Brown University decidiu enfrentar o problema de fazer com que os robôs executassem comandos falados usando um sistema engenhoso. Eles usaram ambos da Amazon Turco mecânico bem como uma ferramenta chamada Virtual Cleanup World para desenvolver seu modelo.
O mundo virtual de limpeza é um domínio de tarefa virtual. Consiste em salas codificadas por cores, um robô virtual e um objeto para o robô realizar as tarefas.
Os voluntários do Mechanical Turk descobriram quais conjuntos de instruções levaram a ações específicas no mundo da Limpeza. Primeiro, eles observaram o robô enquanto ele realizava uma variedade de tarefas.
Eles então foram questionados sobre quais conjuntos de instruções eles achavam que funcionariam melhor. Os voluntários foram solicitados a criar comandos de alto, médio e baixo nível.
Os comandos de alto nível eram aqueles como instruir o robô a carregar uma cadeira até uma sala de uma determinada cor. Os comandos de baixo nível eram comandos divididos em várias etapas. Os comandos de nível médio combinam os recursos dos comandos de nível alto e baixo.
Os pesquisadores da Brown usaram os dados obtidos para treinar seu sistema a fim de compreender os diversos níveis de complexidade. O sistema foi então capaz de reunir quais ações precisavam ser realizadas e compreender os níveis de complexidade associados a diferentes estruturas de sentenças.
Colocando o sistema em teste
Quando os robôs foram capazes de descobrir o resultado final desejado, bem como entender o nível de complexidade das tarefas, eles concluíram a tarefa em apenas 1 segundo 90 por cento do tempo.
Com base nisso, ele foi capaz de traçar um plano apropriado com base nos comandos falados que recebeu. Depois de treinar seu sistema, era hora de testar os frutos de seu trabalho. A pesquisa utilizou o Cleanup World mais uma vez, bem como um robô real operando em um espaço físico configurado de forma semelhante ao Cleanup World virtual.
Quando os robôs foram capazes de descobrir o resultado final desejado, bem como entender o nível de complexidade das tarefas, eles concluíram a tarefa em apenas 1 segundo 90 por cento do tempo.
No entanto, quando havia uma falha no entendimento do nível de complexidade, a conclusão da tarefa demorava mais. Nesse caso, os robôs precisaram de 20 ou mais segundos de planejamento para concluir uma tarefa.
Os pesquisadores precisarão encontrar maneiras de minimizar essas falhas para criar um sistema mais eficiente.
Pensamentos finais
Os robôs ainda têm um longo caminho a percorrer antes de se tornarem convencionais. No entanto, este trabalho nos aproxima de ter robôs que podem entender facilmente os comandos que lhes damos. Até então, vá lavar sua própria louça.