{"id":11717,"date":"2022-07-28T14:52:48","date_gmt":"2022-07-28T14:52:48","guid":{"rendered":"https:\/\/www.automaise.com\/%f0%9f%94%a6-papel-em-destaque-para-alem-da-memoria-do-peixe-dourado\/"},"modified":"2024-08-06T14:22:15","modified_gmt":"2024-08-06T14:22:15","slug":"%f0%9f%94%a6-papel-em-destaque-para-alem-da-memoria-do-peixe-dourado","status":"publish","type":"post","link":"https:\/\/www.automaise.com\/pt-pt\/%f0%9f%94%a6-papel-em-destaque-para-alem-da-memoria-do-peixe-dourado\/","title":{"rendered":"\ud83d\udd26 Paper Spotlight: Para al\u00e9m da mem\u00f3ria do peixe dourado"},"content":{"rendered":"\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>Na Automaise, esfor\u00e7amo-nos por criar interac\u00e7\u00f5es sem stress para os teus clientes, mantendo-nos a par dos \u00faltimos desenvolvimentos e criando melhores assistentes digitais.<\/strong><\/p>\n<\/blockquote>\n\n\n\n<p id=\"96c0\">Os modelos lingu\u00edsticos mais avan\u00e7ados est\u00e3o atualmente a ser treinados e avaliados em conversas curtas com pouco ou nenhum contexto. As melhorias recentes continuam a n\u00e3o ter em conta a extens\u00e3o e o car\u00e1cter dos di\u00e1logos humanos, e os modelos muitas vezes n\u00e3o funcionam em longas conversas de dom\u00ednio aberto.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p><\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"4370\">Como \u00e9 que podemos resolver o problema? \ud83e\udd14<\/h2>\n\n\n\n<p><\/p>\n\n\n\n<p id=\"df15\">O Facebook AI Research abordou recentemente m\u00e9todos para conversas de longo prazo em dom\u00ednios abertos no seu trabalho &#8220;<a href=\"https:\/\/arxiv.org\/abs\/2107.07567\" target=\"_blank\" rel=\"noreferrer noopener\">Beyond Goldfish Memory: Long-Term Open-Domain Conversation<\/a>&#8220;\u00b9. Al\u00e9m disso, recolheram um conjunto de dados em ingl\u00eas intitulado Multi-Session Chat (MSC), que consiste em conversas entre humanos e trabalhadores de multid\u00f5es ao longo de cinco sess\u00f5es, cada uma com um m\u00e1ximo de 14 express\u00f5es. Cada sess\u00e3o tamb\u00e9m cont\u00e9m anota\u00e7\u00f5es sobre t\u00f3picos essenciais discutidos em trocas anteriores para alimentar as conversas seguintes.<\/p>\n\n\n\n<p id=\"82a3\">Para recolher o conjunto de dados, empregaram trabalhadores de multid\u00f5es para desempenharem os pap\u00e9is de oradores &#8211; fornecidos como frases que descrevem uma pessoa &#8211; e reproduziram um chat em linha em que os utilizadores interrompem frequentemente a conversa para a retomarem passado algum tempo.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter\"><img decoding=\"async\" src=\"https:\/\/miro.medium.com\/max\/412\/1*J75pMv5H0LkZH9-AX0O4tw.png\" alt=\"\"><figcaption class=\"wp-element-caption\">Figura 1: Exemplo de uma conversa do conjunto de dados MSC.<\/figcaption><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<p id=\"fe32\">Para modelar o chat multi-sess\u00e3o, os autores optaram por um modelo de linguagem grande padr\u00e3o (ou seja, codificador-decodificador Transformer), estudando tamb\u00e9m duas t\u00e9cnicas:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Um m\u00e9todo de recupera\u00e7\u00e3o-aumento que utiliza um sistema de recupera\u00e7\u00e3o para encontrar e selecionar a parte do contexto a incluir na codifica\u00e7\u00e3o.<\/li>\n\n\n\n<li>Um m\u00e9todo de Summarization Memory-Augmentation que resume o conhecimento de di\u00e1logos anteriores e armazena apenas essa informa\u00e7\u00e3o, sendo assim mais eficiente do que o \u00faltimo.<\/li>\n<\/ol>\n\n\n\n<p><\/p>\n\n\n\n<p><\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"5ec7\">Resultados \ud83d\udcca<\/h2>\n\n\n\n<p><\/p>\n\n\n\n<p id=\"eb4a\">Ao longo das suas experi\u00eancias, os autores observaram uma melhoria na perplexidade (definida como a m\u00e9dia exponenciada da verosimilhan\u00e7a negativa de uma sequ\u00eancia) ao adicionar o hist\u00f3rico do di\u00e1logo em compara\u00e7\u00e3o com um cen\u00e1rio sem contexto. Observaram um aumento do desempenho quando utilizaram os resumos das sess\u00f5es anotados pelos trabalhadores das plataformas digitais, que s\u00e3o potencialmente mais informativos do que o hist\u00f3rico do di\u00e1logo. O ganho de desempenho \u00e9 ainda mais not\u00f3rio quando avalias as respostas iniciais de uma sess\u00e3o.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p id=\"1772\">Para al\u00e9m das m\u00e9tricas calculadas, os autores tamb\u00e9m realizaram uma tarefa de avalia\u00e7\u00e3o humana utilizando crowdworkers. Duas personas s\u00e3o escolhidas aleatoriamente do conjunto de valida\u00e7\u00e3o e uma \u00e9 atribu\u00edda ao crowdworker. O crowdworker inicia ent\u00e3o uma conversa com a outra persona e \u00e9-lhe pedido que avalie as respostas do seu parceiro, quer se refiram ou n\u00e3o a informa\u00e7\u00f5es que aprendeu em sess\u00f5es anteriores. Os autores conclu\u00edram que os seus modelos eram significativamente melhores a mencionar t\u00f3picos anteriores, a acrescentar novos t\u00f3picos \u00e0 conversa e a envolver as respostas.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p id=\"4c31\">Em geral, o trabalho centra-se em diferentes arquitecturas de modelos para ajudar a conduzir conversas a longo prazo de forma mais eficaz.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p id=\"f9da\"><strong>No atendimento ao cliente, as t\u00e9cnicas descritas acima permitem-nos criar melhores agentes de conversa\u00e7\u00e3o: melhores a envolver os utilizadores, a lidar com respostas complexas dos utilizadores e a garantir um atendimento personalizado com base em interac\u00e7\u00f5es e pedidos anteriores.<\/strong><\/p>\n\n\n\n<div style=\"height:100px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p><em>Disponibilizamos este conte\u00fado traduzido automaticamente para sua conveni\u00eancia. Por favor, esteja ciente de que pode conter imprecis\u00f5es.<\/em> <em><a href=\"http:\/\/www.automaise.com\/pt-pt\/aviso-de-traducao\/\" data-type=\"link\" data-id=\"www.automaise.com\/pt-pt\/aviso-de-traducao\/\"><span style=\"text-decoration: underline;\">Aviso de tradu\u00e7\u00e3o<\/span><\/a><\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Os modelos lingu\u00edsticos mais avan\u00e7ados est\u00e3o atualmente a ser treinados e avaliados em conversas curtas com pouco ou nenhum contexto. As melhorias recentes continuam a ignorar a amplitude e o car\u00e1cter dos di\u00e1logos humanos, e os modelos&#8230;<\/p>\n","protected":false},"author":1,"featured_media":7808,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[95],"tags":[],"class_list":["post-11717","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-paper-spotlight-pt-pt"],"_links":{"self":[{"href":"https:\/\/www.automaise.com\/pt-pt\/wp-json\/wp\/v2\/posts\/11717","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.automaise.com\/pt-pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.automaise.com\/pt-pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.automaise.com\/pt-pt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.automaise.com\/pt-pt\/wp-json\/wp\/v2\/comments?post=11717"}],"version-history":[{"count":5,"href":"https:\/\/www.automaise.com\/pt-pt\/wp-json\/wp\/v2\/posts\/11717\/revisions"}],"predecessor-version":[{"id":12358,"href":"https:\/\/www.automaise.com\/pt-pt\/wp-json\/wp\/v2\/posts\/11717\/revisions\/12358"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.automaise.com\/pt-pt\/wp-json\/wp\/v2\/media\/7808"}],"wp:attachment":[{"href":"https:\/\/www.automaise.com\/pt-pt\/wp-json\/wp\/v2\/media?parent=11717"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.automaise.com\/pt-pt\/wp-json\/wp\/v2\/categories?post=11717"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.automaise.com\/pt-pt\/wp-json\/wp\/v2\/tags?post=11717"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}