O Google anunciou recentemente uma nova função para o NotebookLM, seu bloco de notas com inteligência artificial, que permite converter documentos em áudios simulando uma conversa no formato de podcast. A novidade, lançada nesta quarta-feira (11), utiliza a tecnologia do modelo Gemini 1.5 Pro para gerar diálogos entre dois locutores virtuais que discutem o conteúdo fornecido pelo usuário.
Originalmente lançado em 2023, o NotebookLM já permitia que os usuários criassem resumos e organizassem informações de documentos, como PDFs e artigos, em formatos como linhas do tempo e sumários. Agora, com essa atualização, os usuários podem transformar seus textos em áudios com diálogos descontraídos e até humorísticos, conforme demonstrado pelo Google.
Apesar de a ferramenta aceitar documentos em português, a função de áudio só está disponível em inglês, até o momento. De acordo com testes feitos pela Folha de São Paulo, os locutores de IA foram projetados para ter um comportamento arrojado e realizar brincadeiras durante a conversa. Um exemplo publicado no blog do Google mostra um áudio gerado com a seguinte introdução: “Você já se sentiu como se estivesse se afogando em informação com artigos, PDFs e sites prometendo, tipo, revelar os segredos do universo?”, diz a primeira voz, enquanto a segunda responde com humor: “Ou pelo menos terminar aquele projeto de pesquisa que você está adiando”.
O áudio gerado pode ser baixado e compartilhado livremente, permitindo que o usuário o use em diferentes plataformas. O Google também destacou que os dados inseridos no NotebookLM não são utilizados para treinar seus modelos de IA e que há moderação humana para garantir a segurança e qualidade da plataforma.
Com essa inovação, o Google avança no uso de IA aplicada à organização e consumo de informações, dando aos usuários uma forma mais interativa e prática de revisar conteúdos, com foco total nas informações fornecidas dentro do próprio projeto – para reduzir o risco de alucinações da IA.
Fonte: Folha de São Paulo.