VALL-E é o modelo generativo da Microsoft que produz discursos em forma de áudio
O modelo usa um prompt de áudio e um prompt de texto para “transferir” a voz do áudio para o novo texto.
O modelo usa um prompt de áudio e um prompt de texto para “transferir” a voz do áudio para o novo texto.
Os processadores gráficos vão proporcionar aumento de resolução para qualquer vídeo exibido em um navegador, desde resoluções tão baixas quanto 360p, o que vai incluir as plataformas de hospedagem de vídeos e os serviços de streaming.
A inteligência artificial produz avatares realistas a partir de um curto vídeo da pessoa a ser digitalizada, decompondo o processo em três etapas : transferência de geometria, transferência de textura e aplicação de iluminação.
O sistema intercala etapas de difusão com projeções de restrições físicas para guiar a geração de movimentos mais realistas, que respeitem as limitações impostas pelo ambiente.
Treinado a partir de um checkpoint do GPT com dados de conversas em um regime de aprendizagem por reforço com pessoas no loop, o ChatGPT é o chatbot com a maior inteligência conversacional já apresentado.
A inteligência artificial é capaz de estabelecer estratégias e depois elaborar um plano de ação no formato de linguagem natural, conseguindo persuadir os competidores no jogo Diplomacy a colaborar com seu objetivo.
Se valendo de um esquema de progresso incremental, a inteligência artificial quebrou os recordes atuais na prova de teoremas matemáticos, simulando a criatividade e intuição que humanos usam para resolver estes problemas.
O sistema foi treinado com imagens estáticas em um regime adversarial que garante a qualidade e o realismo das imagens geradas, as quais são enfileiradas como frames de vídeos infinitos.
O eDiffi é a versão da empresa para os modelos de difusão que criam imagens a partir de um prompt de texto, mas traz melhorias na arquitetura que produzem resultados cada vez mais impressionantes.
O documento aponta os acontecimentos mais importantes no último ano na área da inteligência artificial, e sugere quais serão os aspectos mais relevantes para o futuro.