Llama 3: Meta apresenta nova versão de seu LLM
O modelo ultrapassa seus concorrentes open-source nas principais categorias de avaliação de desempenho de LLMs.
O modelo ultrapassa seus concorrentes open-source nas principais categorias de avaliação de desempenho de LLMs.
O modelo é composto por uma arquitetura do tipo mix-of-experts otimizada que lhe proporciona melhorias de qualidade e performance.
Utilizando apenas 15 segundos de áudio como referência, o modelo é capaz de replicar a voz do interlocutor, transferindo para outros textos e até outros idiomas.
O modelo apresenta maior fidelidade ao prompt, capacidade ampliada de entender cenas complexas e melhor entendimento gramatical.
Seguindo a tendência do mercado, o Claude 3 tem capacidade multimodal e habilidades cognitivas superiores, além de 3 versões que procuram balancear performance e desempenho.
Introduzindo deformações nos cantos das imagens, os pesquisadores conseguiram treinar sistemas capazes de processar a informação desta “visão periférica”.
O GPT-4 foi avaliado em três tarefas que servem para medir o pensamento criativo, superando o desempenho humano em todos eles.
Disponível nas versões 2B e 7B, os modelos da família Gemma disponibilizam à comunidade a mesma tecnologia por trás do Gemini, mas em formato open-source.
Além de ter qualidade similar ao Gemini 1.0 Ultra com performance superior, a versão Pro do Gemini 1.5 tem a maior janela de contexto já reportada para LLMs.
O Sora emprega uma arquitetura chamada de transformer de difusão para produzir vídeos de alta qualidade de até um minuto de duração, a partir de prompts de texto.