O Google anunciou oficialmente o lançamento do Gemma 4, a mais recente e avançada geração de sua família de modelos de inteligência artificial abertos. Construída a partir da mesma tecnologia de ponta que fundamenta o Gemini 3, esta nova iteração foi projetada especificamente para lidar com raciocínio avançado e fluxos de trabalho agênticos. A grande novidade que acompanha o lançamento é a adoção da licença Apache 2.0, um movimento estratégico que visa oferecer maior liberdade e soberania digital para a comunidade global de desenvolvedores.
A família Gemma 4 chega ao mercado dividida em quatro tamanhos distintos, otimizados para diferentes cenários de uso e capacidades de hardware. Para dispositivos móveis e de borda, o Google introduziu os modelos E2B e E4B, que ativam um footprint efetivo de dois e quatro bilhões de parâmetros, respectivamente. Estes modelos menores foram desenvolvidos em colaboração com fabricantes de hardware móvel para rodar completamente offline, garantindo baixa latência e preservando recursos como memória RAM e bateria.
Para pesquisadores e desenvolvedores que necessitam de maior poder computacional, foram lançados os modelos de 26 bilhões de parâmetros, utilizando a arquitetura Mixture of Experts, e o modelo denso de 31 bilhões de parâmetros. Segundo a empresa, o modelo de 31 bilhões já se posiciona como o terceiro melhor modelo aberto do mundo em benchmarks reconhecidos, superando alternativas que possuem até vinte vezes o seu tamanho. Essa eficiência permite que capacidades de fronteira sejam alcançadas com uma sobrecarga de hardware significativamente menor.
Uma das características mais marcantes do Gemma 4 é o seu suporte nativo a múltiplas modalidades. Todos os modelos da família são capazes de processar vídeos e imagens, demonstrando excelência em tarefas visuais como reconhecimento óptico de caracteres e compreensão de gráficos. Adicionalmente, os modelos voltados para dispositivos móveis contam com entrada de áudio nativa, permitindo o reconhecimento e a compreensão de fala diretamente no dispositivo.
A nova geração foi construída com foco em fluxos de trabalho agênticos. Isso significa que o Gemma 4 possui suporte nativo para chamadas de função, saída estruturada em formato JSON e instruções de sistema integradas. Essas características são fundamentais para a criação de agentes autônomos capazes de interagir de forma confiável com diversas ferramentas e interfaces de programação de aplicações.
Além disso, a capacidade de processar contextos longos foi aprimorada. Os modelos de borda oferecem uma janela de contexto de cento e vinte e oito mil tokens, enquanto os modelos maiores chegam a duzentos e cinquenta e seis mil tokens. Isso permite que desenvolvedores forneçam repositórios inteiros de código ou documentos extensos em um único prompt, facilitando a geração de código offline e transformando estações de trabalho em verdadeiros assistentes locais de programação.