O que é Nano Banana que deixa todo mundo animado e lidera o Google Trends Vietnã?

O Google DeepMind acaba de introduzir um grande avanço no campo da inteligência artificial generativa (GenAI): o modelo Gemini 2.5 Flash Image.

Carinhosamente conhecido como “Nano Banana” pela comunidade, este modelo é uma ferramenta poderosa, capaz de transformar texto em imagens e editar imagens existentes com grande precisão e flexibilidade.

Esta é uma continuação da linha de modelos Gemini, mas é especificamente otimizada para tarefas relacionadas a imagens.

A palavra-chave Gêmeos liderou a lista de tendências do Google Trends no Vietnã em 4 de setembro. Captura de tela.

Com vantagens excepcionais em recursos de criação e edição de fotos, a Nano Banana está atraindo grande atenção de usuários globais de tecnologia, incluindo o Vietnã.

De acordo com o Google Trends, as buscas por Gemini e Nano Banana dispararam nas últimas 24 horas. Estatísticas de 4 de setembro mostram que a palavra-chave "Gemini" liderou a lista de tendências em todos os tópicos.

Em fóruns e grupos de redes sociais, os usuários também compartilham e testam comandos e scripts de criação de imagens usando o Nano Banana.

A maioria das pessoas aprecia a capacidade da ferramenta de criar imagens "de forma rápida, organizada e ágil", bem como a qualidade do produto final.

Mais do que apenas criar imagens a partir de descrições de texto, o Gemini 2.5 Flash Image se destaca em vários aspectos principais: edição de imagens sob demanda, consistência de caracteres, velocidade de processamento impressionante e tecnologia de segurança SynthID.

Os usuários podem usar linguagem natural para alterar elementos em uma foto. Por exemplo, basta digitar o comando "adicionar uma cadeira vermelha ao lado da mesa" ou "mudar o fundo para uma floresta" e o modelo fará a edição com precisão e fluidez.

A consistência dos personagens é considerada o recurso mais inovador. O modelo consegue lembrar e recriar a imagem de um personagem ou objeto com características consistentes (como rosto, vestimenta, estilo) em várias fotos.

Isso é especialmente útil para projetos criativos que exigem a criação de uma série de imagens relacionadas, de histórias em quadrinhos a campanhas de marketing.

Imagem original e imagem após edição com Gemini 2.5 Flash Image

Com sua arquitetura otimizada, o Gemini 2.5 Flash Image pode produzir resultados de alta qualidade em segundos, acelerando significativamente o fluxo de trabalho criativo.

Todas as imagens criadas ou editadas pela modelo são marcadas com uma marca d'água digital invisível proprietária do Google, permitindo o reconhecimento de imagens criadas com IA, contribuindo para garantir a transparência e a procedência do conteúdo.

O modelo Gemini 2.5 Flash Image está abrindo uma ampla gama de possibilidades de aplicação, desde usuários individuais até desenvolvedores profissionais.

Os desenvolvedores podem acessar o modelo por meio da API Gemini e do Google AI Studio para criar seus próprios aplicativos, enquanto as empresas podem usar o modelo na plataforma Vertex AI.

Para o usuário médio, o modelo é integrado diretamente no Google Gemini e outros aplicativos, tornando a geração de imagens de IA uma ferramenta acessível e intuitiva.

Com seus recursos excepcionais, especialmente a capacidade de manter a consistência dos caracteres, espera-se que o Gemini 2.5 Flash Image se torne um concorrente formidável para softwares de edição de fotos tradicionais, como o Photoshop, mudando a maneira como criadores e usuários interagem com imagens digitais.

China supera inesperadamente os EUA na competição global de tradução automática . O modelo de código aberto Hunyuan-MT-7B da Tencent (China) venceu quase que completamente os "gigantes" americanos na competição internacional de tradução automática realizada no âmbito da conferência WMT25.

Fonte: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html