Компания Google DeepMind только что представила важный шаг вперед в области генеративного искусственного интеллекта (GenAI): модель Gemini 2.5 Flash Image.

Эту модель в сообществе ласково называют «Нано-банан». Она представляет собой мощный инструмент, способный преобразовывать текст в изображения и редактировать существующие изображения с большой точностью и гибкостью.

Это продолжение модельного ряда Gemini, но специально оптимизированное для задач, связанных с изображениями.

c732a0fbdcce57900edf.jpg
Ключевое слово «Близнецы» возглавило список трендов Google Trends во Вьетнаме 4 сентября. Скриншот.

Благодаря выдающимся возможностям создания и редактирования фотографий Nano Banana привлекает большое внимание пользователей технологий по всему миру, включая Вьетнам.

По данным Google Trends, за последние 24 часа резко возросло количество поисковых запросов Gemini и Nano Banana. Статистика от 4 сентября показывает, что ключевое слово «Gemini» возглавляло список популярных запросов по всем темам.

На форумах и в группах социальных сетей пользователи также делятся и тестируют команды и скрипты создания изображений с использованием Nano Banana.

Большинство людей ценят способность инструмента создавать изображения «быстро, аккуратно и оперативно», а также качество выходного продукта.

Помимо создания изображений на основе текстовых описаний, Gemini 2.5 Flash Image выделяется несколькими основными аспектами: редактированием изображений по запросу, согласованностью символов, впечатляющей скоростью обработки и технологией безопасности SynthID.

Пользователи могут изменять элементы фотографии, используя естественный язык. Например, просто введите команду «добавить красный стул рядом со столом» или «изменить фон на лес», и модель выполнит редактирование точно и плавно.

Единообразие персонажей считается самой новаторской функцией. Модель может запоминать и воссоздавать изображение персонажа или объекта с одинаковыми чертами (такими как лицо, одежда, стиль) на нескольких фотографиях.

Это особенно полезно для творческих проектов, требующих создания серии связанных изображений, от комиксов до маркетинговых кампаний.

Благодаря оптимизированной архитектуре Gemini 2.5 Flash Image может создавать высококачественные результаты за считанные секунды, значительно ускоряя творческий рабочий процесс.

Все изображения, созданные или отредактированные моделью, помечаются фирменным невидимым цифровым водяным знаком от Google, что позволяет распознавать изображения, созданные с помощью ИИ, способствуя обеспечению прозрачности и происхождения контента.

Модель образа Flash Gemini 2.5 открывает широкий спектр возможностей применения: от индивидуальных пользователей до профессиональных разработчиков.

Разработчики могут получить доступ к модели через API Gemini и Google AI Studio для создания собственных приложений, а предприятия могут использовать модель на платформе Vertex AI.

Для обычного пользователя модель встроена непосредственно в Google Gemini и другие приложения, что делает визуализацию на основе ИИ доступным и интуитивно понятным инструментом.

Ожидается, что благодаря своим выдающимся возможностям, особенно способности сохранять единообразие символов, Gemini 2.5 Flash Image станет серьезным конкурентом традиционному программному обеспечению для редактирования фотографий, такому как Photoshop, изменив способ взаимодействия создателей и пользователей с цифровыми изображениями.

Китай неожиданно обогнал США на мировом конкурсе машинного перевода . Модель Tencent Hunyuan-MT-7B с открытым исходным кодом (Китай) практически полностью победила американских «гигантов» на международном конкурсе машинного перевода в рамках конференции WMT25.

Источник: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html