ChatGPT «рисует как фотография»
26 марта сообщество пользователей ИИ (искусственного интеллекта) по всему миру , а также во Вьетнаме, было в восторге, когда OpenAI официально выпустила Images in ChatGPT, сосредоточившись на возможностях создания изображений для пользователей интеллектуальной модели компании. Ранее ChatGPT также имел возможность создавать изображения, но был ограничен и должен был пройти через другую известную модель преобразования текста в изображение, DALL-E.
Способность инструмента превращать текст в рисунки и «комбинировать изображения, как Photoshop» быстро привлекла внимание. Многие сказали, что качество выходного изображения было «потрясающим», и большинство оценили его как «превосходящее» популярные модели ИИ на рынке.
ChatGPT создает реалистичные кофейные чашки с помощью простой команды
По словам Габриэля Го, руководителя исследовательской группы OpenAI, существенным улучшением возможностей генерации изображений ChatGPT с использованием модели GPT-4o является «связывание» — термин, обозначающий степень, в которой генератор изображений ИИ поддерживает связь между атрибутами и объектами. Г-н Го утверждает, что GPT-4o может точно связывать атрибуты для 15–20 различных объектов без путаницы, что значительно повышает точность и надежность сгенерированного контента.
Изображения в ChatGPT не только выдающиеся в своей способности создания изображений, но и решают «фатальную» слабость других инструментов ИИ для создания изображений, которая заключается в отображении текста и надписей внутри изображения. Фактически, многие изображения, содержащие текст, отображаются точно, что еще больше затрудняет различение поддельных и настоящих изображений.
Недостатком этого инструмента является то, что для генерации изображений требуется много времени, но это считается разумным, поскольку задержка возникает из-за того, что качественные изображения, точные детали и соответствие описанию пользователя всегда требуют терпения. Исследовательская группа заявила, что проблема задержки будет решена в будущем.
Много опасений по поводу возможности объединения фотографий
В дополнение к веселью в первоначальном опыте, который ChatGPT и OpenAI приносят пользователям, проблема информационной безопасности, конфиденциальности, а также риска эксплуатации снова выходит на первый план. «В ближайшем будущем изображения, которые вы видите в сети, не обязательно будут реальными», — выразил обеспокоенность пользователь Facebook во Вьетнаме, когда он мог попросить ChatGPT создать совершенно нереальные изображения, которые выглядят так же реалистично, как фотографии, например, фотографию актера и бывшего рестлера Дуэйна Джонсона (Скала), рекламирующего бренд жевательной резинки, или фотографию трехцветного кота, сидящего на плите, которая выглядит точь-в-точь как фотография.
Благодаря подробным командам пользователи могут создавать удивительные результаты, не обладая глубокими знаниями в области использования традиционных инструментов для редактирования фотографий.
Многие даже попробовали «раздевающую» способность нового инструмента. TN ( Ханой ) сказал, что он использовал фотографию модели, взятую из интернета, чтобы попросить ChatGPT переодеться в соответствии с просьбой, и почти все заказы были выполнены с высокой точностью. «Однако все еще были некоторые отклонения, в основном из-за нарушений политики системы в отношении создания изображений, защищенных авторским правом, или наличия чрезмерно сексуального контента», — поделился TN.
В тестах Тхань Ниена ChatGPT отказался создавать изображения, связанные с известными или защищенными авторским правом персонажами в реальном мире или в фильмах и рассказах. «Я не могу создать запрошенное изображение, поскольку отправленное вами эталонное изображение четко показывает персонажа Доктора Стрэнджа — защищенного авторским правом персонажа Marvel, и это нарушает текущую политику в отношении контента», — ответила система на запрос создать изображение Доктора Стрэнджа, сидящего... пьющего холодный чай во Вьетнаме.
Джеки Шеннон, руководитель отдела мультимодальных продуктов в ChatGPT, подтвердила, что изображения в ChatGPT имеют надежную защиту от Deepfake, порнографического или мошеннического контента. В частности, сгенерированные изображения будут интегрировать стандартные метаданные C2PA, чтобы пометить их как продукты ИИ, но для проверки потребуются отдельные инструменты.
Однако все еще есть много людей, которые успешно «обходят закон» и используют изображения известных людей в развлекательных целях. Например, изображение генерального директора Тима Кука, держащего телефон Samsung вместо iPhone, или изображение актера Роберта Дауни-младшего, жующего овощную конфету, или фотография Криштиану Роналду, играющего за мяч с Лионелем Месси в маленьком переулке во Вьетнаме перед множеством людей...
Источник: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
Комментарий (0)