Глобальні, Світові новини
Штучний інтелект: Як розпізнати згенеровані зображення
Як розпізнати зображення, згенеровані штучним інтелектом: 11 ознак
Штучний інтелект (ШІ) все більше інтегрується в наше життя, зокрема, у створення зображень. Хоча ШІ досяг значних успіхів, все ще існують певні ознаки, які можуть допомогти розпізнати, чи було зображення згенеровано ШІ, а не створено людиною. Розглянемо 11 ключових ознак, які допоможуть відрізнити реальне фото від творіння штучного інтелекту.
Очі, які не виглядають по-людськи
Однією з найпомітніших ознак зображень, згенерованих ШІ, є нереалістичні очі. ШІ може створювати візуально привабливі зображення, але відтворення людських емоцій та деталей очей залишається складним завданням. Часто очі на таких зображеннях виглядають порожніми, асиметричними або навіть тривожними.
Зіниці можуть бути зміщені, райдужні оболонки можуть відрізнятися за розміром, або погляду може бракувати природної глибини, яка робить людські обличчя живими. Замість цього, можна спостерігати мляві вирази, позбавлені будь-якого сенсу. Штучний інтелект ще не навчився передавати всю гаму емоцій через погляд.
Очі, які не схожі на людські (фото: MakeUseOf)
Спотворені логотипи та брендинг
Брендинг на зображеннях, згенерованих ШІ, часто буває неточним. Можна помітити логотип Nike, який спотворений або злитий з елементами іншого бренду, або випадкові символи, що нагадують логотипи, але насправді не існують. Ці спотворення свідчать про відсутність розуміння контексту, що легко помітити, якщо ви знайомі з оригінальним брендом. Незначні деталі, такі як товщина шрифту, інтервал або форма об’єкта, часто вказують на невідповідності. Особливо це помітно, коли модель намагається об’єднати кілька логотипів в один.
Цікаво, що під час тестування майже кожен генератор зображень із штучним інтелектом має тенденцію вставляти логотип Coca-Cola (або його схожий варіант) у будь-яку сцену, де це має сенс. Це може свідчити про те, що користувачі часто запитують саме цей логотип, і тому моделі ШІ були навчені генерувати його частіше, ніж інші.
Зіпсовані логотипи (фото: MakeUseOf)
Неможливі відображення
Дзеркала, вода і скло можуть легко виявити недоліки ШІ. Віддзеркалення можуть бути відсутніми або містити невідповідні, спотворені елементи, що суперечать фактичному положенню об’єкта на зображенні. У деяких випадках можна помітити віддзеркалення, які містять зайві кінцівки або об’єкти, відсутні на основному зображенні. В інших випадках, відображення може вийти з дзеркала і стати частиною навколишнього світу. Такі зображення можуть нагадувати кадри з фільмів жахів.
У той час як реальний світ підпорядковується законам фізики і світла, зображення ШІ часто ні. Чим більше поверхонь, що відбивають, тим більше шансів виявити ці невідповідності. Штучний інтелект поки що не може ідеально відтворити закони фізики.
Дзеркала, вода і скло можуть легко виявити недоліки ШІ (фото: MakeUseOf)
Безглузда архітектура
ШІ може імітувати стиль архітектури, але йому складно дається структура. Придивіться до будівель на зображеннях, згенерованих ШІ, і ви часто виявите елементи дизайну, які не мають жодного практичного або фізичного сенсу. Сходи можуть вести прямо в стіни, дверні прорізи можуть висіти над землею, а вікна можуть виглядати стиснутими або дивно розташованими.
Дахи іноді перетинаються під неможливими кутами, а опорні колони можуть зникати в повітрі або пронизувати підлоги без жодної логіки. ШІ не розуміє інженерії або гравітації – він вгадує на основі візуальних патернів. У результаті, він часто створює структури, які на перший погляд виглядають як будівлі, але розвалюються при найближчому розгляді. Штучний інтелект потребує вдосконалення в розумінні архітектурних принципів.
ШІ може імітувати стиль архітектури (фото: MakeUseOf)
Нелогічні фони
На перший погляд, передній план зображення може виглядати переконливо. Але, якщо придивитися до заднього плану, можна помітити щось дивне. Дерево, що росте з даху, люди, що ширяють над землею, або фігури, злиті з об’єктами, – все це ознаки зображення, згенерованого ШІ. Іноді неправильним здається масштаб: кішка розміром з поштову скриньку або вуличний ліхтар, що ледь сягає рівня очей.
ШІ може імітувати деталі, але часто не в змозі розмістити їх там, де це має сенс. Деякі генератори зображень ШІ здатні створювати фотореалістичні результати, але навіть найпередовіші з них ледве створюють чисте, логічне тло. Штучний інтелект потребує кращого розуміння контексту для створення логічних фонів.
Іноді ШІ робить масштаб неправильним (фото: MakeUseOf)
Розмиті або спотворені фонові фігури
Люди на задньому плані зазвичай мають низький пріоритет під час рендерингу ШІ. У результаті, вони часто виглядають розмитими, неповними або вигнутими в неможливих позах. Ці примарні фігури можуть мати розпливчасті або нечіткі риси обличчя, а їхні пози можуть дезорієнтувати. Кінцівки можуть дивно перекриватися, або голови можуть злегка парити над шиєю без належного вирівнювання.
У групових сценах можна помітити повторювані обличчя, дзеркальні зачіски або людей, застиглих в одній і тій самій позі, одягнених у дивно схожий одяг. Для ШІ фонові фігури слугують візуальним доповненням, але часто виглядають як тривожні силуети, що видають штучне походження зображення. Штучний інтелект потребує більшої уваги до деталей при рендерингу фонових фігур.
Люди на задньому плані зазвичай мають низький пріоритет у рендерингу ШІ (фото: MakeUseOf)
Занадто гладка і “пластикова” шкіра
Люди, згенеровані ШІ, часто мають такий вигляд, ніби їхня шкіра була надмірно відретушована. Це відбувається через особливості опрацювання ШІ рис обличчя і текстур: він віддає перевагу гладкості, а не реалізму. Зморшки, веснянки та шрами стираються, у результаті чого виходить восковий, надмірно відполірований колір обличчя, позбавлений текстури справжньої шкіри. Часто цей згладжувальний ефект поширюється за межі обличчя, зачіпаючи шию, руки і навіть одяг, що створює дивний штучний вигляд.
Багато генераторів зображень ШІ здатні створювати картинки з тексту, але більшість із них страждають саме від цієї проблеми. Тільки нові моделі, такі як GPT-4o, можуть створювати неймовірно реалістичні зображення, уникаючи “пластикової” шкіри. Штучний інтелект продовжує розвиватися, намагаючись відтворити реалістичну текстуру шкіри.
Надмірне згладжування шкіри (фото: MakeUseOf)
Руки, які не мають анатомічного сенсу
Це залишається однією з найочевидніших ознак. ШІ довгий час зазнавав труднощів із точним відображенням рук, і хоча поліпшення було досягнуто, спотворені пальці, як і раніше, є чітким сигналом. Шукайте зайві пальці, зрощені суглоби, неприродні вигини або пальці, що виходять із долонь. Оскільки ШІ насправді не “розуміє” анатомію людини, він часто створює понівечений безлад.
ШІ довгий час мав труднощі з точною візуалізацією рук (фото: MakeUseOf)
“Танучий” текст або безглузді літери
Зображення, згенеровані ШІ, постійно зазнають невдачі, коли справа доходить до тексту. Якщо попросити зобразити вуличний знак або етикетку продукту, то часто можна отримати нерозбірливі, незв’язні символи. Моделі генераторів зображень ШІ навчаються на візуальних даних, а не на розумінні мови. У результаті, вони часто створюють буквоподібні форми, які імітують текст, не утворюючи реальних, читабельних слів. Навіть коли слово здається впізнаваним на перший погляд, ретельніший огляд зазвичай виявляє зайві штрихи, непослідовні шрифти або безглузді інтервали.
Важливо зазначити, що деякі просунуті моделі здатні генерувати розбірливий текст, хоча іноді все ж можна помітити незначні невідповідності. Штучний інтелект продовжує вдосконалюватися у відтворенні тексту.
Зображення, створені штучним інтелектом, постійно зазнають невдачі, коли справа доходить до тексту (фото: MakeUseOf)
Неузгоджені джерела світла
Помилки в освітленні – ще один частий “червоний прапор”. Можна побачити тіні, що вказують у протилежних напрямках, або людину, яка освітлена зліва, але відкидає тінь у тому ж напрямку. Тіні можуть виглядати занадто м’якими, занадто різкими або повністю відсутніми. Хоча більшість людей не є експертами з освітлення, у всіх нас є інтуїтивне розуміння того, як має поводитися світло. Коли ШІ не дотримується цих правил, це впадає в око, навіть підсвідомо. Штучний інтелект потребує більш точного відтворення освітлення.
Непостійні джерела світла (фото: MakeUseOf)
Прикраси, що кидають виклик фізиці
Сережки, що висять у повітрі, намиста, врізані в шкіру, окуляри, що ширяють над вухами – моделі ШІ часто некоректно обробляють взаємодію аксесуарів з людським тілом. Збільште ці області, і ви часто виявите аксесуари, які просто не відповідають дійсності. Тіні, що відкидаються цими об’єктами, також можуть бути відсутніми або конфліктувати з основним джерелом світла, додаючи ще один рівень візуальної помилки. Штучний інтелект повинен краще враховувати фізичні властивості прикрас.
Моделі ШІ часто неправильно трактують взаємодію аксесуарів з людським тілом (фото: MakeUseOf)


