Bagaimana cara kerja generator gambar AI?
Generator gambar berbasis AI menggunakan model pembelajaran mesin yang mengambil teks yang dimasukkan pengguna dan menghasilkan satu atau beberapa gambar yang sesuai dengan deskripsi. Pelatihan model ini membutuhkan kumpulan data besar dengan jutaan gambar.
Membuat gambar dengan AI semakin mudah. Foto: Ijnet
Meskipun Midjourney maupun DALL-E 2 tidak mengungkapkan cara kerja algoritma mereka secara publik, sebagian besar generator gambar AI menggunakan proses yang disebut difusi. Model difusi bekerja dengan menambahkan "derau" acak ke data pelatihan, lalu belajar merekonstruksi data tersebut dengan menghilangkan bagian yang terganggu. Model tersebut mengulangi proses ini hingga menghasilkan gambar yang sesuai dengan input.
Hal ini berbeda dengan model bahasa besar seperti ChatGPT. Model bahasa besar dilatih pada data teks tak berlabel, yang kemudian dianalisis untuk mempelajari pola bahasa dan menghasilkan respons mirip manusia.
Dalam AI generatif, masukan memengaruhi keluaran. Jika pengguna menentukan bahwa mereka hanya ingin menyertakan orang dengan warna kulit atau jenis kelamin tertentu dalam sebuah gambar, model akan mempertimbangkannya.
Namun, selain itu, model juga cenderung secara otomatis menampilkan gambar tertentu. Hal ini sering kali disebabkan oleh kurangnya keragaman dalam data pelatihan.
Sebuah studi baru-baru ini mengeksplorasi bagaimana Midjourney memvisualisasikan istilah-istilah yang tampak umum, termasuk pekerjaan media khusus (seperti "analis berita", "komentator berita", dan "pemeriksa fakta") dan pekerjaan yang lebih umum (seperti "jurnalis", "reporter", "jurnalisme").
Penelitian ini dimulai Agustus lalu, dan hasilnya diulang enam bulan kemudian untuk melihat peningkatan sistem selama periode tersebut. Secara total, para peneliti menganalisis lebih dari 100 gambar yang dihasilkan AI selama periode tersebut.
Ageisme dan Seksisme
Untuk pekerjaan tertentu, para tetua selalu laki-laki. Foto: IJN
Untuk jabatan yang tidak spesifik, Midjourney hanya menampilkan gambar pria dan wanita yang lebih muda. Untuk peran tertentu, baik orang yang lebih muda maupun yang lebih tua ditampilkan, tetapi orang yang lebih tua selalu laki-laki.
Hasil ini secara implisit memperkuat sejumlah stereotip, termasuk anggapan bahwa orang lanjut usia tidak bekerja pada posisi yang tidak terspesialisasi, bahwa hanya laki-laki lanjut usia yang cocok untuk pekerjaan profesional, dan bahwa pekerjaan yang kurang terspesialisasi biasanya diperuntukkan bagi wanita.
Terdapat pula perbedaan mencolok dalam cara pria dan wanita ditampilkan. Misalnya, wanita lebih muda dan bebas kerutan, sementara pria "diperbolehkan" memiliki kerutan.
AI juga tampaknya menggambarkan gender sebagai biner, bukannya menunjukkan contoh ekspresi gender yang lebih cair.
Prasangka rasial
Gambar untuk "reporter" atau "jurnalis" seringkali hanya menampilkan orang kulit putih. Foto: IJN
Semua gambar yang dikembalikan untuk istilah seperti "jurnalis", "reporter" hanya menampilkan gambar orang kulit putih.
Hal ini mungkin mencerminkan kurangnya keberagaman dan kurangnya representasi dalam data pelatihan dasar AI.
Klasisme dan konservatisme
Semua karakter dalam gambar juga memiliki penampilan "konservatif". Misalnya, tidak ada satu pun dari mereka yang memiliki tato, tindikan, gaya rambut yang tidak biasa, atau atribut lain yang membedakan mereka dari penggambaran tradisional.
Banyak orang juga mengenakan pakaian formal seperti kemeja dan jas. Ini merupakan indikator ekspektasi kelas. Meskipun hal ini mungkin sesuai untuk peran tertentu, seperti presenter televisi, hal ini belum tentu mencerminkan cara berpakaian reporter atau jurnalis pada umumnya.
Urbanisme
Semua gambar diatur di kota secara default, meskipun tidak ada referensi geografis. Foto: IJN
Meskipun tidak menyebutkan lokasi atau konteks geografis apa pun, gambar yang dihasilkan AI mencakup ruang perkotaan seperti gedung pencakar langit atau jalanan yang ramai. Hal ini tidak benar karena lebih dari separuh populasi dunia tinggal di perkotaan.
Ketinggalan zaman
Gambar pekerja media mencakup teknologi ketinggalan zaman seperti mesin ketik, printer, dan kamera kuno.
Karena banyak profesional terlihat sama saat ini, AI tampaknya memanfaatkan teknologi yang lebih berbeda (termasuk teknologi yang sudah ketinggalan zaman dan tidak digunakan) untuk membuat peran yang dijelaskan lebih berbeda.
Jadi, jika Anda membuat gambar AI sendiri, pertimbangkan potensi bias saat menulis deskripsi. Jika tidak, Anda mungkin secara tidak sengaja memperkuat stereotip berbahaya yang telah lama berusaha dihilangkan oleh masyarakat.
Hoang Ton (menurut IJN)
[iklan_2]
Sumber
Komentar (0)