Sora Suguhkan Kecerdasan Buatan dari Teks ke Video Hngga Satu Menit

Jakarta – OpenAI, perusahaan pembuat chatbot ChatGPT, memperkenalkan model artificial intelligence/AI (kecerdasan buatan) generatif baru dari text to video AI bernama Sora pada Jumat (16/2/2024).

Sora mempunyai fungsi yang sama seperti model AI Runway, Pika, Google Lumiere, dan Make-A-Video dari Meta. Namun, perbedaan Sora adalah bisa membuat video AI berdurasi hingga satu menit, sambil mempertahankan kualitas video dan mematuhi instruksi pengguna.

Sementara itu Runway memiliki durasi video 18 detik, Pika berdurasi 14 detik, Google Lumiere berdurasi 5 detik, dan Make-A-Video Meta berdurasi 5 detik.

OpenAI mengklaim Sora dapat menciptakan video yang kompleks dengan sejumlah karakter, jenis gerakan tertentu, gaya tertentu (animasi, video photorealistic, black and white), serta detail subjek dan latar belakang yang akurat.

Sora juga memahami bahasa dengan baik, sehingga bisa menafsirkan objek dengan akurat dan menghasilkan karakter yang terasa hidup.

Model AI ini tidak hanya mengerti apa yang diminta pengguna, tetapi juga mengetahui bagaimana objek atau subjek dalam instruksi pengguna hadir dalam kehidupan nyata.

Hal lainnya dari Sora adalah dapat memperpanjang klip video secara cerdas seperti video AI Sora bisa dilihat di posting media sosial X (dahulu Twitter) di bawah ini.

Perintah (prompt) dari pengguna meminta Sora untuk membuat video keramaian di kota Tokyo, Jepang, yang sedang diselimuti salju.

Pengguna juga secara spesifik meminta pergerakan kamera yang mengikuti orang-orang di kota itu. Hasilnya bisa dibilang cukup baik.

Selain itu Sora dapat menciptakan video yang terlihat nyata dan terasa hidup dilengkapi dengan perincian lainnya seperti mobil yang melewati jalan serta berbagai orang yang sedang melalui kota Tokyo.

Namun, jika diperhatikan lebih saksama, pengguna bisa melihat kejanggalan video AI tersebut seperti pada detik 0:03 yang mana seorang pejalan kaki tampak menembus pagar, dan pada detik ke-13 saat seseorang jatuh dan menghilang dari video.

Hal ini sejalan dengan pernyataan OpenAI seputar kelemahan Sora yakni model AI ini akan menemui kesulitan untuk menyimulasikan hukum fisika dari adegan kompleks secara akurat.

Sora juga mungkin tidak memahami hubungan sebab dan akibat yakni kadang tidak dapat membedakan antara kiri dan kanan, dan bisa kesulitan dengan deskripsi yang mendetail terkait adegan yang terjadi seiring waktu, contohnya mengikuti lintasan kamera bak video Tokyo di atas.

“Misalnya, seseorang mungkin menggigit kue, tetapi setelah itu, kue tersebut mungkin tidak memiliki bekas gigitan,” tulis perusahaan yang didirikan oleh Sam Altman itu lewat blog resminya.

Walaupun demikian,video AI yang dihasilkan oleh Sora sulit dibedakan dengan video nyata. Pengguna bisa melihat puluhan contoh video AI bikinan Sora lainnya lewat tautan berikut ini.

Berdasarkan penelitian OpenAI masih memosisikan Sora sebagai pratinjau penelitian ang mengembangkan penelitian sebelumnya dari model Dall-e dan GPT. Model AI anyar ini menggunakan teknik recaptioning dari Dall-e 3, yang melibatkan pembuatan teks yang sangat deskriptif untuk data pelatihan visual.

Model AI ini dapat mengikuti instruksi pengguna dengan baik, sehingga video yang dihasilkan Sora lebih sesuai perintah yang diberikan. Perusahaan AI tersebut menyebut bahwa Sora dilatih menggunakan seitar 10.000 jam video berkualitas tinggi.

Cara kerja Sora adalah membuat video yang tampak seperti derau statis (noise), kemudian secara bertahap menghilangkan derau tersebut seperti model GPT. Open AI ini menggunakan arsitektur transformer sehingga membuka performa scaling yang baik.

Saat ini Sora hanya tersedia untuk red teamer alias profesional dalam bidang keamanan siber. Red teamer dilibatkan Sora guna menilai area kritis guna mengetahui bahaya atau risikonya,

Sora juga memberikan akses untuk sejumlah seniman visual, desainer, dan pembuat film untuk mendapatkan umpan balik tentang cara mengembangkan model AI supaya lebih bermanfaat bagi para profesional kreatif.

Sora akan mengajak para pembuat kebijakan, pendidik, dan seniman di seluruh dunia untuk memahami kekhawatiran mereka dan mengidentifikasi kasus penggunaan positif teknologi baru ini.

“Kami membagikan hasil penelitian kami lebih awal, untuk mulai bekerja sama dan mendapatkan umpan balik dari orang-orang di luar OpenAI, juga untuk memberikan gambaran pada publik tentang kemampuan AI di masa depan,” tulis OpenAI.

Sora juga tidak merincikan kapan model AI terbaru bisa digunakan secara menyeluruh. (adm)

Sumber: kompas.com