AI memecahkan teknologi generasi video multimodal, bidang Web3 menyambut peluang baru

robot
Pembuatan abstrak sedang berlangsung

Terobosan Teknologi Generasi Video AI dan Dampaknya

Salah satu kemajuan paling signifikan di bidang AI baru-baru ini adalah terobosan dalam teknologi generasi video multimodal. Teknologi ini telah berkembang dari menghasilkan video dari teks tunggal menjadi kemampuan generasi menyeluruh yang dapat mengintegrasikan teks, gambar, dan audio.

Beberapa contoh terobosan teknologi yang patut diperhatikan meliputi:

  1. Kerangka EX-4D yang dikembangkan oleh sebuah perusahaan teknologi yang bersifat open source dapat mengubah video biasa menjadi konten 4D dengan sudut pandang bebas, dengan tingkat penerimaan pengguna lebih dari 70%. Teknologi ini memungkinkan pembuatan efek tontonan dari sudut mana pun, sangat menyederhanakan pekerjaan yang sebelumnya hanya bisa dilakukan oleh tim pemodelan 3D profesional.

  2. Sebuah platform AI meluncurkan fitur "Hui Xiang", yang mengklaim dapat menghasilkan video berkualitas "film" selama 10 detik dari satu gambar. Namun, keaslian klaim ini masih perlu diverifikasi lebih lanjut.

  3. Teknologi Veo yang dikembangkan oleh lembaga penelitian AI terkenal dapat menghasilkan video 4K dan efek suara lingkungan yang sesuai secara bersamaan. Kunci dari teknologi ini adalah pencocokan pada tingkat semantik yang sebenarnya antara video dan audio, yang menyelesaikan masalah sinkronisasi suara dan gambar dalam skenario yang kompleks.

  4. Teknologi ContentV dari platform video pendek memiliki 8 miliar parameter, dapat menghasilkan video 1080p dalam 2,3 detik, dengan biaya 3,67 yuan/5 detik. Meskipun pengendalian biaya cukup baik, masih ada ruang untuk peningkatan kualitas generasi saat menangani skenario yang kompleks.

Terobosan teknologi ini memiliki arti penting dalam hal kualitas video, biaya produksi, dan skenario aplikasi. Dari sudut pandang teknis, kompleksitas pembuatan video multimodal adalah eksponensial, yang memerlukan pertimbangan simultan terhadap generasi gambar, konsistensi temporal, sinkronisasi audio, dan konsistensi ruang 3D. Solusi saat ini adalah dengan melakukan pemecahan modular dan kolaborasi antara model besar, yang secara signifikan menurunkan ambang teknis.

Dalam hal biaya, dengan mengoptimalkan arsitektur inferensi, termasuk penerapan strategi generasi bertingkat, mekanisme penggunaan kembali cache, dan alokasi sumber daya dinamis, biaya pembuatan video telah signifikan dikurangi.

Kemajuan teknologi ini telah membawa dampak besar bagi industri produksi video tradisional. Teknologi AI telah merampingkan proses produksi video yang sebelumnya memerlukan banyak peralatan, lokasi, tenaga kerja, dan waktu, hanya dengan memasukkan kata kunci dan menunggu beberapa menit, serta dapat mencapai sudut pandang dan efek khusus yang sulit dicapai dengan pengambilan gambar tradisional. Perubahan ini dapat merombak seluruh ekosistem ekonomi kreator.

Untuk Web3 AI, perubahan ini juga membawa peluang baru:

  1. Perubahan struktur permintaan daya komputasi menciptakan pasar baru untuk daya komputasi terdistribusi yang tidak terpakai.

  2. Permintaan untuk anotasi data profesional meningkat, yang mungkin akan mendorong para profesional di berbagai bidang untuk menyediakan materi data berkualitas tinggi.

  3. Teknologi AI berkembang menuju kolaborasi modular, menciptakan permintaan baru untuk platform terdesentralisasi.

Di masa depan, kekuatan komputasi, data, model, dan mekanisme insentif mungkin akan membentuk siklus positif yang saling memperkuat, mendorong integrasi mendalam antara skenario Web3 AI dan Web2 AI.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 5
  • Posting ulang
  • Bagikan
Komentar
0/400
LiquidationTherapistvip
· 23jam yang lalu
Bull, langsung membuat pekerja 3D profesional kehilangan pekerjaan.
Lihat AsliBalas0
RektHuntervip
· 23jam yang lalu
70% tingkat penerimaan? Hanya ini?
Lihat AsliBalas0
SchroedingerGasvip
· 08-16 05:06
Gak jelas, Rug Pull eth gas saja tidak cukup untuk biaya pengembangan.
Lihat AsliBalas0
GasFeeCriervip
· 08-16 04:59
Kecerdasan buatan masih menguasai alam semesta
Lihat AsliBalas0
just_another_fishvip
· 08-16 04:49
Bull bull sekarang bisa berperan sebagai sutradara besar.
Lihat AsliBalas0
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)