人工智能公司Synthesia推出数字视频化身——这是它们的工作原理

币界网Dipublikasikan tanggal 2024-08-09Terakhir diperbarui pada 2024-08-09

币界网报道:

你曾经想要一个数字双胞胎吗?或者害怕重新录制一系列视频?就像科幻故事情节一样,总部位于伦敦的合成媒体开发公司Synthesia推出了一项服务,让客户能够创建自己的数字视频表示,他们可以在社交媒体和营销活动中使用。

Synthesia在周三的直播中首次宣布推出个人化身。Synthesia声称,这些化身可以通过网络摄像头或手机上的两分钟视频生成,尽管我发现创建它们需要更长的时间。

该公司表示,其个人AI化身可以用来制作员工培训视频、产品解释、销售和营销材料,或与客户互动。对企业的好处是,这些不同的视频可以使用相同的人工智能化身创建,而无需在全新的面对面会话中重新录制演员或员工。

然而,也有一些局限性,我将深入探讨。

防止误用

联觉认识到,创建真人高保真复制品的能力可能会被滥用,用于恶意或欺骗性目的。Synthesia告诉Decrypt,它通过以下三个原则来防止其技术被用于创建人工智能生成的deepfakes:同意、控制和协作。

Synthesia公司事务和政策主管Alexandru Voica表示:“未经他人明确同意,我们绝不会创建人工智能化身。”。“我们的平台为用户提供了一个安全的环境,确保他们的数据是安全的,他们可以控制自己的化身,并通过在创建时进行内容审核来最大限度地减少滥用。”

就Voica而言,在化身生成开始之前,用户被要求同意Synthesia Limited及其供应商收集、使用、存储和披露他们的视频和音频记录,以“验证个人化身提交”

Voica表示,Synthesia还与行业同行、政策制定者和其他人合作,为负责任地使用人工智能制定最佳实践。

沃伊卡说:“未经同意的深度伪造是网上有害内容的最大来源。”。“因为Synthesia化身不能在没有他们所代表的人的明确同意的情况下制作,所以我们不从事未经同意的deepfakes业务,这大大限制了我们平台和个人化身被滥用的可能性。”

当被问及是否有Synthesia不允许的个人化身或一般化身时,Voica表示,该公司使用先进的技术过滤器和人类内容审核来确保Synthesia不会被用来促进创建不恰当或有害的内容。

Voica告诉Decrypt:“当有人试图制作视频时,该内容将在生成之前通过我们的内容审核工作流程。”。“如果发现违反了我们的政策,视频永远不会被创建。屡次违规或严重违规也可能导致他们的帐户被禁用。”

创建您的头像

要开始使用,用户必须创建Synthesia帐户。个人化身可在“初学者”、“创建者”和“企业”级别上使用。Starter和Creator帐户的年度订阅费用分别为每月18美元至59美元。寻求企业许可的企业必须联系Synthesia以确定定价。

这个过程在我的MacBook Pro上比在我的Windows 11 PC上运行得更好,两者都使用Brave浏览器。当你准备好了,Synthesia会询问你是想直接从平台录制还是上传视频。我选择了录音。

根据Synthesia的说法,个人化身是使用一种称为自动对齐的高级循环技术创建的,该技术可以确定化身何时说话,并使身体动作更加灵敏。个人化身可用的语言包括英语、德语、法语、西班牙语、阿拉伯语、克罗地亚语、菲律宾语、希腊语、印地语、意大利语、罗马尼亚语、俄语、土耳其语和乌克兰语。

在录制之前,Synthesia建议使用安静、光线充足的环境,在段落之间停顿,不要遮住脸,使用自然的肢体语言,保持积极和微笑。

根据我使用该工具的经验,其他建议是确保相机不要太近,这样你在画面中看起来会更小。如果您决定上传视频而不是使用录音机,请使用麦克风以提高音频质量。

Synthesia会给你一个脚本来阅读,背诵大约需要三分钟。根据化身生成器的说法,完成这个过程需要一到五分钟的音频和视频。

对于可能对公司或内容创作者的品牌产生重大影响的事情来说,这个过程相对简单。

虽然上传、录制和阅读剧本的过程不到五分钟,但Synthesia表示,实际生成个人头像可能需要24小时。我的第一个视频花了大约10个小时才制作出来。之后,我提供的后续提供新脚本的视频大约需要五分钟。

这是我在Synthesia的个人头像。你怎么认为?

完成的视频的大小可以更改,以适应其上传到的平台的需求,无论是YouTube、Instagram还是TikTok。我发现,使用个人头像的新脚本生成新视频大约需要五分钟。

然而,如果不生成新的个人头像,你就无法更改你的背景、服装或外表,如上所述,这可能需要一天的时间。

虽然个人化身非常令人印象深刻,但看到自己的动画版本很奇怪,这是“恐怖谷”的一个例子。恐怖谷是指人类逼真的表现几乎太接近真实事物的地方,使其外观更加令人不安。

尽管如此,这些视频化身仍然令人印象深刻,如果观众不仔细检查,它们可能会被视为真实的。

由Ryan Ozawa编辑。

Bacaan Terkait

Setelah Semikonduktor Memimpin Kenaikan, Apakah Dana Membeli Pesanan AI Atau Pemulihan Makro?

**Inti Artikel:** Setelah konflik geopolitik mereda, saham teknologi AS naik, terutama di sektor semikonduktor dan rantai perangkat keras AI. Kunci pertanyaannya: apakah kenaikan ini didorong oleh pemulihan makro (valuasi) atau pesanan AI yang riil? **Poin Utama:** 1. **Pemicu Awal: Risiko Geopolitik Turun.** Kesepakatan AS-Iran untuk perpanjangan gencatan senjata dan navigasi di Selat Hormuz mengurangi ketakutan akan lonjakan harga minyak dan inflasi. Ini meredakan tekanan pada suku bunga dan memberikan ruang bagi pemulihan valuasi saham pertumbuhan, termasuk teknologi. 2. **Uang Mengalir ke Rantai Perangkat Keras AI.** Aliran dana tidak merata ke semua sektor teknologi. Dana lebih terkonsentrasi pada chip, interkoneksi optik, memori, dan manufaktur domestik. Ini menunjukkan investor lebih selektif, mencari perusahaan dengan pendapatan riil dari pembangunan infrastruktur AI/data center (misalnya, Astera Labs dengan laporan pendapatan yang kuat). 3. **Contoh Kasus: Intel.** Lonjakan saham Intel (~10-11%) dipicu pernyataan Trump tentang kolaborasi dengan Apple, yang masuk dalam narasi manufaktur domestik dan kebijakan. Namun, ini masih berupa katalis kebijakan. Fundamental Intel (skala kontrak, timeline, profitabilitas) perlu dibuktikan lebih lanjut. 4. **Peringatan dan Verifikasi Ke Depan.** Kenaikan ini adalah **perbaikan selektif dalam selera risiko**, bukan konfirmasi siklus AI yang dipercepat kembali. Kelanjutannya bergantung pada: * **Data Makro:** Stabilitas navigasi Selat Hormuz dan harga minyak. * **Data Mikro (Kunci):** Laporan Q2 harus menunjukkan pengeluaran modal (_capital expenditure_) vendor cloud yang tetap kuat, pesanan server AI yang berkelanjutan, serta pandangan pendapatan perusahaan interkoneksi optik dan memori yang terus tumbuh. * **Kasus Intel:** Perlu konfirmasi detail kolaborasi dengan Apple yang berdampak finansial. **Kesimpulan:** Pasar memanfaatkan jendela perbaikan valuasi dari meredanya risiko geopolitik untuk membeli kembali aset-aset dalam rantai perangkat keras AI yang memiliki visibilitas pendapatan lebih nyata. Namun, tren jangka panjang bergantung pada verifikasi order dan profitabilitas di kuartal-kuartal mendatang.

marsbit4m yang lalu

Setelah Semikonduktor Memimpin Kenaikan, Apakah Dana Membeli Pesanan AI Atau Pemulihan Makro?

marsbit4m yang lalu

Kraken Tambahkan Perdagangan Token On-Chain Solana Langsung di Dalam Aplikasinya

**Kraken Tambahkan Perdagangan Token On-Chain Solana Langsung di Aplikasinya** Kraken kini mengizinkan perdagangan token on-chain Solana langsung dalam aplikasi utamanya. Fitur ini tersedia bagi pengguna di AS dan lebih dari 100 negara, dengan sekitar 2.500 token berbasis Solana yang terverifikasi pada peluncurannya. Dengan fitur baru ini, pengguna tidak perlu lagi membuat dompet eksternal, menyimpan frasa seed, atau beralih antar aplikasi untuk berdagang aset di jaringan Solana. Kraken membungkus seluruh proses on-chain ke dalam antarmuka yang sudah dikenal pengguna, sehingga aset on-chain muncul bersama aset Kraken lainnya di portofolio yang sama. Langkah ini merupakan upaya Kraken untuk menjembatani kesenjangan antara perdagangan terpusat (CEX) dan terdesentralisasi (DeFi). Solana dipilih sebagai jaringan pertama karena likuiditas dan aktivitas perdagangan token barunya yang tinggi, yang seringkali terbentuk on-chain sebelum terdaftar di bursa terpusat. Infrastruktur fitur ini didukung oleh teknologi dompet tersemat dari Privy dan protokol DEX Solana, yang menangani mekanisme dompet dan transaksi di latar belakang. Meski antarmuka lebih sederhana, Kraken mengingatkan bahwa token yang diperdagangkan melalui DEX ini belum tentu direview seperti pencatatan terpusat, sehingga risiko pasar tetap ada. Perilisan ini mencerminkan tren besar di mana bursa terpusat berusaha mengakomodasi aktivitas DeFi ke dalam platform mereka, agar tidak kehilangan pengguna yang beralih ke perdagangan on-chain.

bitcoinist50m yang lalu

Kraken Tambahkan Perdagangan Token On-Chain Solana Langsung di Dalam Aplikasinya

bitcoinist50m yang lalu

Seluruh Dunia Mengagumi Kedatangan Noam, Namun Utang OpenAI Semakin Menebal

OpenAI mengumumkan perekrutan Noam Shazeer, salah satu penulis kunci makalah "Attention Is All You Need", sebagai pemimpin penelitian arsitektur, yang disambut antusias. Namun, di saat yang sama, laporan keuangan teraudit perusahaan mengungkapkan kerugian operasional besar: $20,92 miliar pada 2025 dan pembakaran tunai $3,7 miliar pada kuartal pertama 2026. Artikel ini mempertanyakan logika di balik perekrutan bintang mahal ini dengan latar belakang tekanan keuangan yang parah. Inti masalah OpenAI bukanlah kekurangan bakat teknis, tetapi model bisnisnya: biaya komputasi yang sangat tinggi (termasuk $10,59 miliar untuk sewa daya komputasi dari Microsoft), sambil mengandalkan basis pengguna gratis yang luas dengan hanya 50 juta pengguna berbayar. Sementara itu, OpenAI telah kehilangan banyak pendiri dan peneliti inti seperti Ilya Sutskever dan Jan Leike, menunjukkan pergeseran fokus dari penelitian eksplorasi ke iterasi produk. Perekrutan Noam dilihat sebagai "pembelian cemas" yang lebih bertujuan untuk menciptakan narasi yang kuat guna mendukung valuasi IPO yang sangat tinggi (hingga $1 triliun), daripada menyelesaikan masalah profitabilitas mendasar. Sebagai perbandingan, Anthropic dilaporkan mendekati profitabilitas dengan fokus pada klien korporat yang memberikan aliran pendapatan yang lebih stabil dan dapat diprediksi. Artikel menyimpulkan bahwa tanah subur untuk inovasi berkelanjutan datang dari budaya internal yang mempertahankan talenta, bukan dari menyewa bintang mahal, dan bahwa lembar neraca tidak peduli dengan kejeniusan individu, melainkan dengan jalur yang jelas menuju keberlanjutan keuangan.

marsbit1j yang lalu

Seluruh Dunia Mengagumi Kedatangan Noam, Namun Utang OpenAI Semakin Menebal

marsbit1j yang lalu

「Memiliki」atau「Menyewa」Kecerdasan? Pertanyaan Baru dalam Memulai Bisnis AI

Mythos ditutup minggu ini, menyoroti dilema mendasar bagi startup AI: "menyewa" atau "memiliki" kecerdasan yang menjadi inti produk mereka. Selama ini, diskusi tentang model open source seringkali hanya fokus pada biaya sebagai alternatif yang lebih murah dari model mutakhir (seperti API OpenAI). Namun, insiden Mythos mengingatkan bahwa **kendali** adalah masalah yang lebih kritis. Bergantung sepenuhnya pada model eksternal berarti bisnis Anda rentan terhadap perubahan aturan, harga, atau bahkan keputusan penutupan dari penyedia model. Artikel ini berpendapat bahwa "memiliki kecerdasan" tidak berarti meninggalkan model mutakhir. Sebaliknya, perusahaan harus membangun aset kecerdasan mereka sendiri dengan cara: * Memulai dari model open source yang kuat. * Melatih ulang (fine-tune) model tersebut dengan **data, alur kerja, pengetahuan domain, dan kasus tepi (edge cases)** unik perusahaan. * Mendefinisikan standar evaluasi dan kualitas mereka sendiri. Dengan demikian, nilai perusahaan tertanam dalam model yang semakin terspesialisasi dan mencerminkan operasi bisnisnya yang sebenarnya. Masa depan AI tidak akan didominasi oleh satu model "terdepan" tunggal. Akan ada banyak "batas terdepan": 1. Model mutakhir umum (seperti GPT, Claude). 2. Model yang dilatih ulang dengan pengetahuan khusus perusahaan. 3. Model khusus untuk tugas vertikal yang sempit. 4. Sistem perutean yang menyelaraskan beberapa model untuk kinerja terbaik. Intinya, parit pertahanan sejati di era AI bukanlah sekadar kemampuan memanggil model terkuat, tetapi kemampuan untuk **mengubah kecerdasan menjadi aset perusahaan yang unik dan dikendalikan sendiri**.

marsbit2j yang lalu

「Memiliki」atau「Menyewa」Kecerdasan? Pertanyaan Baru dalam Memulai Bisnis AI

marsbit2j yang lalu

Trading

Spot
Futures
活动图片