Bagaimana untuk membuat demo robot palsu untuk menyeronokkan dan keuntungan

Pada Mac 2008, seorang ahli robotik yang memakai pakaian musim sejuk memberikan tendangan besar kepada Big Dog untuk kamera. Robot yang dibiayai oleh DARPA itu terhuyung-hayang, tetapi segera mendapatkan kembali kaki dalam tempat letak kereta yang berlapik salji. "TOLONG JANGAN MENENDANG PROTOTAIP BERJALAN MEKANIK KEMATIAN," rayu komen teratas dalam video tersebut. "IA AKAN INGAT."

"Seram seperti neraka," catat seorang lagi. "Bayangkan jika anda sedang bersiarah di hutan suatu hari dan melihat benda itu datang ke arah anda." Blog-gadget dan akaun media sosial secara berbeza melemparkan kata-kata seperti "menakutkan" dan "robopocalypse," dalam hari-hari sebelum Black Mirror memberikan dunia satu lagi cara ringkas yang lebih langsung. Boston Dynamics berjaya. Video itu kini mempunyai 17 juta tontonan. Ia adalah salah satu daripada banyak hits viral yang terus berterusan hingga hari ini.

Sukar untuk menggambarkan peranan yang dimainkan oleh virality seperti itu dalam pembangunan selanjutnya Boston Dynamics menjadi salah satu syarikat robotik yang paling dikenali di dunia. Big Dog dan keturunannya seperti Spot dan Atlas telah dipuja, dihujani, diparodikan dan bahkan muncul dalam iklan bir Sam Adams. Bersama dengan membangunkan beberapa mekatronik paling canggih di dunia, pasukan Boston Dynamics telah membuktikan diri mereka sangat mahir dalam pemasaran.

Banyak yang boleh diungkapkan mengenai peranan video-video seperti ini dalam menyebarkan agama robotik.

Nampaknya video-video seperti ini berpotensi telah memberi inspirasi kepada karier berpuluh-puluh ahli robotik yang kini berjaya dalam bidang tersebut. Ia adalah model yang banyak syarikat pemula berikutnya telah digunakan dengan pelbagai jayanya. Boston Dynamics tentu tidak boleh dijadikan bertanggungjawab bagi mana-mana syarikat yang mungkin mengambil beberapa pintasan di sepanjang jalan.

Dalam beberapa dekad terakhir, video robot viral telah berkembang dari objek rasa ingin tahu di kalangan teknorati hingga hits yang menjadi tajuk di TikTok dan YouTube. Seiring dengan ganjaran yang mungkin meningkat, keinginan untuk melunakkan sudut juga meningkat. Meningkatkan kesulitan adalah keadaan CGI, yang telah menjadi sukar diperbezakan dari realiti bagi ramai penonton. Bias pengesahan, tarikan kepada kebaruan, dan kurangnya kepakaran teknikal semuanya memainkan peranan penting dalam kecenderungan kita untuk mempercayai berita dan video palsu.

Anda boleh memaafkan penonton TikTok biasa, misalnya, kerana tidak memahami hal-hal umum. Ramai ahli robotik telah - mungkin tanpa disedari - menambah bahan dalam api dengan menunjukkan bahawa sistem yang kita lihat dalam video adalah "gunaan am." Berbagai gunaan, mungkin, tetapi kita masih jauh dari robot yang boleh membuat sebarang tugas tidak terhad oleh had-had perkakasan.

Lebih kerap daripada tidak, video yang anda lihat adalah hasil daripada bulan atau tahun kerja. Di suatu tempat dalam hard drive terdapat jam video yang tidak dimasukkan ke dalam potongan akhir, menunjukkan robot terhuyung, tercedera atau berhenti secara tiba-tiba. Inilah sebabnya mengapa saya menggalakkan syarikat berkongsi beberapa video ini dengan audiens TechCrunch. Mungkin tidak mengejutkan, sedikit yang telah menerima tawaran saya. Saya menduga banyak perkara ini bergantung pada bagaimana masyarakat menganggap maklumat sedemikian. Dalam kalangan robotik, waktu dan hari percubaan dan kegagalan mencerminkan berapa keras anda bekerja untuk sampai kepada produk akhir. Di kalangan orang awam, bagaimanapun, kegagalan robot ini mungkin dilihat sebagai kegagalan pihak ahli robotik sendiri.

Kembali pada isu 2023 Actuator (RIP), saya memuji Boston Dynamics atas "blooper reel" yang diterbitkan yang menunjukkan Atlas kehilangan keseimbangan dan jatuh di antara gerakan parkour yang berjaya. Seperti biasa, banyak yang berakhir di lantai pemotongan daripada yang terakhir. Walaupun tidak berurusan dengan robot, itulah cara benda bergerak.

Beba minggu yang lalu, saya menghadiri ceramah oleh pengarah Kelly Reichardt mengikuti penayangan filem baharunya yang hebat, "Showing Up." Dia mengulangi kutipan lama W.C. Fields tentang tidak pernah bekerja dengan kanak-kanak atau haiwan. Dalam kebanyakan kes, saya mungkin akan menambah mekatronik canggih ke dalam senarai itu.

Bersama dengan CG/render, penyuntingan kreatif adalah salah satu daripada banyak cara yang berpotensi untuk memperbaiki demo robotik. Lebih kerap daripada tidak, niatnya tidak jahat. Perasaan pemuzik sering berkongsi dengan saya dalam podcast saya adalah bahawa apabila lagu dikeluarkan ke dunia, anda tidak lagi mempunyai kawalan ke atasnya. Sejauh mana, saya percaya yang sama boleh digunakan dengan video. Pilihan dibuat untuk mengukuhkan dan memperbaiki penyajian. Ini adalah bahagian penting dalam membuat video dalam talian yang boleh dikonsumsi. Terutamanya dalam era TikTok, bagaimanapun, konteks adalah mangsa pertama.

Tiada buku panduan untuk maklumat yang perlu dimasukkan dalam demo robotik. Semakin saya berfikir tentang hal itu, bagaimanapun, semakin saya percaya bahawa seharusnya, sekurang-kurangnya ada beberapa garis panduan yang ditakrifkan dengan baik. Saya bukan seorang robotik. Saya hanyalah seorang nerd dengan BA dalam penulisan kreatif. Walau bagaimanapun, biasanya saya berbicara dengan orang-orang yang lebih bijak daripada saya tentang subjek ini.

Baru sebelum CES, satu pos LinkedIn menarik perhatian saya (juga, nampaknya, mata banyak komuniti robotik). Ia ditulis oleh Brad Porter, pengasas dan CEO Kolaborasi Robotik yang sebelum ini memimpin usaha robotik industri Amazon. Saya jarang mengesyorkan pengikut LinkedIn, tetapi jika anda mengambil endah di dalam ruang tersebut, dia adalah salah satu yang baik.

Dalam karya itu, Porter mencatat bahawa CES kemungkinan penuh dengan demo robotik menarik (itu benar), tetapi menambah, "ada juga banyak video pantas hebat di luar sana. Membezakan realiti dari seni pentas adalah sukar." Eksekutif itu bukan bermaksud sebarang bagasi negatif yang mungkin dialami oleh perkataan "seni pentas" dalam konteks ini. Sebaliknya, beliau hanya mencadangkan bahawa penonton menghadapi video sedemikian dengan mata yang kritis dan - mungkin - bersifat skeptikal.

Saya telah meliput ruang ini untuk beberapa tahun dan telah membangunkan beberapa kemahiran untuk mengesan kayfabe robotik. Tetapi saya masih sering bergantung pada pakar dalam bidang seperti Porter apabila demo terasa tidak kena. Tentulah, tidak setiap penonton mempunyai pengalaman atau akses kepada orang-orang ini. Namun, mereka boleh melengkapkan diri dengan pengetahuan tentang bagaimana video-video sedemikian dipelihara - secara salah atau tidak berniat.

Porter mengenal pasti lima titik berbeza. Yang pertama adalah "henti-gambar gerak." Ini merujuk kepada siri suntingan cepat yang menjadikan robot itu bergerak dengan cara yang tidak mampu dilakukannya dalam kehidupan nyata.

"Jika anda melihat video robotik dengan banyak penyelakan bingkai atau pemotongan kamera, berhati-hati," tulisnya. "Anda akan perasan bahawa video Boston Dynamics sering satu potong tanpa pemotongan kamera, itu mengagumkan."

Yang kedua adalah simulasi. Ini, dalam praktik, adalah contoh CG yang saya berikan di atas. Simulasi telah menjadi alat asas dalam penugasan robotik. Ia membolehkan orang menjalankan ribuan skenario serentak dalam saat. Bersamaan dengan grafik komputer lain, simulasi robotik semakin terasa realistik dalam tahun-tahun terkini. Mencipta dan berkongsi simulasi yang realistik tidak menjadi masalah itu sendiri. Isunya, lebih kepada muncul sebagai realiti.

Isu ketiga mempunyai nama yang menarik. Demo Wizard of Oz dipanggil demikian kerana kerja berat dilakukan oleh [orang] di sebalik tirai (jangan ambil tahu). Porter mengutip Mobile ALOHA Stanford sebagai contoh. Saya sangat percaya bahawa tidak ada maksud jahat yang terlibat dalam keputusan untuk menjalankan demo yang (masih sangat mengagumkan) melalui teleop di luar skrin. Malah, "operator robot," Tony Zhao, muncul dalam kedua-dua video dan kredit akhir.

Malangnya, penampilan berlaku dua minit separuh ke dalam demo selama tiga setengah minit. Pada zaman ini, bagaimanapun, kita perlu menganggap bahawa:

  1. Tiada orang sebenarnya mempunyai minat untuk tenang duduk melalui dua minit setengah rakaman robot yang luar biasa lagi,
  2. Benda ini akan dipotong dan dipisahkan dari semua konteks.
  3. Penonton Twitter TikTok X purata anda tidak akan mencari punca video tersebut.

Optimus melipat baju pic.twitter.com/3F5o3jVLq1

Buat satu contoh lain yang tiba selepas pos Porter, lihatlah video Elon Musk X mengenai robot humanoid Optimus melipat pakaian. Video tersebut berlari dengan teks "Optimus melipat baju." Penonton yang teliti seperti saya melihat sesuatu yang menarik di sudut kanan bawah: tangan bersarung tangan yang kadang-kadang muncul sebahagian dalam bingkai yang sepadan dengan pergerakan robot.

"Menyusun semula video Optimus baju hanya beberapa inci lagi ke kiri dan anda akan terlepas daripada apa yang kelihatan seperti tangan tele-op yang mengawal Tesla Bot," saya nyatakan pada masa itu. "Tiada yang salah dengan tele-op, tentu sahaja Ia mempunyai beberapa aplikasi yang hebat, termasuk latihan, pemecahan masalah dan melaksanakan tugas yang sangat khusus seperti pembedahan. Tetapi baik untuk mengetahui apa yang kita lihat (dan tidak kita lihat). Ini menurut saya sebagai kejadian yang jelas di mana penulis asal menghilangkan maklumat penting, memahami bahawa kelompok sasarannya / peminat akan mengisi celahan dengan apa yang mereka percaya mereka lihat berdasarkan perasaan mereka terhadap pesuruh itu."

Mungkin tidak betul menyalahkan Musk dengan sengaja menyembunyikan kebenaran di sini. Dua puluh tiga minit selepas tweet asal, dia menambah, "Catatan penting: Optimus masih belum boleh melakukan ini secara autonomus, tetapi pasti akan dapat melakukannya sepenuhnya secara autonomus dan di persekitaran arbitrer (tidak memerlukan meja tetap dengan kotak yang hanya memiliki satu baju kemeja)."

Seperti bukan-Mark Twain yang terkenal, "sebuah bohong boleh berjalan separuh jalan ke seluruh dunia manakala kebenaran masih memakai kasutnya." Prinsip serupa boleh diterapkan ke dalam video dalam talian. Tweet asal itu tidak benar-benar bohong, tentu saja, tetapi ia boleh diklasifikasikan sebagai pengecualian. Itu tehnik lama suratkhabar mengenai menyembunyikan pembetulan anda di muka A12. Lebih ramai orang akan terdedah kepada kesilapan awal.

Sekali lagi, saya tidak di sini untuk memberitahu anda sama ada pengecualian awal itu disengajakan (sekiranya anda memilih untuk memberikan manfaat keraguan di sini, anda boleh benar-benar melihat tweet tindak lanjut sebagai penjelasan sepenuhnya tentang konteks yang tidak lengkap). Dalam hal tertentu ini, saya menduga kebanyakan pendapat mengenai perkara itu akan berkaitan langsung dengan perasaan peribadi terhadap penulisnya.

Punca terakhir Porter yang tidak dimasukkan ke dalam pos adalah kelajuan. Teknologi itu boleh menjadi sangat perlahan pada masa bahawa jadi, ia adalah amalan yang biasa untuk mempercepatkan proses. Pada kebanyakan masa, universiti dan fasiliti penyelidikan lain melakukan kerja baik dengan menunjukkan ini melalui lapisan teks. Inilah cara untuk melakukannya. Tambahkan maklumat yang berkaitan di layar dengan cara yang sukar untuk dihapus oleh pengaruh kelaparan klik. Malah, fenomena ini adalah bagaimana 1X mendapat namanya.

Video terkini dari syarikat yang memaparkan penggunaan rangkaian neural menarik perhatian kepada fakta ini. "Video ini tidak mengandungi telepembukuan, grafik komputer, pemotongan, pempercepatan video, pemutaran lintasan bertulis," jelas syarikat itu. "Semuanya dikawal melalui rangkaian neural." Hasilnya adalah video tiga minit yang hampir terasa sangat lambat berbanding demo humanoid lain.

Seperti video blooper, saya memberikan tepuk tangan untuk ini - dan apa-apa bentuk transparansi. Untuk robot bergerak secara sangat perlahan, tiada yang salah dengan mempercepatkan proses, selagi anda mematuhi tiga peraturan penting:

  1. Mendedahkan
  2. Mendedahkan
  3. Mendedahkan

Seperti penulis lagu, syarikat harus mengakui bahawa anda tidak dapat mengawal apa yang berlaku kepada video setelah ia dimiliki oleh dunia. Tetapi tanyakan pada diri sendiri: Adakah saya melakukan semua yang dalam kekuasaan saya untuk menahan penyebaran tontonan palsu yang berpotensi?

Mungkin terlalu berharap bahawa video-video sedemikian dikawal oleh undang-undang kejujuran dalam iklan yang sama yang mengawal iklan televisyen. Walau bagaimanapun, saya akan sangat suka melihat sekumpulan ahli robotik bergabung untuk mementingkan cara disiplin berkenaan keterangan sedemikian boleh - dan harus - berfungsi.