Kumpresi memori ZeroPoint pada skala nanosecond boleh mengendalikan infrastruktur AI yang boros tenaga

AI hanya pasaran terbaru dan paling lapar untuk komputasi berprestasi tinggi, dan arkitek sistem bekerja tanpa henti untuk mengekstrak setiap titik prestasi dari setiap watt. Startup Sweden ZeroPoint, bersenjata dengan €5 juta ($5.5 juta USD) dalam pembiayaan baru, ingin membantu mereka dengan teknik kumpresi memori yang baru pada skala nanosecond - dan ya, ia tepat sama kompleksnya seperti namanya.

Memampatkan data tanpa kehilangan sebelum masuk ke dalam RAM, dan mendekompresinya selepas itu, efektif memperluaskan saluran memori sebanyak 50% atau lebih hanya dengan menambahkan satu keping kecil ke dalam cip tersebut.

Kumpresi adalah teknologi asas dalam komputasi; seperti yang dijelaskan CEO ZeroPoint, Klas Moreau, 'Kita tidak akan menyimpan data pada hard drive hari ini tanpa mengompresinya. Kajian menunjukkan bahawa 70% data dalam memori tidak perlu. Jadi mengapa kita tidak memampatkan di dalam memori?'

Jawapannya adalah kita tidak mempunyai masa. Memampatkan fail besar untuk penyimpanan (atau menyandikannya, seperti yang kita katakan apabila ia video atau audio) adalah tugas yang boleh mengambil saat, minit atau jam bergantung pada keperluan anda. Tetapi data lalui memori dalam sebahagian kecil daripada saat, bergeser masuk dan keluar secepat CPU boleh lakukan. Sekatan mikro detik tunggal, untuk mengeluarkan "bit yang tidak perlu" dalam bungkusan data yang masuk ke dalam sistem memori, akan menjadi bencana kepada prestasi.

Memori tidak semestinya meningkat pada kadar yang sama dengan kelajuan CPU, walaupun kedua-duanya (bersama dengan banyak komponen cip lain) tidak dapat dipisahkan. Jika pemproses adalah terlalu perlahan, data menyumbat dalam memori - dan jika memori terlalu perlahan, pemproses membuang kitaran menunggu tumpukan bit seterusnya. Semuanya berfungsi selari, seperti yang anda jangkakan.

Walaupun kumpresi memori super pantas telah ditunjukkan, ia menghasilkan masalah kedua: Pada dasarnya, anda perlu mendekompresi data secepat yang anda kompresi, mengembalikannya ke keadaan asal, atau sistem tidak akan mempunyai sebarang idea bagaimana untuk mengendalikannya. Jadi, kecuali anda mengubah seni bina keseluruhan anda ke mode memori terkompresi baru ini, ia tidak bererti.

ZeroPoint mendakwa telah menyelesaikan kedua-dua masalah ini dengan kumpresi memori yang hiper-pantas, tahap rendah yang tidak memerlukan sebarang perubahan sebenar kepada sisa sistem pengkomputeran. Anda menambah teknologi mereka ke cip anda, dan seolah-olah anda telah menggandakan memori anda.

Walaupun butiran-butiran halus ini kemungkinan hanya akan dipahami oleh orang-orang dalam bidang ini, asasnya cukup mudah untuk difahami oleh orang-orang awam, seperti yang dibuktikan oleh Moreau apabila dia menjelaskannya kepada saya.

'Apa yang kami lakukan adalah mengambil jumlah data yang sangat kecil - baris cache, kadang-kadang 512 bit - dan mengenalpasti corak dalamnya,' katanya. 'Itu adalah sifat data, yang dipenuhi dengan maklumat tidak efisien, maklumat yang tersebar secara jarang. Ia bergantung kepada data: Semakin rawak ia, semakin sukar ia dimampatkan. Tetapi apabila kami memeriksa beban data yang paling, kami melihat bahawa kita berada dalam julat 2-4 kali (lebih data keluaran daripada sebelum ini).

Ini bukanlah bagaimana memori sebenarnya kelihatan. Tetapi anda faham.
Kredit Gambar: ZeroPoint

Bukan rahsia bahawa memori boleh dimampatkan. Moreau berkata bahawa semua orang dalam komputasi berkeluasan tahu tentang kemungkinan itu (dia menunjukkan kertas kerja dari 2012 kepada saya yang menunjukkannya), tetapi lebih kurang menulisnya sebagai akademik, mustahil untuk dilaksanakan pada skala. Tetapi ZeroPoint, katanya, telah menyelesaikan masalah pengempungan - menyusun semula data yang dimampatkan untuk menjadi lebih efisien - dan transparansi, jadi teknologi itu tidak hanya berfungsi tetapi berfungsi dengan sangat lancar dalam sistem sedia ada. Dan semuanya berlaku dalam beberapa nanosecond.

'Kebanyakan teknologi kumpresi, sama ada perisian atau perkakasan, berada dalam julat beribu-ribu nanosecond. CXL [pautan ekspres pengiraan, piawai interkoneksi pantas] boleh menjatuhkan jumlah itu menjadi ratusan,' kata Moreau. 'Kita boleh turunkannya kepada 3 atau 4.'

Berikut adalah PTK Angelos Arelakis menjelaskannya dengan caranya:

Debut ZeroPoint pasti tepat pada masanya, dengan syarikat-syarikat di seluruh dunia mencari komputer yang lebih cepat dan lebih murah untuk melatih generasi AI baharu. Kebanyakan ‘hyperscalers’ (jika kita perlu memanggil mereka demikian) berminat pada teknologi yang boleh memberi mereka lebih banyak kuasa per watt atau membenarkan mereka mengurangkan bil elektrik sedikit.

Caveat utama untuk semua ini hanyalah bahawa, seperti yang disebutkan, ini perlu dimasukkan ke dalam cip dan digabungkan dari asas - anda tidak boleh hanya memasukkan dongle ZeroPoint ke dalam rak. Dengan itu, syarikat sedang bekerjasama dengan pengilang cip dan pemasang sistem untuk melisensikan teknik dan reka bentuk perkakasan ke dalam cip piawai untuk komputasi berprestasi tinggi.

Tentunya itu adalah Nvidia dan Intel anda, tetapi semakin banyak juga syarikat seperti Meta, Google dan Apple, yang telah merancang perkakasan khas untuk menjalankan AI dan tugas-tugas tugas mahal lain secara dalaman. ZeroPoint memposisikan teknologinya sebagai penjimatan kos, bagaimanapun, bukan premium: Sekiranya, dengan efektif menggandakan memori, teknologi itu akan membayar sendiri sebelum lama.