Alternatif awan sedang berkembang pesat kerana syarikat mencari akses yang lebih murah kepada GPU

Kepuasan terhadap alternatif awan tidak pernah lebih besar.

Contohnya: CoreWeave, penyedia infrastruktur GPU yang bermula sebagai operasi perlombongan mata wang kripto, minggu ini mengumpulkan $1.1 bilion dalam pembiayaan baru dari pelabur termasuk Coatue, Fidelity dan Altimeter Capital. Pusingan ini membawa penilaianan kepada $19 bilion selepas dana, dan jumlah keseluruhan yang dikumpulkan menjadi $5 bilion dalam hutang dan ekuiti — sebuah angka luar biasa bagi sebuah syarikat yang berumur kurang dari sepuluh tahun.

Bukan hanya CoreWeave.

Lambda Labs, yang juga menawarkan pelbagai contoh awan GPU yang dihostkan, pada awal April menjalankan 'kenderaan pembiayaan khas' sehingga $500 juta, beberapa bulan selepas menutup pusingan Siri C bernilai $320 juta. Tanpa keuntungan Voltage Park, yang disokong oleh miliarder kripto Jed McCaleb, pada bulan Oktober lalu mengumumkan bahawa ia sedang melabur $500 juta dalam pusat data yang disokong oleh GPU. Dan Together AI, penghost Awan GPU yang juga melakukan penyelidikan AI generatif, pada Mac mendarat $106 juta dalam pusingan yang diketuai oleh Salesforce.

Jadi mengapa ada begitu banyak keghairahan bagi ruang awan alternatif ini?

Jawapannya, seperti yang dijangkakan, adalah AI generatif.

Pada masa yang sama, permintaan untuk peralatan keras untuk menjalankan dan melatih model AI generatif dalam skala terus meningkat. GPU, dari segi senibina, merupakan pilihan logik untuk melatih, menala dan menjalankan model kerana mereka mengandungi ribuan inti yang boleh berfungsi secara serentak untuk melakukan persamaan algebra linear yang membentuk model generatif.

Tetapi memasang GPU adalah mahal. Jadi kebanyakan pembangun dan organisasi beralih kepada awan sebagai gantinya.

Pelabur di ruang komputasi awan — Amazon Web Services (AWS), Google Cloud dan Microsoft Azure — menawarkan banyak pilihan contoh GPU dan peranti khas yang dioptimumkan untuk beban kerja AI generatif. Tetapi untuk sekurang-kurangnya beberapa model dan projek, alternatif awan boleh berakhir menjadi lebih murah — dan memberikan ketersediaan yang lebih baik.

Di CoreWeave, menyewa Nvidia A100 40GB — satu pilihan popular untuk melatih model dan inferensi — kos $2.39 sejam, yang bermaksud $1,200 sebulan. Di Azure, GPU yang sama kos $3.40 sejam, atau $2,482 sebulan; di Google Cloud, ia adalah $3.67 sejam, atau $2,682 sebulan.

Diberikan beban kerja AI generatif biasanya dilakukan pada kelompok GPU, perbezaan kos dengan cepat bertambah.

'Syarikat seperti CoreWeave menyertai pasaran yang kami sebut sebagai penyedia awan 'GPU sebagai perkhidmatan' khas,' kata Sid Nag, VP perkhidmatan dan teknologi awan di Gartner, kepada TechCrunch. 'Diberikan permintaan yang tinggi terhadap GPU, mereka menawarkan alternatif kepada hiperskaler, di mana mereka telah mengambil Nvidia GPU dan memberikan laluan lain ke pasaran dan akses kepada GPU tersebut.'

Nag menunjukkan bahawa malah beberapa syarikat teknologi besar telah mula bergantung kepada penyedia awan alternatif apabila mereka berdepan dengan cabaran kapasiti pengiraan.

Pada bulan Jun yang lalu, CNBC melaporkan bahawa Microsoft telah menandatangani perjanjian bernilai beberapa bilion dengan CoreWeave untuk memastikan bahawa OpenAI, pencipta ChatGPT dan rakan rapat Microsoft, akan mempunyai daya pengiraan yang mencukupi untuk melatih model AI generatif mereka. Nvidia, penyedia sebahagian besar cip CoreWeave, melihat ini sebagai trend yang diingini, mungkin untuk alasan pengaruh; dikatakan telah memberi beberapa penyedia awan alternatif akses keutamaan kepada GPU mereka.

Lee Sustar, analis utama di Forrester, melihat vendor awan seperti CoreWeave berjaya sebahagian kerana mereka tidak mempunyai 'beban' infrastruktur yang perlu diuruskan oleh penyedia yang sudah wujud.

'Diberi dominasi hiperskaler terhadap keseluruhan pasaran awan awam, yang menuntut pelaburan besar dalam infrastruktur dan rangkaian perkhidmatan yang membuat pendapatan yang sedikit atau tidak sama sekali, pencabar seperti CoreWeave mempunyai peluang untuk berjaya dengan fokus kepada perkhidmatan AI premium tanpa beban pelaburan pada paras hiperskaler secara keseluruhan,' katanya.

Tetapi adakah pertumbuhan ini dapat berkekalan?

Sustar mempunyai keraguan. Beliau percaya bahawa pengembangan penyedia awan alternatif akan bergantung kepada sama ada mereka dapat terus membawa GPU dalam jumlah yang besar secara atas talian, dan menawarkannya pada harga yang lebih kompetitif.

Bersaing dengan harga mungkin menjadi cabaran pada masa akan datang apabila syarikat-syarikat berkuasa seperti Google, Microsoft dan AWS meningkatkan pelaburan dalam peralatan khas untuk menjalankan dan melatih model. Google menawarkan TPU mereka; Microsoft baru-baru ini mengumumkan dua cip khas, Azure Maia dan Azure Cobalt; dan AWS mempunyai Trainium, Inferentia dan Graviton.

'Hiperskaler akan menggunakan silikon khas mereka untuk mengurangkan ketergantungan mereka kepada Nvidia, manakala Nvidia akan mencari CoreWeave dan awan AI-GPU lain,' kata Sustar.

Kemudian, terdapat fakta bahawa, walaupun banyak beban kerja AI generatif berjalan dengan baik pada GPU, tidak semua beban kerja memerlukan mereka — terutamanya jika mereka tidak mempunyai keperluan masa yang kritikal. CPU boleh menjalankan pengiraan yang diperlukan, tetapi biasanya lebih perlahan daripada GPU dan peralatan khas.

Berganda-ganda, terdapat ancaman bahawa bubble AI generatif akan meletus, yang akan meninggalkan penyedia dengan barisan GPU dan tidak mencukupi pelanggan yang menuntut mereka. Tetapi masa depan kelihatan cerah dalam jangka pendek, kata Sustar dan Nag, keduanya mengharapkan aliran stabil awan baru.

'Startup awan bertumpu pada GPU akan memberikan [pusat data berkuasa] persaingan yang mencukupi, terutama di kalangan pelanggan yang sudah berbilang awan dan yang boleh mengendalikan kompleksiti pengurusan, keselamatan, risiko dan pematuhan di seluruh awan yang berlainan,' kata Sustar. 'Pelanggan awan seperti itu selesa untuk mencuba awan AI baru jika ia mempunyai kepimpinan yang kredibel, sokongan kewangan yang kukuh dan GPU tanpa masa menunggu.'