Reddit mengunci data awamnya dalam dasar kandungan baru, mengatakan penggunaan kini memerlukan kontrak

Pada hari Khamis, Reddit akan melancarkan dasar baru yang bertujuan untuk mengimbangi keinginannya untuk memberi lesen kandungannya kepada syarikat teknologi yang lebih besar, seperti Google, dan melindungi privasi pengguna. Dasar Kandungan Awam yang baru diumumkan ini kini akan menyertai dasar privasi dan dasar kandungan Reddit yang sedia ada untuk memandu bagaimana data Reddit diakses dan digunakan oleh entiti perniagaan dan rakan lain. Berkaitan dengan ini, syarikat juga mengumumkan subreddit yang didedikasikan kepada penyelidik yang bekerja dengan data Reddit.

Pengumuman ini datang tidak lama selepas Reddit membuat penyenaraian di pasaran sahamnya, yang melihat syarikat itu memposisikan dirinya untuk meningkatkan pendapatan bukan sahaja daripada iklan yang berjalan di platformnya dan penggunaan API oleh pembangun tetapi juga dari korpus datanya. Syarikat itu dalam prospektus IPOnya mengatakan bahawa mereka telah menjana $203 juta melalui perjanjian lesen data dan mengharapkan jumlah tersebut akan meningkat dari semasa ke semasa.

Walaupun Reddit tidak pernah secara historis menghalang akses ke data mereka untuk tujuan latihan kecerdasan buatan, mereka mengubah haluan mereka tahun lalu. CEO Reddit, Steve Huffman, memberitahu The New York Times bahawa tidak masuk akal bagi Reddit untuk terus memberikan 'semua nilai itu kepada beberapa syarikat terbesar di dunia secara percuma,' menandakan rancangan syarikat untuk bergerak ke ruang lesen data.

Dengan usaha-usaha itu kini berjalan lancar, Dasar Kandungan Awam baru akan mengunci akses ke data Reddit tanpa perjanjian. (Reddit mengatakan mereka tidak menambah sekatan baru, hanya mempublikasikan dasar yang telah mereka miliki secara dalaman untuk tempoh yang tertentu.)

'Malangnya, kami melihat semakin ramai entiti perniagaan menggunakan akses tanpa kebenaran atau menyalahgunakan akses yang dibenarkan untuk mengumpulkan data awam dalam jumlah besar, termasuk kandungan awam Reddit,' tulis Reddit dalam blog mereka. 'Lebih teruk, entiti-entiti ini menganggap mereka tidak mempunyai batasan pada penggunaan data tersebut, dan mereka melakukannya tanpa mengambil kira hak pengguna atau privasi, mengabaikan permintaan dalaman yang munasabah, keselamatan, dan penarikan pengguna. Walaupun kami akan terus berusaha untuk menghalang pihak-pihak yang diketahui sebagai pelaku buruk, kami perlu melakukan lebih untuk menyekat akses ke kandungan awam Reddit secara meluas kepada pihak-pihak yang boleh dipercayai yang telah bersetuju untuk mematuhi dasar-dasar kami. Tetapi kami juga perlu terus memastikan bahawa pengguna, mod, penyelidik, dan entiti lain yang beriktikad baik dan bukan perniagaan mempunyai akses.'

Dengan kata lain, akses kepada data Reddit untuk penyelidikan dan usaha-usaha bukan komersial akan terus berlanjut, tetapi entiti-entiti yang ingin menggunakan data Reddit untuk tujuan lain - termasuk untuk latihan kecerdasan buatan - akan perlu membayar. Dalam grafik yang dikongsi dalam blog, Reddit menjelaskan bahawa perniagaan yang berminat untuk menggunakan data Reddit untuk 'memacu, melengkapi atau meningkatkan produk anda untuk sebarang tujuan komersial' memerlukan kontrak.

Kredit Gambar: Reddit

Pengiklan pula diarahkan ke API iklan untuk menguruskan kempen dan melacak prestasi mereka.

Oleh kerana syarikat ini pada dasarnya hanyalah laman web besar, yang boleh diindeks oleh enjin carian, dasar baru ini bertujuan untuk mengunci kandungan Reddit dari sebarang pengumpulan tidak sah sambil menghormati hak pengguna.

Contohnya, Reddit mengatakan rakan kongsi mereka harus memuat naik keputusan pengguna untuk memadam kandungan mereka. Oleh itu, jika pengguna tidak mahu pos peribadi mereka menjadi bahan bakar bagi enjin kecerdasan buatan masa depan, mereka harus boleh mengecualikan diri. Rakan kongsi juga dihalang oleh dasar baru dari menggunakan kandungan Reddit untuk mengenal pasti individu atau maklumat peribadi mereka, termasuk untuk penargetan iklan. Rakan kongsi juga tidak boleh menggunakan kandungan Reddit untuk spam atau mengganggu pengguna atau menjalankan 'semakan latar belakang, pengenalan muka, pengawasan kerajaan, atau membantu penguatkuasaan undang-undang melakukan mana-mana di atas.'

Dasar tersebut juga menyekat akses kepada media dewasa dan menjelaskan bahawa Reddit tidak akan menjual maklumat peribadi pengguna. Syarikat juga mencatat bahawa mereka tidak akan pernah memberikan lesen untuk kandungan bukan awam seperti mesej peribadi atau maklumat akaun bukan awam, seperti emel pengguna atau sejarah penyemakan, antara perkara lain.

Untuk membantu penyelidik yang ingin menggunakan data Reddit untuk tujuan bukan komersial, syarikat ini telah menubuhkan subreddit baru, r/reddit4researchers. Syarikat mengatakan mereka bermitra dengan OpenMined untuk juga mengembangkan program untuk membimbing dan memperluaskan kerjasama penyelidik dengan Reddit.