Daftar Isi
Jakarta, CNN Indonesia —
Kecerdasan buatan (AI) diduga menjadi biang kerok pemutusan hubungan kerja (PHK) besar-besaran yang dilakukan raksasa streaming musik Spotify tahun ini. Berikut penjelasannya.
Sepanjang tahun 2023, Spotify sudah tiga kali melakukan PHK; 590 posisi pada Januari, 200 posisi pada Juni, dan pekan lalu 1.500 karyawan terkena PHK. Spotify berdalih PHK dilakukan dengan alasan penghematan biaya.
Namun, di sisi lain, Spotify saat ini dilaporkan mulai beralih untuk melakukan investasi lebih besar pada AI guna meningkatkan margin bagi divisi podcasting dan audiobook.
ADVERTISEMENT
SCROLL TO CONTINUE WITH CONTENT
“Spotify memanfaatkan AI di seluruh platformnya, meluncurkan AI DJ, menyimulasikan pengalaman radio tradisional, di 50 pasar tambahan dan meluncurkan AI Voice Translation untuk podcast,” kata Justin Patterson, analis riset ekuitas di KeyBanc Capital Markets, dalam sebuah catatan penelitian, mengutip CNN.
“Ditambah dengan peluncuran buku audio ke Pelanggan Premium, kami yakin Spotify memiliki beberapa peluang untuk mendorong keterlibatan dan pada akhirnya monetisasi yang lebih kuat.” tambahnya.
Saham perusahaan induk Spotify Technology SA naik lebih dari 30 persen selama enam bulan terakhir dan naik lebih dari 135 persen year to date.
Perusahaan streaming musik ini bergabung dengan perusahaan teknologi lain untuk melakukan penghematan karena permintaan di era pandemi telah berkurang.
Mereka juga harus membayar lebih dari US$1 miliar (Rp15,6 triliun) yang dihabiskan untuk podcasting, yang sebagian besar digunakan untuk kesepakatan dengan selebriti untuk membuat podcast yang tidak pernah terwujud dan mengakuisisi studio podcast yang kemudian ditutup.
Beranjak gunakan kecerdasan AI
Pada bulan November, Spotify meluncurkan kemitraan dengan Google Cloud untuk merombak cara platform tersebut merekomendasikan buku audio dan podcast melalui penggunaan salah satu model bahasa Google Cloud, Vertex AI Search.
Spotify memperkenalkan “AI DJ” pada bulan Februari dan mulai menggunakan alat terjemahan suara “Whisper” OpenAI untuk menerjemahkan episode podcast berbahasa Inggris tertentu ke dalam bahasa Spanyol, Prancis, dan Jerman.
Perwakilan Spotify mengatakan bahwa perusahaan berencana untuk memperluas teknologinya di masa depan sambil menunggu masukan dari kreator dan pendengar.
Dalam catatan penelitiannya, Douglas Anmuth, Direktur Pelaksana dan Analis Internet di JP Morgan, mengatakan bahwa selain investasi artis pada iklan, investasi pada podcast berpotensi mendorong keterlibatan dalam jangka panjang.
Pendekatan personal Spotify.
Spotify telah mempersonalisasikan pengalamannya bagi pengguna selama sekitar satu dekade. Sentuhan pribadi tersebut dapat ditambahkan setelah mengakuisisi perusahaan analisis musik, The Echo Nest Corp, pada tahun 2014, untuk menggabungkan pembelajaran mesin dan pemrosesan bahasa alami.
Teknologi Spotify membangun database lagu dan artis dengan mengenali nada dan tempo musik serta menghubungkan karya artis dalam konteks budaya bersama.
Metadata seperti tanggal rilis dan metrik seperti volume, durasi, dan seberapa besar kemungkinan sebuah lagu membuat seseorang menari juga ikut menentukan lagu mana yang sesuai dengan selera pengguna.
Dari sini, lahirlah playlist seperti “Daily Mix” dan “Discover Weekly”. Daftar putar yang disebut “Time Capsules” dan “On Repeat” mengumpulkan lagu-lagu yang paling sering didengarkan pengguna, untuk membuat pengguna tetap terhubung dengan apa yang sudah mereka dengarkan atau mengunjungi kembali lagu-lagu yang sudah lama tidak mereka dengar.
Tantangan dan peluang
Reece Hayden, analis senior di ABI Research, menyatakan keyakinannya bahwa model bahasa besar (LLM) dapat berfungsi untuk meningkatkan keterlibatan di seluruh platform Spotify.
“Model bahasa besar dapat meningkatkan personalisasi, meningkatkan rekomendasi, dan memastikan rekomendasi lebih mencerminkan minat pengguna dengan memahami keseluruhan teks/video daripada menggunakan kata kunci/metadata,” kata Reece.
Dia menambahkan bahwa tidak seperti “model prediktif dasar” yang bergantung pada kata kunci/metadata, LLM dapat memahami dan menafsirkan podcast untuk melihat apakah podcast tersebut sesuai dengan minat pengguna dan dapat memperoleh pemahaman yang lebih mendalam tentang preferensi pengguna dengan menganalisis semua data pengguna untuk menentukan preferensi mereka.
“Menjalankan LLM untuk memahami semua podcast/buku audio membutuhkan banyak sumber daya dan mungkin memberikan nilai tambah yang terbatas dibandingkan dengan model prediktif dasar, LLM menghadirkan privasi data tambahan dan tantangan biaya/sumber daya yang akan menjadi signifikan,” katanya.
Dia menyatakan keyakinannya pada Whisper untuk membantu menerjemahkan podcast tetapi mengakui bahwa kesalahan mungkin terjadi dalam bentuk kalimat atau frasa yang salah saat dipelajari oleh AI generatif.
“Mengingat ketersediaan titik data, model terjemahan bahasa yang berbeda seperti Whisper akan meningkat dengan cepat, memastikan tingkat akurasi yang tinggi,” katanya.
“Kelemahan dari Whisper adalah kompetensi intinya adalah menerjemahkan dari bahasa lain ke bahasa Inggris. Sebagian besar podcast direkam dalam bahasa Inggris. Oleh karena itu tidak dapat diterapkan secara efektif secara menyeluruh,” pungkasnya.
(rfi/dmi)
[Gambas:Video CNN]