Khi đài phát thanh truyền thống ngày càng trở nên không còn phù hợp với thính giả trẻ tuổi, tính năng phát thanh mới sử dụng AI của Spotify, “DJ,” đang thổi luồng sinh khí mới trong lĩnh vực này.
Nổi bật với danh sách được tuyển chọn kèm theo bình luận bằng giọng nói xung quanh các bản nhạc, Spotify lần đầu ra mắt DJ cho người dùng ở Hoa Kỳ và Canada vào tháng 2.
Trải nghiệm được cá nhân hóa cho từng người dùng, không giống như đài phát thanh truyền thống. Tuy nhiên, phần bình luận bằng giọng nói được tạo ra thông qua Sonantic sử dụng trí tuệ nhân tạo, một công cụ giọng nói được Spotify mua lại hồi năm ngoái.
Giờ đây, chỉ vài tháng sau, Spotify mở rộng tính năng này cho người dùng Spotify Premium ở Vương quốc Anh và Ireland. Hiện người dùng ở các thị trường đó sử dụng được tính năng này trên cả thiết bị iOS và Android, có thể truy cập thông qua nguồn cấp dữ liệu nhạc bằng cách nhấn vào thẻ DJ.
Theo Spotify, quyết định mở rộng sang những thị trường đó do tác động từ sự tương tác trên mạng xã hội của người dùng ở Vương quốc Anh và Ireland.
Xavier “X” Jernigan, trưởng phòng quản lý mối quan hệ với các đối tác trong lĩnh vực văn hóa của Spotify, đóng một vai trò quan trọng trong sự phát triển của “DJ.”
Giọng nói của DJ không chỉ được mô phỏng theo giọng của X mà anh còn làm việc với nhóm biên tập âm nhạc, người viết kịch bản và chuyên gia văn hóa của Spotify để đảm bảo DJ cung cấp thông tin phù hợp nhất cho người dùng, bổ sung thêm yếu tố con người khi huấn luyện AI.
“Chúng tôi có các chuyên gia văn hóa cũng như nhà sản xuất sáng tạo. Chúng tôi sử dụng tất cả kiến thức về văn hóa và những gì đang diễn ra trong âm nhạc, mối quan hệ với nghệ sĩ lẫn hãng thu âm để trợ giúp trong quá trình tuyển chọn,” anh nói. “Điều đó giúp cải tiến DJ.”
Jernigan không còn xa lạ với người nghe Spotify. Anh từng là người dẫn chương trình podcast buổi sáng “The Get Up.” Anh nói rằng chương trình đóng vai trò quan trọng trong việc phát triển giọng nói cho DJ, vì anh không có kinh nghiệm dẫn chương trình phát thanh chính thức.
Jernigan nhấn mạnh rằng người nghe điều chỉnh để nghe suy nghĩ của người dẫn chương trình đồng thời đưa ra các tiêu đề chứ không chỉ vì những tiêu đề đó. Anh coi DJ sử dụng AI như một người bạn hiểu biết, đáng tin, chia sẻ âm nhạc lẫn văn hóa cho người nghe.
Công nghệ của Spotify tạo ra trải nghiệm nghe chân thực, trong đó Jernigan ca ngợi công nghệ AI giọng nói vì âm thanh giống như anh đang nói đồng thời thu hút người nghe say mê cũng như kết nối.
“Bạn nói nghe như giống tôi đang dẫn chương trình, mẹ tôi cũng nghĩ vậy. Khi tôi mở cho bà nghe, bà không nhận ra đó là giọng nói AI và tính năng chuyển văn bản thành giọng nói, mà bà nghĩ đó là giọng của tôi,” anh cho biết.
Ghi lại cơ sở dữ liệu giọng nói là một quá trình chuyên sâu. Mặc dù Jernigan không tiết lộ quá trình huấn luyện mô hình giọng nói mất bao lâu, nhưng quá trình này bao gồm việc Jernigan ghi lại các dòng kịch bản để huấn luyện mô hình, tập trung vào việc tạo ra âm điệu trò chuyện cũng như kết nối với người nghe.
“Chúng tôi không cạnh tranh với đài phát thanh, bởi vì tính năng này phục vụ nhu cầu của từng cá nhân. Còn các chương trình phát thanh phục vụ đại chúng,” anh nói.
Emily Galloway, trưởng phòng thiết kế sản phẩm cá nhân hóa của Spotify, giải thích rằng nền tảng này sử dụng công nghệ AI và học máy để cá nhân hóa đồng thời thúc đẩy chương trình khám phá trong nhiều năm, với Discover Weekly là danh sách phát thành công đầu tiên được tạo bằng thuật toán của công ty vào năm 2015.
Công ty quyết định bổ sung tính năng sử dụng AI do trên thực tế ngữ cảnh tạo ra mức ảnh hưởng lớn lên khả năng khám phá. Kể từ khi ra mắt DJ, Spotify nhận thấy rằng khi thính giả nghe bình luận, họ càng muốn thử điều gì mới cũng như sẵn sàng thử nghe bài hát họ có thể bỏ qua.
Spotify muốn tính năng đài phát thanh sử dụng AI dễ tiếp cận, giống con người, và thân thiện, nên lựa chọn Jernigan, người thu hút thính giả nồng nhiệt lắng nghe “The Get Up.” Sự kết hợp giữa các thuật toán đề xuất của Spotify với mô hình giọng nói của Jernigan cho thấy đây là một cải tiến thành công cho trải nghiệm nghe.
Người dùng tích cực nghe cũng như khám phá kể từ khi DJ ra mắt. Trong đó, người dùng thế hệ Y và Z chiếm 87%. Tỉ lệ này cho thấy hai nhóm này không còn nghe những chương trình phát thanh truyền thống nữa.
“Chúng tôi không thiết kế chương trình phát thanh mà chúng tôi thiết kế cách thể hiện tính cách của từng cá nhân,” Galloway nói. “Thực sự chúng tôi đang hướng tới việc tạo ra những kết nối có ý nghĩa hơn giữa thính giả với người sáng tạo lẫn nghệ sĩ.”
Biên dịch: Gia Nhi
———————
Xem thêm:
Spotify gỡ bỏ ‘hàng chục ngàn’ bài hát do AI tạo ra
CEO của Spotify nhìn thấy cơ hội thu hút thêm nhà sáng tạo từ AI
11 tháng trước
Mối băn khoăn lớn nhất về AI1 năm trước
Twitter đóng cửa trung tâm quản lý ở Brussels3 năm trước
Giá vàng phá ngưỡng kháng cự 60 triệu đồng/lượng1 năm trước
Spotify dùng AI để phiên dịch giọng nói