Các mô hình ngôn ngữ của Writer giúp cho doanh nghiệp tạo ra những nội dung không có thông tin sai lệch.
Vào năm 2013, May Habib đang trình duyệt qua GitHub khi cô bắt gặp công việc của giám đốc công nghệ có trụ sở tại Dubai, Waseem Alshikh, người đã nghiên cứu các kỹ thuật học máy mới ra đời để tóm tắt nhiều khối thông tin lớn.
Habib, lớn lên trong một ngôi làng nhỏ ở Lebanon trước khi nhập cư vào Canada vào những năm 90, ngay lập tức bị thu hút bởi những điểm tương đồng cô đã chia sẻ với Alshikh.
Sau hai lần khởi nghiệp trong 10 năm qua, bộ đôi này đang dẫn đầu làn sóng các công ty trí tuệ nhân tạo tổng quát hợp nhất thành xu hướng chủ đạo khi những kỹ thuật cơ bản Alshikh thử nghiệm cách đây một thập niên được những tiến bộ trong mô hình học máy và học sâu thúc đẩy.
Startup trí tuệ nhân tạo Writer của họ sử dụng mô hình ngôn ngữ lớn riêng biệt có tên là Palmyra (được đặt tên theo một thành phố cổ của Syria quê hương của Alshikh) để cho phép doanh nghiệp cũng như nhân viên viết, chỉnh sửa nội dung như email, tài liệu, quảng cáo và tóm tắt, tất cả đều sẽ tuân theo hướng dẫn biên tập của công ty.
Không giống như phần lớn các mô hình trí tuệ nhân tạo tổng quát hiện đưa ra “khả năng hư cấu” hoặc thông tin không chính xác — một vấn đề lớn đối với doanh nghiệp đang kết hợp công nghệ — CEO Habib tuyên bố rằng phiên bản mới nhất của mô hình AI ngôn ngữ của họ sẽ “không bao giờ tạo ra bất kỳ thứ gì không đúng với thực tế.” Đó là nhờ vào kiến trúc của mô hình, được thiết kế để ưu tiên độ chính xác hơn tính sáng tạo.
Điều đó hợp lý về mặt kỹ thuật ở một mức độ nào đó. “Kiến trúc mô hình chắc chắn có tác động đến tỉ lệ hư cấu,” Pranav Reddy, nhà đầu tư tại Conviction, người từng làm việc tại startup công cụ tìm kiếm trí tuệ nhân tạo tổng quát Neeva, cho biết.
“Nhưng không có cấu trúc mô hình nào đảm bảo rằng họ không hư cấu,” ông tiếp tục. Trong trường hợp hiếm hoi mà công nghệ của công ty đang tạo ra những phần hư cấu, Habib cho biết Writer làm nổi bật văn bản không có nguồn.
Khách hàng, bao gồm những gã khổng lồ như Uber, Deloitte, Spotify và Accenture, dường như đã mua sản phẩm đó cho đến nay. United Healthcare đang sử dụng mô hình tuân thủ HIPAA của Writer để kiểm tra chữ in nhỏ trong những bản kế hoạch bảo hiểm y tế, sau đó viết blog hoặc email để giải thích các kế hoạch đó cho nhà cung cấp dịch vụ y tế lẫn bệnh nhân.
Intuit sử dụng Writer để viết các bài đăng trên blog dựa trên dữ liệu tài chính, và L’Oréal sử dụng phầm mềm để viết mô tả sản phẩm cũng như thông báo tiếp thị. Khách hàng của Writer cũng có thể cung cấp cho phần mềm một podcast hoặc video để có thể chuyển nội dung thành văn bản. (Một trong những khách hàng đầu tiên của Writer là Twitter, nhưng nền tảng xã hội này vẫn chưa trả tiền sử dụng dịch vụ, Habib cho biết. Anh khởi kiện công ty thuộc sở hữu của Elon Musk vào cuối tháng 2 vì không trả tiền.)
Các mô hình của Writer được huấn luyện về thông tin công khai cũng như dữ liệu riêng của công ty như tệp PDF, hướng dẫn văn phong biên tập và từ ngữ của riêng thương hiệu, cùng nhau tạo thành 30 tỉ tham số. Mỗi công ty có phiên bản mô hình tùy chỉnh riêng, và dữ liệu được lưu trữ trên đám mây của công ty.
“Dữ liệu thực sự được sử dụng như mục lục và chúng tôi có con đường dẫn đến khả năng giải thích cho biết nguồn gốc của các sự kiện cụ thể,” Habib nói.
Công ty, được đưa vào danh sách AI 50 năm 2023, cạnh tranh trực tiếp với các startup trí tuệ tổng quát khác trong danh sách đang tăng cường cung cấp dịch vụ cho doanh nghiệp. Nhưng công ty vẫn đuổi kịp các đối thủ cạnh tranh để thu hút vốn đầu tư.
Được định giá 155 triệu USD, Writer huy động được 26 triệu USD vốn đầu tư mạo hiểm từ Insight Partners, Upfront Ventures và những công ty khác. Trong khi đó, công cụ AI viết nội dung Jasper trở thành kỳ lân huy động được 125 triệu USD vốn đầu tư mạo hiểm. Theo những người đồng sáng lập, điểm khác biệt chính của Writer là các mô hình ngôn ngữ lớn do chính công ty phát triển (không giống như Jasper, mô hình ngôn ngữ lớn được xây dựng trên GPT-3.5 của OpenAI) và huấn luyện mô hình đó trên dữ liệu cụ thể của công ty để có được kết quả chính xác hơn.
“Hầu hết các công ty trên thị trường chỉ tham gia ở lớp ứng dụng, và thậm chí còn không làm tốt điều đó. Theo đúng nghĩa đen, họ sử dụng công nghệ của người khác và đặt giao diện người dùng lên trên đó,” đồng sáng lập kiêm giám đốc công nghệ Alshikh cho biết. “Jasper là một ví dụ. Công ty chỉ là đại lý. Là một công ty AI, khi bạn không kiểm soát được chính AI của mình thì làm sao bạn kiểm soát được chất lượng đầu ra?”
Chiến lược của startup có trụ sở tại San Francisco nhằm giải quyết xu hướng tạo ra thông tin đúng sự thật của trí tuệ nhân tạo tổng quát liên quan đến cách xây dựng. Writer sử dụng công nghệ học máy, xử lý ngôn ngữ tự nhiên và chuyển đổi để hiểu văn bản cũng như tạo ra nhiều văn bản hơn. Writer kết hợp bộ mã hóa, một phần của mô hình học sâu giúp hiểu rõ văn bản, đồng thời bộ giải mã, thành phần dự đoán và tạo văn bản.
Không giống như các mô hình khác, mô hình của Writer làm cho bộ mã hóa lẫn giải mã giao tiếp với nhau. Sau khi bộ mã hóa hiểu được truy vấn, nó sẽ lấy thông tin từ cơ sở dữ liệu do công ty khách hàng tải lên và sau đó thông báo cho bộ giải mã cách tạo phản hồi dựa trên cơ sở dữ liệu đó.
“Đây là cách chúng tôi có thể làm cho văn bản đưa ra chính xác và viết bằng một ngôn ngữ không thể hiện định kiến,” Habib nói với Forbes.
Reddy, nhà đầu tư của Conviction, đồng ý rằng mặc dù mô hình mã hóa/giải mã không hoàn hảo nhưng chúng tốt hơn ChatGPT, ít nhất về mức độ chính xác.
“Các mô hình mã hóa/giải mã có xu hướng đưa ra mức độ suy diễn thấp hơn nhiều so với mô hình chỉ có bộ giải mã, đó là cấu trúc GPT-3 của OpenAI,” Reddy nói. “Sự đánh đổi bạn phải trả cho điều này là các mô hình (mã hóa/giải mã) này kém sáng tạo hơn.”
Habibs cho biết khách hàng của cô quan tâm nhiều hơn đến việc sử dụng đúng từ ngữ lẫn dấu chấm câu trong nội dung về thương hiệu của họ hơn là khả năng tạo ra câu chuyện, bản sonnet cũng như bài thơ. Bất kỳ câu chuyện nào phần mềm của Writer viết ra đều là câu chuyện có thật chứ không phải hư cấu.
Đúng với tên gọi, các công cụ của Writer chỉ tạo văn bản cũng như không tạo nội dung trực quan như hình ảnh và video — một dịch vụ mà startup mới xuất hiện về trí tuệ nhân tạo tổng quát hướng đến phục vụ cho doanh nghiệp như Typeface. Dịch vụ này có thể được tích hợp vào nhiều công cụ viết lẫn tạo nội dung bao gồm Google Docs, Microsoft Word và Figma.
Khách hàng trả từ 30.000 USD đến 1 triệu USD khi sử dụng nền tảng của Writer. Giá được tính dựa trên số lượng từ phần mềm tạo ra. Thông qua mô hình kinh doanh này, Writer dự kiến sẽ đạt doanh thu ước tính 20 triệu USD vào năm 2023.
Với mức phí tương đối thấp, Nvidia cung cấp cho Writer phần cứng (bộ xử lý đồ họa và bộ xử lý trung tâm) cho điện toán và huấn luyện dữ liệu, Alshikh cho biết.
“Hiện tại chúng tôi nhắm đến mục tiêu huấn luyện càng nhiều mô hình nhỏ hơn càng tốt để giữ chi phí rẻ cho cả khách hàng,” anh nói với Forbes.
Habib, tốt nghiệp Harvard, là phụ nữ đầu tiên trong gia đình cô học đại học và dạy gia đình cô tiếng Anh. Alshikh tự học tiếng Anh ở tuổi 20 để học khoa học máy tính. Điều này đã thôi thúc họ bắt đầu dự án kinh doanh đầu tiên vào năm 2015: một phần mềm dịch dựa trên học máy có tên Qordoba giúp các công ty như Sephora và Visa dịch nội dung kỹ thuật số sang nhiều ngôn ngữ cùng với phương ngữ khác, trước khi phát triển nội dung đó thành Writer vào năm 2020.
Biên dịch: Gia Nhi
10 tháng trước
Blaize hưởng lợi từ tham vọng phát triển AI của Trung Đông1 năm trước
OpenAI cập nhật ChatGPT10 tháng trước
ByteDance âm thầm ra mắt bốn ứng dụng AI tạo sinh