Công nghệ

GPTZero huy động đầu tư 3,5 triệu USD chống đạo văn AI

CEO Edward Tian và đội ngũ gồm 10 kỹ sư máy học tại GPTZero giúp mọi người có khả năng nhận biết nội dung, văn bản tạo ra từ AI.

Share
this:

Tháng 12.2022, từ phòng của mình nằm trong khu ký túc xá đại học Princeton, Edward Tian đã phát triển thành công nguyên mẫu cho công cụ phát hiện văn bản tạo ra bởi ChatGPT, GPTZero. Khi cơn sốt ChatGPT ngày càng nở rộ trên toàn thế giới, Tian bắt đầu lo lắng rằng điều này có thể khiến việc phân biệt sự khác nhau giữa nội dung do AI tạo ra với các bài báo và tiểu luận của con người trở nên khó khăn. Để giảm thiểu điều này, chàng trai 22 tuổi đã dành kỳ nghỉ đông để phát triển GPTZero và kỳ nghỉ xuân để huy động vốn hạt giống cho công ty của mình.

“Việc này giống như mở ra ‘chiếc hộp pandora’ vậy. Sự xuất hiện của ChatGPT khiến thế giới bất ngờ và tiềm ẩn nguy cơ về việc lạm dụng công cụ này,” Edward Tian chia sẻ về ChatGPT trong một cuộc phỏng vấn với Forbes hồi tháng 1.2023.

Vào ngày 8.5, GPTZero, đạt 1,2 triệu người dùng trong 5 tháng qua, thông báo đã huy động thành công 3,5 triệu USD trong vòng gọi vốn hạt giống từ các quỹ đầu tư gồm Uncork Capital, Neo và Altman Capital bên cạnh Emad Mostaque, CEO của Stability AI. Vòng gọi vốn này còn có sự tham gia từ CEO Reuters Tom Glocer và Mark Thompson, cựu CEO New York Times. “Theo tôi, việc mọi người dựa vào các đơn vị thứ ba để xây dựng lớp bảo mật cho công nghệ của họ là điều quan trọng,” Tian cho biết, đồng thời chỉ ra ngày càng xuất hiện nhiều lo ngại rằng mô hình ngôn ngữ lớn (LLM) hiện nay đang có tác động xấu lên môi trường Internet.

GPTZero sẽ quét văn bản bằng mô hình ngôn ngữ lớn riêng, tổng hợp từ các mô hình AI sử dụng mã nguồn mở khác và được huấn luyện với văn bản, nội dung do con người và AI tạo ra, bao gồm bài báo, câu hỏi và câu trả lời. Bằng cách học hỏi những mô hình AI hiện nay, GPTZero sẽ tính toán và dự báo xác suất của những từ trong một câu tạo ra từ AI. Công cụ cũng sẽ phân tích các mẫu văn bản từ việc sử dụng cú pháp và độ dài để xác định văn bản đó có phải do AI tạo ra không.

Tuy GPTZero đang hoạt động tốt, song Edward Tian thừa nhận công cụ này vẫn cần phải cải tiến liên tục. Do chatbot dựa vào dữ liệu và gợi ý để cho ra kết quả, nên công cụ này đôi khi nhầm nội dung, văn bản do con người tạo ra thành sản phẩm từ AI và ngược lại. Vì lẽ đó, GPTZero vận dụng cả nền tảng máy học và trí tuệ con người để tái tạo nội dung từ nhiều chatbot khác nhau, đảm bảo rằng công cụ này sẽ cải tiến, từ đó nâng cao mức độ chuẩn xác trong việc xác định văn bản nào tạo ra từ AI.

GPTZero có thể phát hiện văn bản tạo ra từ nhiều chatbot khác nhau, gồm Bard (Google), LLaMa (Facebook), GPT-3 và GPT-4 từ OpenAI. Sau khi ra mắt, GPTZero đã hợp tác với các tổ chức, doanh nghiệp lĩnh vực giáo dục như Canvas và K16 Solutions để thu thập dữ liệu phục vụ cho việc huấn luyện công cụ này. Giáo viên, giảng viên đánh giá GPTZero rất hữu ích trong việc phát hiện bài viết nào của học sinh sử dụng ChatGPT.

Không chỉ dừng lại ở đó, GPTZero còn có kế hoạch cung cấp dịch vụ cho nhóm khách hàng doanh nghiệp hoạt động trong các lĩnh vực xuất bản, phương tiện truyền thông xã hội và Tin cậy và An toàn (T&S). Tian cho biết chính phủ cũng là khách hàng tiềm năng, khi có thể sử dụng công cụ phát hiện chatbot để xây dựng các chính sách. Công ty hiện có 3.000 khách hàng đăng ký sử dụng GPTZero với mức phí 9,99 USD/tháng.

Công ty sẽ sớm ra mắt một plugin trình duyệt có tên Origin để đánh giá mức độ chính xác và nguồn gốc của văn bản đã được xuất bản. Thông qua Origin, GPTZero kỳ vọng sẽ hỗ trợ kiến thức truyền thông trong thời đại của trí tuệ nhân tạo nổi lên, bằng cách kiểm tra nội dung và phát hiện các trích dẫn do AI tạo ra. “Điều này không chỉ dừng lại ở việc yêu cầu học sinh sử dụng sai mục đích các công cụ, thậm chí không phải là phát hiện ra AI. Mà đó là bảo vệ công sức của con người,” Tian lý giải.

Biên dịch: Minh Tuấn