AI “cấp độ Tiến sĩ”: OpenAI hé lộ gói dịch vụ 20.000 USD – Phân tích sâu

Thung lũng Silicon có thể đánh giá cao những “bác sĩ ảo” không hoàn hảo hơn cả các trường đại học trả lương cho những người thật sự có bằng Tiến sĩ.

Ngành công nghiệp AI đang rộ lên một thuật ngữ mới: “AI cấp Tiến sĩ”. Theo một báo cáo từ The Information, OpenAI có thể đang lên kế hoạch ra mắt một số sản phẩm “agent” (chương trình tác nhân) AI chuyên biệt, bao gồm cả gói dịch vụ 20.000 USD/tháng tập trung vào hỗ trợ “nghiên cứu cấp Tiến sĩ”. Các agent khác được cho là đang được lên kế hoạch bao gồm trợ lý cho “người lao động tri thức thu nhập cao” với giá 2.000 USD/tháng và agent lập trình viên phần mềm với giá 10.000 USD/tháng. OpenAI vẫn chưa xác nhận các mức giá này, nhưng họ đã đề cập đến khả năng AI cấp Tiến sĩ trước đây. Vậy chính xác “AI cấp Tiến sĩ” là gì? Thuật ngữ này đề cập đến các mô hình được cho là thực hiện các nhiệm vụ đòi hỏi chuyên môn cấp tiến sĩ. Bao gồm các tác nhân tiến hành nghiên cứu nâng cao, viết và gỡ lỗi mã phức tạp mà không cần sự can thiệp của con người, và phân tích các tập dữ liệu lớn để tạo ra các báo cáo toàn diện. Điều then chốt là các mô hình này có thể giải quyết các vấn đề thường đòi hỏi nhiều năm đào tạo học thuật chuyên ngành.

Các công ty như OpenAI dựa trên kết quả các bài kiểm tra chuẩn để khẳng định “cấp Tiến sĩ”. Ví dụ, các mô hình dòng o1 của OpenAI được cho là đã đạt kết quả tốt trong các bài kiểm tra khoa học, lập trình và toán học, với kết quả tương tự như sinh viên Tiến sĩ trong các nhiệm vụ khó. Công cụ Nghiên cứu Sâu (Deep Research) của công ty, có thể tạo ra các bài báo nghiên cứu với trích dẫn, đã đạt được 26,6% điểm trong “Kỳ thi cuối cùng của nhân loại” (Humanity’s Last Exam), một bài đánh giá toàn diện bao gồm hơn 3.000 câu hỏi trên hơn 100 môn học. Thành tựu mới nhất của OpenAI trong lĩnh vực này đến từ các mô hình o3 và o3-mini, được công bố vào tháng 12. Những mô hình này được xây dựng dựa trên dòng o1 được ra mắt hồi đầu năm ngoái. Giống như o1, các mô hình o3 sử dụng cái mà OpenAI gọi là “chuỗi tư duy riêng tư” (private chain of thought), một kỹ thuật lập luận mô phỏng nơi mô hình chạy qua một cuộc đối thoại nội bộ và lặp đi lặp lại để giải quyết vấn đề trước khi đưa ra câu trả lời cuối cùng. Cách tiếp cận này được cho là phản ánh cách các nhà nghiên cứu con người dành thời gian suy nghĩ về các vấn đề phức tạp thay vì đưa ra câu trả lời ngay lập tức. Theo OpenAI, càng dành nhiều thời gian tính toán suy luận, bạn càng nhận được câu trả lời tốt hơn.

Vậy nên điểm mấu chốt là: Với 20.000 USD, khách hàng có thể mua được rất nhiều “thời gian suy nghĩ” cho mô hình AI để giải quyết các vấn đề khó khăn. Theo OpenAI, o3 đạt điểm kỷ lục trong bài kiểm tra chuẩn ARC-AGI về lập luận trực quan, đạt 87,5% trong thử nghiệm tính toán cao – tương đương với hiệu suất của con người ở mức 85%. Mô hình này cũng đạt 96,7% trong kỳ thi Toán học Hoa Kỳ năm 2024, chỉ sai một câu hỏi, và đạt 87,7% trong GPQA Diamond, bao gồm các câu hỏi sinh học, vật lý và hóa học ở trình độ sau đại học. Trong bài kiểm tra chuẩn Toán học Tiên tiến (Frontier Math) của EpochAI, o3 giải được 25,2% bài toán, trong khi không có mô hình nào khác vượt quá 2% – cho thấy một bước nhảy vọt về khả năng lập luận toán học so với mô hình trước đó. Lý tưởng nhất, các ứng dụng tiềm năng cho một mô hình AI cấp Tiến sĩ thực sự sẽ bao gồm phân tích dữ liệu nghiên cứu y tế, hỗ trợ mô hình khí hậu và xử lý các khía cạnh thường lệ của công việc nghiên cứu.

Mức giá cao mà The Information đưa ra, nếu chính xác, cho thấy OpenAI tin rằng các hệ thống này có thể mang lại giá trị đáng kể cho các doanh nghiệp. Tờ báo lưu ý rằng SoftBank, một nhà đầu tư của OpenAI, đã cam kết chi 3 tỷ USD cho các sản phẩm agent của OpenAI chỉ riêng trong năm nay – cho thấy sự quan tâm kinh doanh đáng kể bất chấp chi phí. Trong khi đó, OpenAI đang đối mặt với áp lực tài chính có thể ảnh hưởng đến chiến lược định giá cao cấp của mình. Công ty được cho là đã lỗ khoảng 5 tỷ USD năm ngoái để trang trải chi phí hoạt động và các chi phí khác liên quan đến việc vận hành các dịch vụ của mình.

Tin tức về kế hoạch định giá “trên trời” của OpenAI xuất hiện sau nhiều năm cung cấp các dịch vụ AI tương đối rẻ tiền, khiến người dùng quen với việc mong đợi các khả năng mạnh mẽ với chi phí tương đối thấp. ChatGPT Plus vẫn giữ mức giá 20 USD/tháng và Claude Pro có giá 30 USD/tháng – cả hai đều chỉ là một phần nhỏ so với các gói doanh nghiệp được đề xuất này. Ngay cả gói đăng ký ChatGPT Pro 200 USD/tháng cũng tương đối nhỏ so với các khoản phí mới được đề xuất. Liệu sự khác biệt về hiệu năng giữa các gói này có tương xứng với sự chênh lệch giá cả gấp hàng nghìn lần hay không vẫn là một câu hỏi mở.

Mặc dù có hiệu suất tốt trong các bài kiểm tra chuẩn, các mô hình lập luận mô phỏng này vẫn gặp khó khăn với việc bịa đặt – những trường hợp chúng tạo ra thông tin nghe có vẻ hợp lý nhưng không chính xác về mặt thực tế. Đây vẫn là một mối quan ngại quan trọng đối với các ứng dụng nghiên cứu, nơi độ chính xác và độ tin cậy là tối quan trọng. Một khoản đầu tư 20.000 USD/tháng đặt ra câu hỏi liệu các tổ chức có thể tin tưởng các hệ thống này không đưa ra các lỗi nhỏ vào các nghiên cứu có rủi ro cao hay không.

Phản hồi lại tin tức này, một số người đã nói đùa trên mạng xã hội rằng các công ty có thể thuê một sinh viên Tiến sĩ thực sự với giá rẻ hơn nhiều. “Trong trường hợp bạn quên mất,” nhà phát triển xAI Hieu Pham đã viết trong một tweet lan truyền, “hầu hết sinh viên Tiến sĩ, bao gồm cả những người xuất sắc nhất có thể làm việc tốt hơn nhiều so với bất kỳ LLM nào hiện nay – đều không được trả 20.000 USD/tháng.”

Mặc dù các hệ thống này thể hiện khả năng mạnh mẽ trong các bài kiểm tra chuẩn cụ thể, nhãn hiệu “cấp Tiến sĩ” vẫn chủ yếu là một thuật ngữ tiếp thị. Các mô hình này có thể xử lý và tổng hợp thông tin với tốc độ ấn tượng, nhưng vẫn còn nhiều câu hỏi về hiệu quả của chúng trong việc xử lý tư duy sáng tạo, hoài nghi trí tuệ và nghiên cứu gốc mà định nghĩa công việc ở cấp tiến sĩ thực sự. Mặt khác, chúng sẽ không bao giờ mệt mỏi hoặc cần bảo hiểm y tế, và chúng có thể sẽ tiếp tục cải thiện khả năng và giảm chi phí theo thời gian.

Nguồn: https://arstechnica.com/ai/2025/03/what-does-phd-level-ai-mean-openais-rumored-20000-agent-plan-explained/

Optimized by Optimole