## Các công cụ mới giúp hiện thực hóa tham vọng về “lực lượng lao động AI” vào năm 2025
Ngành công nghiệp trí tuệ nhân tạo (AI) đang nỗ lực biến “các tác nhân AI” – những phần mềm AI có khả năng thực hiện nhiều bước hành động thay người dùng – thành hiện thực. Nhiều công ty công nghệ, bao gồm Google, gần đây đã nhấn mạnh các tính năng mang tính tác nhân. Tháng 1 năm nay, CEO Sam Altman của OpenAI đã viết rằng năm 2025 sẽ là năm các tác nhân AI “gia nhập lực lượng lao động”. OpenAI đang nỗ lực biến lời hứa đó thành hiện thực.
Hôm thứ Ba, OpenAI đã ra mắt “Responses API” mới, được thiết kế để giúp các nhà phát triển phần mềm tạo ra các tác nhân AI có thể thực hiện nhiệm vụ độc lập bằng cách sử dụng các mô hình AI của công ty. Responses API cuối cùng sẽ thay thế Assistants API hiện tại, mà OpenAI dự định ngừng hoạt động vào nửa đầu năm 2026. Với sản phẩm mới này, người dùng có thể phát triển các tác nhân AI tùy chỉnh có khả năng quét file công ty bằng tiện ích tìm kiếm file, nhanh chóng kiểm tra cơ sở dữ liệu công ty (với cam kết của OpenAI là không huấn luyện mô hình của họ trên các file này) và điều hướng trang web – tương tự như các chức năng có sẵn thông qua tác nhân Operator của OpenAI. Các nhà phát triển cũng có thể truy cập vào mô hình Computer-Using Agent (CUA) để tự động hóa các tác vụ như nhập liệu và các hoạt động khác. Tuy nhiên, OpenAI thừa nhận rằng mô hình CUA của họ vẫn chưa đáng tin cậy để tự động hóa các tác vụ trên hệ điều hành và có thể mắc lỗi ngoài ý muốn. Công ty mô tả API mới này là một phiên bản đầu tiên và sẽ tiếp tục cải thiện theo thời gian.
Các nhà phát triển sử dụng Responses API có thể truy cập cùng các mô hình hỗ trợ ChatGPT Search: GPT-4o search và GPT-4o mini search. Các mô hình này có thể duyệt web để trả lời câu hỏi và trích dẫn nguồn trong câu trả lời của chúng. Điều đáng chú ý là OpenAI cho biết khả năng tìm kiếm web được bổ sung đã cải thiện đáng kể độ chính xác thực tế của các mô hình AI của họ. Trên chuẩn SimpleQA của OpenAI, nhằm mục đích đo lường tỷ lệ bịa đặt, GPT-4o search đạt 90%, trong khi GPT-4o mini search đạt 88% – đều vượt trội so với mô hình GPT-4.5 lớn hơn không có tính năng tìm kiếm, chỉ đạt 63%.
Mặc dù có những cải tiến này, công nghệ này vẫn còn những hạn chế đáng kể. Bên cạnh các vấn đề về việc CUA điều hướng trang web một cách chính xác, khả năng tìm kiếm được cải thiện không hoàn toàn giải quyết được vấn đề bịa đặt của AI, với GPT-4o search vẫn mắc lỗi thực tế 10% số lần.
Cùng với Responses API, OpenAI đã phát hành bộ công cụ Agents SDK mã nguồn mở, cung cấp cho các nhà phát triển các công cụ miễn phí để tích hợp các mô hình với hệ thống nội bộ, triển khai các biện pháp bảo vệ và giám sát hoạt động của tác nhân. Bộ công cụ này nối tiếp việc phát hành Swarm trước đó của OpenAI, một khung để dàn xếp nhiều tác nhân.
Đây vẫn là những ngày đầu của lĩnh vực tác nhân AI, và mọi thứ có thể sẽ được cải thiện nhanh chóng. Tuy nhiên, hiện tại, phong trào tác nhân AI vẫn dễ bị tổn thương trước những tuyên bố không thực tế, như đã được chứng minh đầu tuần này khi người dùng phát hiện ra rằng nền tảng tác nhân AI Manus của công ty khởi nghiệp Trung Quốc Butterfly Effect không đáp ứng được nhiều lời hứa của mình, làm nổi bật khoảng cách dai dẳng giữa các tuyên bố quảng cáo và chức năng thực tế trong lĩnh vực công nghệ mới nổi này.
Nguồn: https://arstechnica.com/ai/2025/03/openai-pushes-ai-agent-capabilities-with-new-developer-api/