Mô hình chatGPT -GPT-4 chính thức ra mắt hôm 14/3/2022 thoe như email từ hãng gửi đến người dùng.
Theo đó GPT-4 được xem là bản nâng cấp toàn diện so với model GPT3.5 .
Trong nỗ lực của OpenAI trong việc mở rộng quy mô học tập sâu. GPT-4 là một mô hình đa phương thức lớn (chấp nhận đầu vào hình ảnh và văn bản, phát ra đầu ra văn bản), mặc dù kém khả năng hơn con người trong nhiều tình huống trong thế giới thực, nhưng lại thể hiện hiệu suất ở cấp độ con người trên nhiều tiêu chuẩn chuyên môn và học thuật.
Ví dụ: nó (GPT-4) vượt qua kỳ thi thanh mô phỏng với số điểm nằm trong khoảng 10% người dự thi cao nhất; ngược lại, điểm của GPT-3.5 nằm ở khoảng 10% dưới cùng.
Chúng tôi đã dành 6 tháng lặp đi lặp lại việc điều chỉnh GPT-4 bằng cách sử dụng các bài học từ chương trình thử nghiệm đối thủ cũng như ChatGPT, mang lại kết quả tốt nhất từ trước đến nay (mặc dù còn lâu mới hoàn hảo) về tính thực tế, khả năng điều khiển và từ chối vượt ra ngoài phạm vi bảo vệ.
Một số điểm chú ý của mô hình chat GPT-4 mới
Hiệu Suất
Trong một cuộc trò chuyện thông thường, sự khác biệt giữa GPT-3.5 và GPT-4 có thể không rõ ràng. Sự khác biệt xuất hiện khi mức độ phức tạp của tác vụ đạt đến ngưỡng đủ—GPT-4 đáng tin cậy hơn, sáng tạo hơn và có thể xử lý nhiều hướng dẫn sắc thái hơn nhiều so với GPT-3.5.

Ở 24 trong số 26 ngôn ngữ được thử nghiệm, GPT-4 vượt trội so với hiệu suất ngôn ngữ tiếng Anh của GPT-3.5 và các LLM khác (Chinchilla, PaLM), bao gồm cả các ngôn ngữ sử dụng ít tài nguyên như tiếng Latvia, tiếng Wales và tiếng Swahili:
Đa dạng phong cách
Chúng tôi đang nghiên cứu từng khía cạnh của kế hoạch được nêu trong bài đăng của chúng tôi về việc xác định hành vi của AI, bao gồm cả khả năng điều khiển.
Thay vì tính cách ChatGPT cổ điển với độ dài, giọng điệu và phong cách cố định, các nhà phát triển (và sắp tới là người dùng ChatGPT) giờ đây có thể quy định phong cách và nhiệm vụ AI của họ bằng cách mô tả các hướng đó trong thông báo “hệ thống”.
Thông báo hệ thống cho phép người dùng API tùy chỉnh đáng kể trải nghiệm người dùng của họ trong giới hạn. Chúng tôi sẽ tiếp tục cải tiến ở đây (và đặc biệt biết rằng thông báo hệ thống là cách dễ nhất để “bẻ khóa” mô hình hiện tại, tức là việc tuân thủ các giới hạn không hoàn hảo), nhưng chúng tôi khuyến khích bạn dùng thử và cho chúng tôi biết điều gì bạn nghĩ.
Quy trình đào tạo
Giống như các mô hình GPT trước đây, mô hình cơ sở GPT-4 đã được đào tạo để dự đoán từ tiếp theo trong tài liệu và được đào tạo bằng cách sử dụng dữ liệu có sẵn công khai (chẳng hạn như dữ liệu internet) cũng như dữ liệu chúng tôi đã cấp phép.
Dữ liệu là một kho dữ liệu có quy mô trang web bao gồm các giải pháp đúng và sai cho các bài toán, lập luận yếu và mạnh, các tuyên bố nhất quán và mâu thuẫn, đồng thời đại diện cho rất nhiều hệ tư tưởng và ý tưởng.
Hạn chế
Bất chấp khả năng của mình, GPT-4 có những hạn chế tương tự như các mẫu GPT trước đó. Quan trọng nhất, nó vẫn chưa hoàn toàn đáng tin cậy (nó “gây ảo giác” cho các sự kiện và đưa ra các lỗi lập luận). Cần hết sức cẩn thận khi sử dụng các kết quả đầu ra của mô hình ngôn ngữ, đặc biệt là trong các ngữ cảnh có mức độ rủi ro cao, với giao thức chính xác (chẳng hạn như đánh giá của con người, tiếp cận với ngữ cảnh bổ sung hoặc tránh hoàn toàn việc sử dụng mức độ rủi ro cao) phù hợp với nhu cầu của một trường hợp sử dụng cụ thể .
Tương lai với đầu vào là hình ảnh trực quan
GPT-4 có thể chấp nhận prompt là văn bản và hình ảnh—song song với cài đặt chỉ văn bản—cho phép người dùng chỉ định bất kỳ tác vụ ngôn ngữ hoặc hình ảnh nào. Cụ thể, nó tạo ra các đầu ra văn bản (ngôn ngữ tự nhiên, mã, v.v.) với các đầu vào bao gồm văn bản và hình ảnh xen kẽ. Hơn nữa, nó có thể được tăng cường bằng các kỹ thuật thời gian kiểm tra đã được phát triển cho các mô hình ngôn ngữ chỉ có văn bản, bao gồm prompt theo chuỗi suy nghĩ và vài lần.
Đầu vào hình ảnh vẫn là một bản xem trước nghiên cứu và không có sẵn công khai.
Hiện tại ChatGPT phiên bản GPT-4 chỉ có trên bản GPT plus tính phí, người dùng có thể lựa chọn model GPT4- và phiên bản mặc định.