"ChatGPT-4o là gì và có gì mới?" chắc hẳn là câu hỏi được rất nhiều anh em quan tâm trong thời gian gần đây. Vào ngày 13/05/2024, OpenAI đã phát hành phiên bản GPT-4o. Trong đó chữ “o” là viết tắt của từ “omini” với nghĩa là “toàn năng”. GPT-4o có thể khả năng xử lý đa dạng đầu vào dưới dạng văn bản, âm thanh và hình ảnh.
Vậy ChatGPT-4o là gì? Có gì nổi bật so với các phiên bản trước đó. Hãy cùng Sforum tìm hiểu chi tiết trong bài viết dưới đây.
ChatGPT-4o là gì?
ChatGPT là một mô hình trí tuệ nhân tạo được phát triển bởi OpenAI, dựa trên kiến trúc GPT (Generative Pre-trained Transformer). ChatGPT được huấn luyện trên một lượng lớn data từ Internet có khả năng hiểu và tạo ra văn bản, hình ảnh tự nhiên.
Các phiên bản ChatGPT cho tới thời điểm hiện tại:
ChatGPT-1: Ra mắt vào năm 2018, đây là phiên bản đầu tiên có 117 triệu tham số. Đây cũng là bản đặt nền móng cho việc sử dụng mô hình Transformer trong xử lý ngôn ngữ tự nhiên.
ChatGPT-2: Ra mắt vào năm 2019 với 1,5 tỷ tham số, ChatGPT-2 có khả năng tạo ra văn bản mạch lạc, khả năng hoàn thành cây và viết văn bản dài.
ChatGPT-3: Phiên bản này được phát hành vào năm 2020 với 175 tỷ tham số. Đây được xem là một bước nhảy vọt về khả năng hiểu và tạo ra ngôn ngữ. ChatGPT-3 còn được cải thiện về độ chính xác và tính tự nhiên của các phản hồi.
ChatGPT-4: Phát hành vào năm 2023, phiên bản này gây ấn tượng với khả năng xử lý ngôn ngữ, tăng độ chính xác, mạch lạc và tính an toàn của các phản hồi. ChatGPT-4 hỗ trợ đa ngôn ngữ và có khả năng tùy chỉnh cao hơn cho các ứng dụng cụ thể.
ChatGPT-4o: Đây là phiên bản mới nhất được Open AI phát hành vào ngày 13/05/2024. Trong đó, chữ “o” trong ChatGPT-4o là chữ viết tắt của “omini” (toàn năng). GPT-4o có thể chấp nhận đầu vào bất kỳ sự kết hợp nào giữa văn bản, âm thanh và hình ảnh.
Hiện tại, Open AI cung cấp cho người dùng trải nghiệm free đối với phiên bản Chat GPT-4o. Tuy nhiên, bản free sẽ bị giới hạn số lượng câu hỏi trong một khoảng thời gian nhất định.
Trong khi đó, Google cũng đã có sự đáp trả tại hội nghị Google I/O 2024 hứa hẹn sẽ có những bản cập nhật lớn cho Google Gemini để đối đầu trực tiếp với ChatGPT.
ChatGPT-4o có thể xử lý đa dạng đầu vào dưới dạng văn bản, hình ảnh, âm thanh
Khả năng của Model
Trước khi có ChatGPT-4o, bạn có thể sử dụng Voice Mode để trò chuyện với ChatGPT. Độ trễ trung bình khi sử dụng Voice Mode là khoảng 2,8 giây với GPT-3.5 và 5,4 giây với GPT-4.
Để làm được điều này, Voice Mode có cách thức hoạt động như sau: Một mô hình đơn giản chuyển đổi âm thành thành văn bản. GPT-3.5 hoặc GPT-4 nhận văn bản, xử lý và tạo ra văn bản phản hồi. Lúc này, một mô hình đơn giản thứ ba sẽ chuyển đổi văn bản đó thành âm thanh.
Quá trình chuyển đổi âm thanh thành văn bản và văn bản thành âm thanh còn có nhiều hạn chế. GPT-4 có thể mất một số thông tin như tông điệu giọng nói, nhiều người nói, tiếng ồn nền tiếng cười hay biểu đạt cảm xúc.
ChatGPT-4o là một phiên bản mới của ChatGPT hứa hẹn sẽ khắc phục những hạn chế của các phiên bản trước đó. ChatGPT-4o được huấn luyện trên một tập dữ liệu khổng lồ bao gồm văn bản, hình ảnh và âm thanh. Nó sử dụng một mạng neural duy nhất để xử lý tất cả các thông tin đầu vào và đầu ra.
GPT-4o có tính năng gì nổi bật?
Nhanh hơn và mượt mà hơn
Nếu bạn thấy nhược điểm lớn nhất của GPT-4 là tốc độ, hãy yên tâm rằng vấn đề đó đã được khắc phục trên ChatGPT-4o. GPT-4o nhanh hơn đáng kể so với GPT-4 thông thường, thậm chí nhanh gấp đôi GPT-4 Turbo.
Cụ thể, trong bản demo, GPT-4o đã tạo ra câu trả lời 488 từ trong vòng chưa đầy 12 giây. Một câu lệnh tương tự có thể sẽ mất gần một phút nếu dùng GPT-4.
So với người tiền nhiệm GPT-4 Turbo, GPT-4o không chỉ duy trì hiệu suất ấn tượng trong xử lý văn bản tiếng Anh và lập trình, mà còn vượt trội hơn hẳn khi xử lý các ngôn ngữ khác. Nhờ vậy, người dùng sẽ được tận hưởng trải nghiệm mượt mà và trơn tru hơn.
Trải nghiệm thực tế cho thấy tốc độ phản hồi của Chat GPT-4o nhanh hơn đáng kể so với Google Gemini hay Microsoft Copilot. Điều này giúp người dùng tiết kiệm thời gian và nâng cao hiệu quả công việc.
GPT-4o nhanh hơn đáng kể so với GPT-4 thông thường và nhanh gấp đôi GPT-4 Turbo
Dịch song ngữ ngay tức thì
ChatGPT-4o có khả năng trò chuyện tự nhiên đến mức có thể bắt chước các đặc điểm của người thật như ngắt lời, nghe - hiểu, tông giọng. Bên cạnh đó, nó còn có thể dịch song ngữ với tốc độ nhanh chóng. Trong một bản demo khác, khi một người nói tiếng Anh và một người nói tiếng Italy có một cuộc trò chuyện với bằng GPT-4o. Nó đã cung cấp bản dịch từ tiếng Italy sang tiếng Anh và sau đó dịch từ tiếng Anh trở lại tiếng Italy một cách nhanh chóng và liền mạch.
Hiểu và biểu đạt cảm xúc
GPT-4o không dừng lại ở văn bản mà còn mở rộng khả năng sang lĩnh vực âm thanh và hình ảnh. Bạn có thể giao tiếp với máy tính bằng giọng nói, không chỉ đơn giản là nhận diện từ ngữ mà còn hiểu được ngữ điệu và ngữ cảnh.
Bên cạnh đó, GPT-4o cũng có thể nhìn - hiểu hình ảnh. Ví dụ, chatbot nhìn vào một bức ảnh selfie và viết phần mô tả liên quan đến trang phục bạn đang mặc hay cảm xúc của bạn lúc đó.
ChatGPT-4o còn có khả năng phản hồi các câu hỏi bằng giọng nói chỉ trong 232ms, tương đương với tốc độ phản hồi của con người trong cuộc trò chuyện. Điều này mang đến trải nghiệm trò chuyện với GPT-4o diễn ra tự nhiên và sống động hơn.
Xử lý liền mạch hơn
So với các phiên bản Voice Mode trước đây, ChatGPT-4o mang đến một bước tiến vượt bậc trong việc đơn giản hóa và nâng cao trải nghiệm tương tác bằng giọng nói.
Thay vì sử dụng nhiều mô hình riêng biệt cho từng nhiệm vụ (chuyển đổi giọng nói thành văn bản, xử lý văn bản, chuyển văn bản thành giọng nói), GPT-4o sử dụng một mô hình duy nhất để xử lý toàn bộ quá trình từ đầu đến cuối. Nhờ vậy, thời gian phản hồi được rút ngắn đáng kể, đồng thời chất lượng tương tác cũng được cải thiện rõ rệt.
ChatGPT-4o có thể nhận diện sắc thái trong giọng nói và nhiều người nói cùng lúc
ChatGPT-4o mới sở hữu khả năng nhận diện các sắc thái trong giọng nói, nhận diện nhiều người nói cùng lúc, thậm chí có thể tích hợp âm thanh như tiếng cười hay tiếng hát vào phản hồi của nó.
Tính năng an toàn
Khi phát hành ChatGPT-4o, OpenAI tuyên bố rằng họ đã triển khai các kỹ thuật mới để đảm bảo an toàn cho model outputs trên tất cả các modalities mới. Điều này bao gồm data refined training data và built-in safeguards được thiết kế đặc biệt cho các tương tác bằng giọng nói.
Bản free cũng có thể trải nghiệm
Hiện tại OpenAI cho phép người dùng trải nghiệm GPT-4o bản free. Tuy nhiên, người dùng sẽ bị giới hạn số lượng câu hỏi trong một khoảng thời gian nhất định. Bạn có thể trải nghiệm ngay TẠI ĐÂY.
Desktop app trên macOS
OpenAI cũng đề cập đến desktop app trên macOS đối với cả phiên bản free và trả phí, mang đến khả năng tương tác AI mạnh mẽ ngay trên máy tính của bạn.
ChatGPT-4o tích hợp liền mạch với mọi thứ bạn đang làm trên máy tính. Bạn có thể đặt câu hỏi ngay lập tức cho ChatGPT với phím tắt đơn giản (Option + Space). Bạn cũng có thể chụp và thảo luận về ảnh chụp màn hình trực tiếp hay dùng Voice Mode trong app.
Tuy nhiên, hiện tại ở Việt Nam vẫn chưa thể tải bản desktop app này. Nếu muốn trải nghiệm, bạn có thể dùng VPN/Proxy chuyển vùng sang Mỹ, sau đó tiến hành tải về. Hoặc bạn hãy đợi thêm một thời gian nữa để ứng dụng được phát hành tại Việt Nam.
Hướng dẫn sử dụng ChatGPT-4o
Sử dụng ChatGPT-4o trên web
Theo OpenAI, mô hình GPT-4o đã sẵn sàng cho tất cả người dùng ChatGPT, bao gồm cả người dùng không mất phí và người dùng trả phí. Hiện tại, mô hình đang dần được triển khai cho người dùng trả phí và sẽ sớm mở rộng cho người dùng miễn phí trong vài tuần tới. Cách sử dụng đơn giản như sau:
Truy cập chatgpt.com và đăng nhập bằng tài khoản của bạn.
Nhấp vào Menu thả xuống ở góc trên bên trái, sau đó chọn GPT-4o.
Bắt đầu trải nghiệm ChatGPT-4o.
Sử dụng ChatGPT-4o trên Android và iOS
Người dùng ChatGPT Plus có quyền truy cập vào mô hình GPT-4o trên Android và iOS. Bên cạnh đó, người dùng ChatGPT miễn phí cũng có quyền truy cập trong những tuần tới.
Cài đặt ứng dụng ChatGPT trên thiết bị di động của bạn (Android / iOS)
Đăng nhập vào tài khoản.
Chọn GPT-4o từ menu 3 chấm ở góc trên bên phải và trải nghiệm.
Sử dụng GPT-4o trên thiết bị di động
Như vậy là chúng ta đã cùng tìm hiểu ChatGPT-4o là gì và những tính năng nổi bật so với các phiên bản trước. Bạn đánh giá về GPT-4o như thế nào? Đừng quên theo dõi Sforum để cập nhật những tin tức công nghệ mới nhất bạn nhé! Ngoài ra, nếu bạn đang tìm kiếm một chiếc laptop để phục vụ công việc, học tập thì có thể tham khảo một số laptop đang được yêu thích tại CellphoneS.