Bản cập nhật mới nhất của OpenAI dành cho ChatGPT mang đến một bước tiến vượt bậc về khả năng tạo ảnh AI của mô hình GPT-4o. Giờ đây, thay vì phải chuyển sang DALL-E 3 và bắt đầu một cuộc trò chuyện mới, bạn có thể tạo ra những hình ảnh chất lượng cực kỳ cao trực tiếp bằng GPT-4o. Tuy nhiên, có một điều đáng lưu ý dành cho những người dùng ChatGPT miễn phí – ít nhất là ở thời điểm hiện tại. Khoahoccongnghe.net sẽ cung cấp chi tiết về cải tiến đáng giá này, giúp bạn hiểu rõ hơn về tiềm năng mới của AI trong lĩnh vực sáng tạo hình ảnh.
GPT-4o: Bước Tiến Vượt Bậc Trong Lĩnh Vực Tạo Ảnh AI
Mô hình GPT-4o của OpenAI hiện là lựa chọn mặc định cho hầu hết các cuộc hội thoại trên ChatGPT. Được OpenAI đánh giá là “Tuyệt vời cho hầu hết các câu hỏi”, GPT-4o thực sự đáp ứng một lượng lớn thông tin với tốc độ và độ chính xác cao – nhưng trước đây chỉ giới hạn ở văn bản.
Từ Tạo Văn Bản Đến Hình Ảnh Sắc Nét
Sau bản cập nhật ngày 25 tháng 3 năm 2025, GPT-4o đã có thể tạo ra những hình ảnh chất lượng cao với chi tiết đáng kinh ngạc, vượt trội hơn hẳn so với mô hình mà nó đang dần thay thế là DALL-E 3. Hơn thế nữa, GPT-4o hiện có khả năng thực hiện các thao tác chỉnh sửa và điều chỉnh hình ảnh vượt xa DALL-E 3. Việc chỉnh sửa ảnh, điều chỉnh màu sắc và phong cách, thay đổi tinh tế các chi tiết, thêm hoặc bớt đối tượng ở tiền cảnh và hậu cảnh, cùng nhiều tùy chỉnh khác đều trở nên khả thi với GPT-4o.
Người thợ săn quái vật giả tưởng tóc trắng, sẹo ngang mặt, đang mua sắm trong siêu thị hiện đại, tạo bởi DALL-E
Cải Thiện Đột Phá Khả Năng Tạo Văn Bản Trong Ảnh
Khả năng tạo văn bản trong hình ảnh cũng được cải thiện đáng kinh ngạc. Đây vốn không phải là điểm mạnh của DALL-E 3 (và hầu hết các mô hình AI tạo ảnh khác). Giờ đây, GPT-4o có thể tạo ra các infographics chi tiết với lời giải thích rõ ràng về hầu hết mọi chủ đề. Vị trí văn bản trong ảnh trở nên chính xác, với khả năng sử dụng các kiểu chữ và hướng văn bản cụ thể mà không lo tạo ra những hình ảnh AI mờ nhòe, không rõ nét. Khả năng duy trì chi tiết giữa các hình ảnh cũng là một cải tiến rõ rệt khác, cho phép chuyển đổi các đặc điểm cụ thể từ hình ảnh này sang hình ảnh khác một cách dễ dàng mà không làm ChatGPT thay đổi hoàn toàn bối cảnh hoặc tạo ra một hình ảnh hoàn toàn mới.
Người đàn ông giống Einstein đang ăn kem trong Công viên Trung tâm, hình ảnh do DALL-E tạo
Phiên bản cải tiến hình ảnh người đàn ông giống Einstein ăn kem tại Central Park, do GPT-4o của ChatGPT tạo
Bí Quyết Đằng Sau Chất Lượng Vượt Trội của GPT-4o
Một phần của chất lượng hình ảnh nâng cấp đến từ quan hệ đối tác của OpenAI với các công ty như Shutterstock và một nhóm các chuyên gia đã dành nhiều giờ để chỉ ra các lỗi mà GPT-4o mắc phải trong quá trình tạo hình ảnh. Trao đổi với Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường (reinforcement learning) này cho phép GPT-4o tuân thủ chính xác các hướng dẫn của con người trên một phạm vi rộng lớn các yêu cầu tạo hình ảnh, và quá trình này chỉ cần “hơn 100 nhân viên con người” để hoàn thành. Khả năng tạo ảnh mới của ChatGPT thực sự đáng kinh ngạc. Dù chưa hoàn hảo (chưa có công cụ tạo ảnh AI nào hoàn hảo), nhưng đây là một bước nhảy vọt đáng kể về chất lượng từ một mô hình như DALL-E 3, vốn hữu ích nhưng chưa thực sự ấn tượng, lên đến đẳng cấp mà GPT-4o hiện có thể đạt được.
Ai Được Trải Nghiệm Khả Năng Tạo Ảnh Mới Của ChatGPT Trước Tiên?
Người Dùng Miễn Phí Phải Chờ Đợi
Thật không may, do nhu cầu sử dụng GPT-4o vượt quá dự kiến, người dùng miễn phí của ChatGPT một lần nữa phải chờ đợi để trải nghiệm tính năng mới này. Vào ngày 26 tháng 3 năm 2025, CEO OpenAI Sam Altman đã xác nhận sự chậm trễ này nhưng không đưa ra khoảng thời gian cụ thể khi nào tính năng sẽ được triển khai đầy đủ cho mọi đối tượng. Sự gia tăng hứng thú là điều được mong đợi, nhưng mức độ lại vượt quá dự đoán. Điều này có nghĩa là bạn sẽ phải đợi thêm một thời gian hoặc nâng cấp lên gói ChatGPT Plus với mức phí khoảng 20 đô la mỗi tháng. Công bằng mà nói, với những nâng cấp đột phá như thế này, việc nâng cấp lên ChatGPT Plus thực sự trở nên đáng giá hơn so với thời điểm ra mắt các mô hình trước đây của OpenAI.
Tương Lai Của DALL-E 3 Trong ChatGPT
Cũng cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo ảnh cũ của OpenAI” (legacy image generation model). Điều này có nghĩa là OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện tại chưa có thời gian biểu cụ thể cho sự thay đổi này.
Cập nhật GPT-4o là một cột mốc quan trọng, khẳng định vị thế dẫn đầu của OpenAI trong lĩnh vực AI tạo sinh, đặc biệt là khả năng tạo và chỉnh sửa hình ảnh. Đối với độc giả của khoahoccongnghe.net, những người luôn tìm kiếm thông tin công nghệ chính xác và đáng tin cậy, đây là một minh chứng rõ ràng cho tốc độ phát triển không ngừng của AI. Hãy tiếp tục theo dõi khoahoccongnghe.net để cập nhật những tin tức công nghệ mới nhất và sâu sắc nhất. Nếu bạn đã có cơ hội trải nghiệm GPT-4o, hãy chia sẻ suy nghĩ và trải nghiệm của mình trong phần bình luận bên dưới nhé!