Ngày 24/4/2026, cộng đồng công nghệ toàn cầu đã chứng kiến sự kiện DeepSeek V4 ra mắt, đánh dấu một cột mốc mang tính bước ngoặt trong cuộc đua phát triển trí tuệ nhân tạo. Ra mắt chỉ một ngày sau khi OpenAI trình làng GPT-5.5, DeepSeek V4 nhanh chóng gây chấn động bởi chiến lược định giá hoàn toàn trái ngược cùng hiệu năng vô cùng ấn tượng.

Hai phiên bản đột phá: V4-Pro và V4-Flash

Trong lần ra mắt này, DeepSeek phát hành hai phiên bản chính dưới dạng mã nguồn mở hoàn toàn (giấy phép MIT), cho phép các nhà phát triển tự do tải xuống, chạy cục bộ và chỉnh sửa mã nguồn.

  • DeepSeek-V4-Pro: Đây là mô hình hàng đầu sở hữu 1,6 nghìn tỷ tham số (nhưng chỉ có 49 tỷ tham số kích hoạt mỗi token). V4-Pro vượt qua tất cả các mô hình mã nguồn mở hiện có và cạnh tranh sòng phẳng với các “ông lớn” thương mại như Gemini Pro 3.1 của Google hay Claude Opus 4.6 của Anthropic. Việc sử dụng hệ thống định tuyến chuyên gia 16×16 giúp mô hình này đạt 88,5% ở điểm chuẩn MMLU, cao hơn mức 85,5% của thế hệ V3. Đáng chú ý, trong bài kiểm tra LiveCodeBench, V4-Pro đạt mức 93,5%, vượt qua cả mức 88,8% của Claude Opus 4.6. Mô hình này cũng cho phép xử lý trực tiếp các kho mã nguồn khổng lồ mà không cần tốn nhiều năm để xây dựng lớp truy xuất tăng cường (RAG) phức tạp.
  • DeepSeek-V4-Flash: Được định vị là giải pháp nhẹ, nhanh và tiết kiệm chi phí với tổng cộng 284 tỷ tham số (13 tỷ tham số hoạt động). Phiên bản này cạnh tranh trực tiếp với GPT-4o-mini và Claude Haiku, rất lý tưởng cho các ứng dụng doanh nghiệp có độ phức tạp trung bình nhưng nhạy cảm về độ trễ và chi phí.

Mức giá “phá đảo” thị trường API

Sự kiện DeepSeek V4 ra mắt thực sự đã đánh sập rào cản chi phí của trí thông minh nhân tạo. Trong khi GPT-5.5 của OpenAI áp dụng mức giá đắt đỏ lên tới 30 USD mỗi triệu token đầu ra, thì DeepSeek V4-Pro có mức giá API chỉ 3,48 USD cho mỗi triệu token đầu ra – rẻ bằng khoảng 1/8 so với GPT-5.5.

Thậm chí, bản V4-Flash còn gây sốc hơn khi chi phí API chỉ vỏn vẹn 0,14 USD cho 1 triệu token đầu vào và 0,28 USD cho 1 triệu token đầu ra. Sự chênh lệch khổng lồ về mặt chi phí này dự kiến sẽ buộc hàng loạt công ty phát triển AI lớn trên thế giới phải xem xét lại cấu trúc lợi nhuận và hạ giá bán để duy trì sức cạnh tranh.

Cửa sổ ngữ cảnh 1 triệu token trở thành tiêu chuẩn mới

Một trong những cải tiến mang tính cách mạng nhất của DeepSeek V4 là việc biến cửa sổ ngữ cảnh 1 triệu token trở thành tiêu chuẩn mặc định cho toàn bộ các dịch vụ chính thức. Người dùng giờ đây có thể nhập cả một mã nguồn lớn hoặc nhiều tài liệu dài vào hệ thống trong một lần gọi lệnh duy nhất, với khả năng đầu ra lên tới 384.000 token.

Sức mạnh này đến từ cơ chế chú ý lai (Hybrid Attention) hoàn toàn mới ở tầng kiến trúc, kết hợp giữa công nghệ CSA (Compressed Sparse Attention) và HCA (Heavily Compressed Attention). Nhờ đó, V4-Pro có thể duy trì ngữ cảnh cực dài trong khi chỉ cần sử dụng 27% sức mạnh tính toán (FLOPs) và 10% bộ nhớ KV cache so với bản V3.2.

Đột phá công nghệ phần cứng và ba chế độ suy luận

DeepSeek V4 tích hợp sẵn ba chế độ suy luận gồm: Non-Think (Không suy luận sâu), Think High và Think Max, cho phép người dùng tùy chọn để đánh đổi giữa tốc độ xử lý và khả năng suy luận. Ở chế độ không suy luận sâu, chất lượng đầu ra của V4 đã vượt qua Claude Sonnet 4.5 và gần tiệm cận với Opus 4.6.

Về mặt huấn luyện, mô hình được tối ưu hóa bằng thuật toán Muon và ràng buộc mHC (Manifold-Constrained Hyper-Connections), giúp quá trình huấn luyện 1,6 nghìn tỷ tham số trên hơn 32 nghìn tỷ token diễn ra cực kỳ ổn định. Bên cạnh đó, DeepSeek V4 có khả năng chạy nguyên bản trên chip Ascend của Huawei (như mẫu Ascend 950), một lợi thế khổng lồ giúp giảm bớt sự phụ thuộc vào nguồn cung GPU cao cấp từ NVIDIA trong bối cảnh bị hạn chế công nghệ.

Tổng kết

Sự kiện DeepSeek V4 ra mắt là một minh chứng rõ ràng cho thấy mô hình mã nguồn mở đang bám đuổi vô cùng sát sao và chuẩn bị đuổi kịp các dự án AI mã nguồn đóng hàng đầu thế giới. Bằng hiệu suất vượt trội cùng mức giá rẻ đến bất ngờ, DeepSeek đang tạo cơ hội tiếp cận AI mạnh mẽ cho mọi doanh nghiệp, đồng thời cho thấy khoảng cách công nghệ giữa họ và các “gã khổng lồ” phương Tây đang được thu hẹp một cách nhanh chóng.