NVIDIA đã lần đầu tiên giới thiệu Vera Rubin Superchip thế hệ tiếp theo tại GTC ở Washington, hứa hẹn sẽ khơi mào làn sóng AI tiếp theo.
NVIDIA đã nhận được những GPU Rubin đầu tiên trong phòng thí nghiệm, sẵn sàng cho việc sản xuất hàng loạt Vera Rubin Superchip vào năm sau, cùng thời điểm hoặc sớm hơn.
Tại GTC tháng 10 năm 2025, CEO Jensen Huang của NVIDIA đã giới thiệu Vera Rubin Superchip thế hệ tiếp theo. Đây là lần đầu tiên chúng ta được chứng kiến một mẫu bo mạch chủ thực tế, hay còn gọi là Superchip theo cách gọi ưa thích của NVIDIA, với CPU Vera và hai GPU Rubin dung lượng lớn. Bo mạch chủ này cũng chứa rất nhiều bộ nhớ hệ thống LPDDR (tổng cộng 32 khe cắm), sẽ được kết hợp với bộ nhớ HBM4 có trên GPU Rubin.

Jensen cũng cho biết GPU Rubin đã quay trở lại phòng thí nghiệm, đồng nghĩa với việc đây là những mẫu đầu tiên được sản xuất tại TSMC (Đài Loan). Mỗi GPU được bao quanh bởi rất nhiều mạch nguồn, và theo các bài đăng trước đó, chúng ta đã biết mỗi chip sẽ có 8 khe cắm HBM4 và hai đế GPU cỡ Reticle. CPU Vera sẽ có 88 lõi ARM tùy chỉnh với 176 luồng.
Nói về kế hoạch triển khai, Jensen tiết lộ rằng ông dự kiến GPU Rubin sẽ bước vào giai đoạn sản xuất hàng loạt vào cùng thời điểm năm sau hoặc sớm hơn, tức là quý 3 hoặc quý 4 năm 2026. Tất cả những điều này đang diễn ra trong khi các nền tảng Superchip Blackwell Ultra “GB300” của NVIDIA đang được triển khai với tốc độ tối đa.
Hệ thống NVIDIA Vera Rubin NVL144 – Ra mắt vào nửa cuối năm 2026
Về thông số kỹ thuật, nền tảng NVIDIA Vera Rubin NVL144 sẽ sử dụng hai chip mới. GPU Rubin sẽ sử dụng hai chip cỡ Reticle, với hiệu năng FP4 lên đến 50 PFLOP và bộ nhớ HBM4 thế hệ mới 288 GB. Các chip này sẽ được trang bị cùng với CPU Vera 88 nhân với kiến trúc ARM tùy chỉnh, 176 luồng và kết nối NVLINK-C2C lên đến 1,8 TB/giây.

Về khả năng mở rộng hiệu năng, nền tảng NVIDIA Vera Rubin NVL144 sẽ có 3,6 Exaflops khả năng suy luận FP4 và 1,2 Exaflops khả năng huấn luyện FP8, tăng 3,3 lần so với GB300 NVL72, bộ nhớ HBM4 13 TB/giây với bộ nhớ nhanh 75 TB, tăng 60% so với GB300 và khả năng NVLINK và CX9 gấp đôi, lần lượt đạt tốc độ lên tới 260 TB/giây và 28,8 TB/giây.
Hệ thống NVIDIA Rubin Ultra NVL576 – Ra mắt vào nửa cuối năm 2027
Nền tảng thứ hai sẽ ra mắt vào nửa cuối năm 2027 và sẽ được gọi là Rubin Ultra. Nền tảng này sẽ mở rộng hệ thống NVL từ 144 lên 576. Kiến trúc của CPU vẫn giữ nguyên, nhưng GPU Rubin Ultra sẽ có bốn chip kích thước lưới, cung cấp tới 100 PFLOPS FP4 và tổng dung lượng HBM4e là 1 TB phân tán trên 16 vị trí HBM.

Về khả năng mở rộng hiệu suất, nền tảng NVIDIA Rubin Ultra NVL576 sẽ có 15 Exaflop suy luận FP4 và 5 Exaflop khả năng đào tạo FP8, tăng 14 lần so với GB300 NVL72, 4,6 PB/giây bộ nhớ HBM4 với 365 TB bộ nhớ nhanh, tăng 8 lần so với GB300 và 12 lần khả năng NVLINK và 8 lần khả năng CX9, được đánh giá lần lượt là 1,5 PB/giây và 115,2 TB/giây.


