Amazon Web Services (AWS) chuẩn bị tung bản nâng cấp chip Graviton4 và đẩy mạnh chip Trainium, cho thấy tham vọng kiểm soát hạ tầng AI với Nvidia.
Amazon Web Services (AWS) chuẩn bị tung bản nâng cấp chip Graviton4 và đẩy mạnh chip Trainium, cho thấy tham vọng kiểm soát hạ tầng AI với Nvidia.
AWS chuẩn bị công bố bản cập nhật cho dòng chip Graviton4, với điểm nổi bật là băng thông mạng lên tới 600 gigabit mỗi giây - mức mà công ty gọi là “dịch vụ cao cấp nhất” trên nền tảng đám mây công cộng hiện nay. Ali Saidi - kỹ sư cao cấp tại AWS, ví tốc độ này như một cỗ máy có thể đọc 100 đĩa CD nhạc mỗi giây.
Graviton4 là một trong nhiều sản phẩm chip do Annapurna Labs (trụ sở tại Austin, Texas, Mỹ) phát triển cho Amazon. Đây được xem là bước tiến quan trọng trong chiến lược tự thiết kế chip của AWS, giúp công ty cạnh tranh trực tiếp với các hãng bán dẫn truyền thống như Intel và AMD.
Tuy nhiên, đối thủ thực sự mà AWS muốn vượt qua là Nvidia - ông lớn đang thống trị mảng hạ tầng phần cứng phục vụ trí tuệ nhân tạo (AI).
Tại hội nghị re:Invent 2024 vào tháng 12.2024, AWS đã giới thiệu Dự án Rainier - siêu máy tính AI được thiết kế riêng cho công ty khởi nghiệp Anthropic, đơn vị mà Amazon đã đầu tư 8 tỉ USD để hỗ trợ phát triển. Dự án Rainier được vận hành bởi hơn 500.000 chip - một đơn hàng mà trước đây gần như chắc chắn sẽ thuộc về Nvidia.
Theo Gadi Hutt - Giám đốc cấp cao phụ trách kỹ thuật sản phẩm và trải nghiệm khách hàng của AWS, mục tiêu của Amazon là giảm chi phí huấn luyện AI và cung cấp giải pháp thay thế cho các bộ xử lý đồ họa (GPU) đắt đỏ của Nvidia.
Hutt thừa nhận chip Blackwell của Nvidia có hiệu suất cao hơn Trainium2 nhưng chip của AWS lại có lợi thế vượt trội về chi phí. “Trainium3 sẽ ra mắt trong năm nay, với hiệu suất gấp đôi Trainium2 và tiết kiệm năng lượng hơn 50%” Hutt nói.
Rami Sinno - Giám đốc kỹ thuật tại Annapurna Labs - cho biết, nhu cầu đối với các dòng chip này đã vượt xa khả năng cung ứng. “Chúng tôi có nguồn cung rất lớn nhưng mọi dịch vụ mà chúng tôi xây dựng đều có khách hàng sử dụng thường xuyên” Rami Sinno nói.
Với bản nâng cấp Graviton4 sắp ra mắt và sự phát triển của chip Trainium trong Dự án Rainier, Amazon đang cho thấy tham vọng kiểm soát toàn bộ chuỗi hạ tầng AI từ mạng lưới, đào tạo đến suy luận.
Theo đại diện AWS, lịch phát hành bản cập nhật Graviton4 sẽ được công bố vào cuối tháng 6.2025.
Đọc bài gốc tại đây.