TÌNH TRẠNG THIẾU HỤT GPU CHO AI
Với sự phát triển của AI thì hiện phần cứng không đáp ứng kịp, Sam Altman (CEO của OpenAI – Cha đẻ của ChatGPT) cũng từng chia sẻ cần nhiều GPUs hơn nữa. Điều này cũng tạo cơ hội phát triển cho các dự án Depin ở mảng Distributed Compute 1. Đặt vấn đề – hiện trạng – Các dòng GPU hiện tại phổ biến cho AI mảng doanh nghiệp là A100, H100, V100, T4, cho khách hàng cá nhân là RTX4090, RTX3090, RTX3080,… – Hiện tại các tập đoàn lớn đua nhau làm AI, dẫn đến lượng GPU liên tục thiếu hụt, trong mảng này thì chip của NVIDIA chiếm 80-95% thị phần, và NVIDIA vẫn đưa ra dự báo thiếu hụt trầm trọng và đang liên tục mở rộng nhà máy sản xuất chip ở các Quốc Gia để đáp ứng. Cụ thể là thiếu hụt hàng nghìn chip, như H100 thì thiếu tới 432 nghìn con (theo Financial Times)
2. Cơ hội cho các dự án Depin – Ở đây sinh ra một cơ hội, các dự án Depin về Distributed Computer giúp chia sẻ GPUs dư rảnh của các cá nhân/tổ chức để chia sẻ đến người cần sử dụng lượng GPU này – Các dự án như $RNDR, $AKT, $ATH, ionet, gensyn, $CLORE,… tận dụng cơ hội này để phát triển ứng dụng của mình mạnh mẽ hơn, cũng tăng trưởng ấn tượng trong thời gian vừa rồi.
– Ở đây các dự án Depin có ưu thế giá thành rẻ hơn hẳn các tổ chức truyền thống. VD như #AETHIR cho thuê giá 0,33$/ giờ cho chip A100, với #IONET là 0,76$. So sánh với Google Cloud là 2,9$ còn Lamdba Labs là 1,29$ (Web3 rẻ hơn khá nhiều trên cùng 1 loại chip) *Như vậy tiềm năng sử dụng và phát triển của các dự án Depin ngách Distributed Compute là rất lớn, nhưng cũng có những thách thức cần giải quyết
3. Vấn đề và thực trạng
– VD như lượng GPU sẵn sàng của $AKT là 386 cái, nhưng thực tế lượng đã được thuê chỉ 74 cái. – Hay tương ứng với $RNDR là 28/1051, của $FIL là 0/1024 và IONET là 5718/23775 cái.
– Câu trả lời có lẽ do đối tượng chính cho thuê của các dự án Depin là các dự án Web3 chứ chưa tiếp cận được các tổ chức web2 đang cần lượng GPU này, có lẽ cần một thời gian để lượng GPU này dễ sử dụng hơn với các công ty web2. Tuy nhiên trong số dự án Depin vừa kể trên, mình thấy Aethir có chiến lược cực hay khi khách hàng nhắm đến chỉ các doanh nghiệp lớn về AI và Gaming, Cả doanh nghiệp WEB2 và WEB3. Bằng cách triển khai phủ sóng điện toán biên thông qua thiết bị Aethir Edge, giúp giảm độ trễ của user khi sử dụng. Nếu thành công thì $ATH chắc chắn sẽ là 1 dự án thuộc trend Depin đáng được kì vọng.
– Lượng khả dụng quá nhỏ so với web2. Trong bảng so sánh có thể thấy lượng chip khả dụng của AKT là 72 chiếc H100 và 85 chiếc A100, con số này với IONET là 676 H100 và 4993 A100, Aethir có tới 4000 chiếc H100.
– So với Meta (facebook) là 350k H100 và 21,4k A100, Với Google là 26k H100, với Lambda là 30k H100 và 10k A100 => Điều này mang tới một thực trạng là các tổ chức/công ty lớn họ cần số lượng quá nhiều thì các dự án Web3 chưa thể đáp ứng được, buộc phải tìm đến các công ty web2 mặc dù giá cả cao hơn => Hơn nữa việc truy cập dung lượng của Depin web3 sẽ phức tạp hơn, chậm hơn và pháp lý chưa rõ ràng cũng là một rào cản lớn cho sự phát triển của mảng này