Vài phân tích về bộ nhớ trên card màn hình NVIDIA và AMD

Cùng với sự ra đời của loại bộ nhớ High Bandwidth Memory do AMD sử dụng trên dòng GPU Fiji thì hôm nay cardmanhinh.com mời các bạn cùng xem vài phân tích về bộ nhớ trên card màn hình NVIDIA và AMD đã được sử dụng trong nhiều năm qua

Tags: card màn hình NVIDIA AMD

Vài phân tích về bộ nhớ trên card màn hình NVIDIA và AMD

Vài phân tích về bộ nhớ trên card màn hình NVIDIA và AMD

Bộ nhớ luôn là 1 trong những thành phần quan trọng của card màn hình. Tầm quan trọng của nó trong thời gian gần đây càng nổi bật hơn nhất là khi công nghệ High Bandwidth Memory được ra đời. Trong khi trọng tâm của ngành công nghiệp đồ họa đang chuyển sang hướng đó tức sẽ tối đa mức băng thông thì vẫn còn tồn tại 1 mức tiềm ẩn nguy hiểm ẩn nắp trong bóng tối mà không ai để ý, đó chính là lượng điện năng tiêu thụ của bộ nhớ. Trong bài vài phân tích về bộ nhớ trên card màn hình NVIDIA và AMD thì tôi sẽ tập trung vào băng thông bộ nhớ cũng như lượng điện nó dùng.

Như hầu hết các bạn đã biết thì chuẩn bộ nhớ cho thế hệ card màn hình trước đây là GDDr5 và nếu như các dịch vụ lưu trữ sẽ chỉ còn sử dụng loại nầy thì các dòng card màn hình trong tương lai sẽ sử dụng thế hệ mới: High Bandwidth Memory. HBM hay xếp chồng RAM là 1 sự thay đổi mới gần đây khi nó giúp tăng đáng kể lượng băng thông trong khi lượng điện dùng lại thấp xuống. Và trong khi 2 hãng đang có những thành công nhất định do HBM mang lại thì vấn đề tiềm ẩn tôi nói ở trên vẫn còn tồn tại rất lâu nữa. Trong sự kiện GPU Technology Theater của NVIDIA thì Dr. Stephen W. Keckler - Giám đốc cao cấp của viện nghiên cứu NVIDIA - đã nhắc đến vấn đề tiêu thụ điện năng của bộ nhớ vẫn còn cao và chưa được giải quyết cho dù đó là HBM đi chăng nữa.

Lượng điện dùng cho bộ nhớ ngày càng tăng cao

Lượng điện dùng cho bộ nhớ ngày càng tăng cao

Đồ thị trên cho thấy 1 xu hướng ngày càng gia tăng theo cấp số nhân về lượng điện năng tiêu thụ trong 2 loại bộ nhớ dù băng thông vẫn gia tăng. Chúng ta có thể thấy điểm phá vỡ đồ thị khi chuyển từ loại bộ nhớ GDDr5 sang HBM nhưng kết quả cuối cùng vẫn như cũ. Bây giờ ta có thể hỏi vì sao đó là 1 vấn đề? 1 cách đơn giản tôi nói như vầy: TDP của 1 card màn hình là kết quả lượng điện tiêu thụ của GPU và các thành phần khác, nó có 1 phạm vi giao động chấp nhận được. GPU tiêu thụ 1 lượng điện khác lớn rồi, nếu bộ nhớ cũng đòi hỏi như thế thì tổng thể lại TDP rất là lớn.

Sức mạnh của card màn hình đang gia tăng với tốc độ chóng mặt không ngừng tức là trong vòng vài năm tới đây, chúng sẽ yêu cầu lượng băng thông sẽ lên đến vài ngàn GB/s mà điều đó có nghĩa là nếu bạn đang dùng HBM thì điện năng chỉ dùng cho chúng cũng tới hơn 100W trong khi GPU cũng sẽ cao hơn 250W (tính theo hiện tại) sẽ ra mức điện năng dùng hơi bị cao.

1 số bạn chắc chắn sẽ hỏi tôi rằng vì sao chúng ta sẽ cần băng thông lên đến mức vài ngàn GB/s. Vâng, các bạn nên nhớ rằng thực tế thì card màn hình là bộ vi xử lý có các cụm lớn từ các lõi vô cùng nhỏ. Bạn có thê gọi chúng là CUDA hay là Stream Processors tùy theo NVIDIA hay AMD mà bản thân chúng đều yêu cầu lượng băng thông cho bản thân. Ok, điều đó tức là số lượng các lõi đang tăng với mức chóng mặt trong khi băng thông dành cho chúng lại đang đuối dần dần. Để hình dung ra điều nầy thì tôi cũng tổng hợp 1 bảng đồ thị yêu cầu băng thông của lõi trong card màn hình NVIDIA và AMD, 1 xu hướng rõ ràng mà bạn sẽ nhìn ra ngay:

Băng thông mỗi lõi yêu cầu của dòng card màn hình AMD

Băng thông mỗi lõi yêu cầu của dòng card màn hình AMD

Băng thông mỗi lõi yêu cầu của dòng card màn hình NVIDIA

Băng thông mỗi lõi yêu cầu của dòng card màn hình NVIDIA

Bạn sẽ nhận thấy rằng băng thông có sẵn cho mỗi lõi giảm dần khi GPU phát triển mạnh mẽ hơn theo quy luật của nó. Điều nầy 1 phần là do tốc độ vốn có của công nghệ bộ nhớ đã chậm sẵn rồi. Điều thú vị là trong khi AMD luôn giữ độ chênh lệch của băng thông mỗi lõi tương đối ổn định thì NVIDIA lại tạo cảm giác bất thường. Phạm vi yêu của của lõi từ NVIDIA là 107 - 120 MB/s cho mỗi lõi và tăng lên tới 160MB/s cho mỗi lõi của GTX 760. Còn bên AMD thì 110 - 140 MB/s cho mỗi lõi và 175MB/s cho R9 370 nhưng ... chỉ cần thấp hơn 100MB/s cho mỗi lõi từ R9 285 mà chính xác là 98MB/s.

Theo 1 tuyên bố từ AMD thì với loại bộ nhớ GDDr5 thì khi nó tiêu thụ 1W điện sẽ tạo ra mức băng thông 10.66GB/s trong khi loại bộ nhớ HBM thì khi nó tiêu thụ 1W điện sẽ tạo ra mức băng thông 35GB/s. Điều nầy tức là mức thay đổi đã gia tăng gấp 3.5 lần nhưng điều đó đã đủ chưa? Chúng tôi tính toán tiêu thụ điện năng xấp xỉ của các card đồ họa khác nhau và đi đến một số kết luận rất thú vị như sau:

Lượng điện bộ nhớ yêu cầu của card AMD

Lượng điện bộ nhớ yêu cầu của card AMD

Lượng điện bộ nhớ yêu cầu của card NVIDIA

Lượng điện bộ nhớ yêu cầu của card NVIDIA

Chúng ta thấy rằng trung bình một card AMD sử dụng khoảng 15W đến 36W để cấp năng lượng tiêu chuẩn cho bộ nhớ GDDR5 trong khi card NVIDIA sử dụng khoảng 18W-32W. Với GDDr5 thì công suất lượng điện tiêu thụ tối đa là 40W thì HBM chỉ dùng tối đa 15W. Rõ ràng là trong đồ thị khi chúng ta nhìn tới Fury thì biểu đồ xuống dốc và phá vỡ hoàn toàn. Bằng cách kết hợp với các tiêu chuẩn của HBM cho NVIDIA thì chúng ta cũng sẽ dự đoán được vài thứ hay ho. Khi HBM dùng 120W thì nó sẽ có mức băng thông 4200 GB/s, 1 con số hoàn toàn lớn với hiện nay vì NVIDIA từng công bố Pascal ban đầu cũng chỉ có mức 1024 GB/s mà thôi. Tuy nhiên thật không may thì những tính toán thế nầy có vẻ không khả thi lắm khi tôi cho rằng tối đa mỗi Watt điện thì chỉ tạo ra 20 - 25 GB/s tức sẽ ở tầm mức 2400 GB/s mà thôi.

Hiện tại thì lượng điện bộ nhớ tiêu thụ rơi vào tầm 8-15% TDP card. Dĩ nhiên là trong tương lai thì những công mới được nghiên cứu từ Intel, Rambus và Micron sẽ thay thế điều gì đó nhưng liệu có đột phá lớn không thì đó còn là câu hỏi cho tương lai. Dưới đây là bảng thông kê cho ai quan tâm những gì tôi nói ở trên:

Model CUDA Cores Bandwidth BpC Memory TDP TDP % of TDP
GTX 760 1152 192.3 GB/s 0.1669 GBpc 18W 170W 10.6%
GTX 760 Ti 1344 192.3 GB/s 0.1431 GBpc 18W 170W 10.6%
GTX 770 1536 224 GB/s 0.1458 GBpc 21W 230W 9.1%
GTX 780 2304 288.4 GB/s 0.1252 GBpc 27W 250W 10.8%
GTX 780 Ti 2880 336.5 GB/s 0.1168 GBpc 32W 250W 12.6%
GTX Titan 2688 288.4 GB/s 0.1073 GBpc 27W 250W 10.8%
GTX Titan Black 2880 336.5 GB/s 0.1168 GBpc 32W 250W 12.6%
GTX Titan Z 5760 336.5 GB/s 0.0584 GBpc 32W 375W 8.4%
GTX 750 512 80 GB/s 0.1563 GBpc 8W 55W 13.6%
GTX 750 Ti 640 88 GB/s 0.1375 GBpc 8W 60W 13.8%
GTX 950 768 106 GB/s 0.1380 GBpc 10W 90W 11.0%
GTX 960 1024 112 GB/s 0.1094 GBpc 11W 120W 8.8%
GTX 970 1664 196+28 GB/s 0.1178 GBpc 21W 145W 14.5%
GTX 980 2048 224 GB/s 0.1094 GBpc 21W 165W 12.7%
GTX 980 Ti 2816 336 GB/s 0.1193 GBpc 32W 250W 12.6%
GTX Titan X 3072 336 GB/s 0.1094 GBpc 32W 250W 12.6%

Model S. Processors Bandwidth BpC Memory Power TDP % of TDP
R9 270X 1280 179.2 GB/s 0.1400 GBpc 17W 180W 9.3%
R9 280 1792 240 GB/s 0.1339 GBpc 23W 250W 9.0%
R9 280X 2048 288 GB/s 0.1406 GBpc 27W 250W 10.8%
R9 285 1792 176 GB/s 0.0982 GBpc 17W 190W 8.7%
R9 290 2560 320 GB/s 0.1250 GBpc 30W 250W 12.0%
R9 290X 2816 320 GB/s 0.1136 GBpc 30W 250W 12.0%
R9 295X2 5632 640 GB/s 0.1136 GBpc 60W 500W 12.0%
R7 360 768 104 GB/s 0.1354 GBpc 10W 100W 9.8%
R7 370 1024 179.2 GB/s 0.1750 GBpc 17W 110W 15.3%
R9 370X 1280 179.2 GB/s 0.1400 GBpc 17W 180W 9.3%
R9 380 1792 182.4 GB/s 0.1018 GBpc 17W 190W 9.0%
R9 390 2560 384 GB/s 0.1500 GBpc 36W 275W 13.1%
R9 390X 2816 384 GB/s 0.1364 GBpc 36W 275W 13.1%
R9 Fury 3584 512 GB/s 0.1429 GBpc 15W 275W 5.3%
R9 Fury X 4096 512 GB/s 0.1250 GBpc 15W 275W 5.3%
R9 Nano 4096 512 GB/s 0.1250 GBpc 15W 175W 8.4%