0 Comments

Đánh giá Nvidia GeForce RTX 4070: Ada chính xuất hiện

Nvidia định vị GeForce RTX 4070 mới của mình như một bản nâng cấp tuyệt vời cho người dùng GTX 1070 và RTX 2070, nhưng điều đó không che giấu sự thật rằng trong nhiều trường hợp, nó gắn liền với RTX 3080 thế hệ trước. Giá bán lẻ 599 USD có nghĩa là nó cũng thay thế RTX 3070 Ti, với VRAM nhiều hơn 50% và hiệu quả được cải thiện đáng kể. RTX 4070 có phải là một trong những card đồ họa tốt nhất không? Đó chắc chắn là một đề xuất dễ dàng hơn so với các thẻ có giá từ 1.000 đô la trở lên, nhưng chắc chắn bạn sẽ đánh đổi hiệu suất để lấy những đồng xu tiết kiệm được đó.

Về cốt lõi, RTX 4070 vay mượn rất nhiều từ RTX 4070 Ti. Cả hai đều sử dụng GPU AD104 và đều có giao diện bộ nhớ 192 bit với 12GB GDDR6X 12Gbps VRAM. Sự khác biệt chính, ngoài việc giảm giá 200 đô la, là RTX 4070 có 5.888 lõi CUDA so với 7.680 trên 4070 Ti. Tốc độ đồng hồ về mặt lý thuyết cũng thấp hơn một chút, mặc dù chúng tôi sẽ tìm hiểu kỹ hơn về điều đó trong quá trình thử nghiệm của mình. Cuối cùng, chúng tôi đang xem xét việc giảm giá 25% đi kèm với việc giảm 23% số lõi bộ xử lý.

chúng tôi đã bảo hiểm Kiến trúc Ada Lovelace của Nvidia đã sẵn sàng, vì vậy hãy bắt đầu từ đó nếu bạn muốn biết thêm về điều gì làm cho GPU sê-ri RTX 40 được đánh dấu. Câu hỏi chính ở đây là làm thế nào RTX 4070 có thể so sánh với những người anh em đắt tiền hơn của nó, chưa kể đến dòng RTX 30 thế hệ trước. Dưới đây là các thông số kỹ thuật chính thức cho thẻ tham khảo.

Vuốt để cuộn theo chiều ngang

Nvidia RTX 4070 So với các GPU Ada / Ampere khác
Card đồ họa	RTX4070	RTX4080	RTX 4070ti	RTX 3080 Ti	RTX 3080	RTX 3070ti	RTX 3070
Ngành kiến trúc	AD104	AD103	AD104	GA102	GA102	GA104	GA104
Công nghệ xử ký	TSMC 4N	TSMC 4N	TSMC 4N	Samsung 8N	Samsung 8N	Samsung 8N	Samsung 8N
Bóng bán dẫn (Tỷ)	32	45,9	35,8	28.3	28.3	17,4	17,4
Kích thước khuôn (mm^2)	294,5	378.6	294,5	628.4	628.4	392,5	392,5
Tin nhắn	46	76	60	80	68	48	46
Lõi GPU (Shader)	5888	9728	7680	10240	8704	6144	5888
lõi căng	184	304	240	320	272	192	184
Truy tìm tia “Lõi”	46	76	60	80	68	48	46
Tăng xung nhịp (MHz)	2475	2505	2610	1665	1710	1765	1725
Tốc độ VRAM (Gbps)	21	22,4	21	19	19	19	14
VRAM (GB)	12	16	12	12	10	số 8	số 8
Chiều rộng đường truyền VRAM	192	256	192	384	320	256	256
Bộ nhớ đệm L2 (MiB)	36	64	48	6	5	4	4
ROP	64	112	80	112	96	96	96
TMU	184	304	240	320	272	192	184
TFLOPS FP32 (Tăng cường)	29.1	48,7	40.1	34.1	29.8	21.7	20.3
TFLOPS FP16 (FP8)	233 (466)	390 (780)	321 (641)	136 (273)	119 (238)	87 (174)	81 (163)
Băng thông (GBps)	504	717	504	912	760	608	448
TGP (watt)	200	320	285	350	320	290	220
Ngày ra mắt	tháng 4 năm 2023	tháng 11 năm 2022	tháng 1 năm 2023	tháng 6 năm 2021	tháng 9 năm 2020	tháng 6 năm 2021	tháng 10 năm 2020
Giá ra mắt	$599	$1,199	$799	$1,199	$699	$599	$499

Có một độ dốc khá lớn đi từ RTX 4080 đến 4070 Ti và từ đó đến RTX 4070. Hiện chúng tôi đang xem xét cùng một số lượng bộ tạo bóng GPU — 5888 — như Nvidia đã sử dụng trên thế hệ trước RTX 3070. Tất nhiên , có rất nhiều thay đổi khác đã diễn ra.

Đứng đầu trong số đó là sự gia tăng lớn về xung nhịp lõi GPU. 5888 shader chạy ở tốc độ 2,5 GHz sẽ mang lại hiệu suất cao hơn rất nhiều so với cùng số lượng shader có tốc độ 1,7 GHz — theo toán học, hiệu suất cao hơn gần 50%. Nvidia cũng thích bảo thủ và xung nhịp chơi game trong thế giới thực gần hơn với 2,7 GHz… mặc dù RTX 3070 cũng có tốc độ gần 1,9 GHz trong thử nghiệm của chúng tôi.

Băng thông bộ nhớ cuối cùng cũng cao hơn một chút so với 3070, nhưng bộ đệm L2 lớn hơn đáng kể chắc chắn sẽ có nghĩa là nó hoạt động tốt hơn nhiều so với băng thông thô có thể đề xuất. Việc chuyển sang giao diện 192-bit thay vì giao diện 256-bit trên GA104 mang lại một số thỏa hiệp thú vị, nhưng chúng tôi rất vui khi có ít nhất 12GB VRAM trong vòng này — 3060 Ti, 3070 và 3070 Ti với 8GB là tất cả cảm thấy một chút hạn chế những ngày này. Nhưng do không sử dụng chip bộ nhớ ở chế độ “vỏ sò” (hai chip trên mỗi kênh, trên cả hai mặt của bảng mạch), 12GB là mức tối đa cho giao diện 192-bit hiện nay.

Mặc dù AMD đã đưa tin về việc thiếu VRAM trên RTX 4070 vào ngày hôm qua, nhưng điều quan trọng cần lưu ý là AMD vẫn chưa tiết lộ các bộ phận dòng 7000 “chính thống” của riêng mình và nó sẽ phải đối mặt với những thỏa hiệp tiềm ẩn tương tự. Giao diện 256-bit cho phép 16GB VRAM, nhưng nó cũng làm tăng chi phí bo mạch và linh kiện. Có lẽ chúng ta sẽ nhận được RX 7800 XT 16GB, nhưng RX 7700 XT cũng có thể sẽ có VRAM 12GB. Đối với các GPU AMD thế hệ trước có nhiều VRAM hơn, điều đó chắc chắn đúng, nhưng dung lượng chỉ là một phần của phương trình, vì vậy chúng ta cần xem RTX 4070 hoạt động như thế nào trước khi tuyên bố người chiến thắng.

Một mục đáng chú ý khác là 200W TGP (Tổng sức mạnh đồ họa) và Nvidia muốn nhấn mạnh rằng trong nhiều trường hợp, RTX 4070 sẽ sử dụng ít hơn mạnh hơn TGP, trong khi các thẻ cạnh tranh (và các sản phẩm thế hệ trước) thường đạt hoặc vượt TGP. Chúng tôi có thể xác nhận điều đó là đúng ở đây và chúng tôi sẽ tìm hiểu chi tiết hơn sau này.

Tin vui là cuối cùng chúng ta cũng có một card đồ họa thế hệ mới nhất với giá khởi điểm là 599 USD. Đương nhiên sẽ có các thẻ được ép xung của bên thứ ba làm tăng giá, với các tính năng bổ sung như ánh sáng RGB và khả năng làm mát mạnh hơn, nhưng Nvidia đã hạn chế đánh giá trước khi ra mắt này đối với các thẻ bán với giá MSRP. Chúng tôi cũng có một mô hình PNY mà chúng tôi sẽ xem xét chi tiết hơn trong một bài đánh giá riêng, mặc dù chúng tôi sẽ đưa kết quả hoạt động vào biểu đồ của mình. (Spoiler: Nó nhanh như Phiên bản sáng lập.)

Hình ảnh 1 của 2

Sơ đồ khối Nvidia GeForce RTX 4070 — Bốn GPC, một NVENC và một NVDEC cho RTX 4070 (Nguồn: Phần cứng của Tom)

Trên đây là sơ đồ khối cho RTX 4070 và cho AD104 đầy đủ, đồng thời bạn có thể thấy tất cả những thứ bổ sung được bao gồm nhưng bị tắt khi triển khai AD104 cấp thấp hơn này. Không có khối nào trong hình ảnh đó là “để chia tỷ lệ” và Nvidia đã không cung cấp ảnh chụp AD104, vì vậy chúng tôi không thể xác định có bao nhiêu không gian được dành riêng cho các bit và phần khác nhau — cho đến khi có người khác thực hiện dù sao thì công việc bẩn thỉu (nhìn bạn, Fritzchens Fritz (mở trong tab mới)).

Như đã thảo luận trước đây, AD104 bao gồm lõi Tensor thế hệ thứ 4 của Nvidia, lõi RT thế hệ thứ 3, các đơn vị NVENC/NVDEC mới và được cải tiến để mã hóa và giải mã video (hiện có hỗ trợ AV1) và Bộ gia tốc dòng quang (OFA) mạnh hơn đáng kể. Loại thứ hai được sử dụng cho DLSS 3 và mặc dù “về mặt lý thuyết” có thể thực hiện Tạo khung hình bằng Ampere OFA (hoặc sử dụng một số giải pháp thay thế khác), nhưng cho đến nay chỉ có thẻ sê-ri RTX 40 mới có thể cung cấp tính năng đó.

Trong khi đó, các lõi Tensor hiện hỗ trợ FP8 với độ thưa thớt. Không rõ mức độ hữu ích của tính năng này trong mọi khối lượng công việc, nhưng AI và học sâu chắc chắn đã tận dụng các định dạng số có độ chính xác thấp hơn để tăng hiệu suất mà không làm thay đổi đáng kể chất lượng của kết quả — ít nhất là trong một số khối lượng công việc. Cuối cùng, nó sẽ phụ thuộc vào công việc đang được thực hiện và việc tìm ra điều gì sử dụng FP8 so với FP16, cộng với độ thưa thớt, có thể khó khăn. Về cơ bản, đó là một vấn đề đối với các nhà phát triển phần mềm, nhưng có lẽ chúng ta sẽ thấy các công cụ bổ sung tận dụng các tính năng như vậy (như Khuếch tán ổn định hoặc Tạo văn bản GPT).

Những người quan tâm đến nghiên cứu AI có thể tìm thấy những lý do khác để chọn RTX 4070 thay vì đối thủ cạnh tranh và chúng tôi sẽ xem xét hiệu suất trong một số tác vụ đó cũng như khối lượng công việc chơi game và chuyên nghiệp. Nhưng trước khi điểm chuẩn, chúng ta hãy xem xét kỹ hơn về RTX 4070 Founders Edition.