RTX 4060 sẽ sử dụng Ada Lovelace Die cấp nhập cảnh của Nvidia

Theo một bài đăng trên Twitter của @Zed__Wang, RTX 4060 8GB của Nvidia sẽ sử dụng khuôn GPU Ada Lovelace cấp đầu vào của công ty được gọi là AD107, thay vì khuôn AD106 lớn hơn từ RTX 4060 Ti. Điều này sẽ không ảnh hưởng đến thông số kỹ thuật chính thức của GPU, nhưng thực tế là RTX 4060 có thể được sử dụng trên khuôn AD107 cho thấy Nvidia đang tập trung vào việc tăng hiệu quả sử dụng năng lượng thế hệ này trên các GPU tầm trung và cấp thấp.

Quyết định sử dụng AD107 bên trong RTX 4060 của Nvidia không phải là rò rỉ hay tin đồn, trên thực tế, Nvidia đã trực tiếp nói với chúng tôi rằng họ sẽ chính thức sử dụng khuôn AD107 trong GPU tầm trung mới của mình. Do đó, đây sẽ là sản phẩm loại RTX xx60 đầu tiên hoạt động trên khuôn cấp thấp. Các thế hệ GPU RTX tầm trung trước đây như 3060 và 2060 hoạt động trên khuôn GA106 hoặc TU106, cao hơn một bậc so với các GPU tương đương cấp đầu vào kết thúc bằng số 7.

(Nguồn: @Zed__Wang)

Chúng tôi tin rằng GPU sẽ sử dụng khuôn AD107 được kích hoạt đầy đủ. Do đó, sẽ không có mẫu GPU nào khác vượt qua RTX 4060 với thông số kỹ thuật tốt hơn trên cùng một khuôn, bao gồm số lượng lõi, cấu hình bus bộ nhớ, ROP và bộ đệm. Có thể có “RTX 4060 Super” với TDP và xung nhịp cao hơn, nhưng sẽ không có GPU nào khác có thông số kỹ thuật vật lý cao hơn trên khuôn này.

Vuốt để cuộn theo chiều ngang
Thông số kỹ thuật GPU Nvidia 60 lớp
Card đồ họa RTX4060 RTX 3060
Ngành kiến ​​​​trúc AD107 GA106
Công nghệ xử ký TSMC 4N Samsung 8N
Bóng bán dẫn (Tỷ) 18,9 12,0
Kích thước khuôn (mm^2) 158,7 276
Tin nhắn 24 28
Lõi GPU (Shader) 3072 3584
lõi căng 96 112
Lõi RT 24 28
Tăng xung nhịp (MHz) 2460? 1777
Tốc độ VRAM (Gbps) 17 15
VRAM (GB) số 8 12
Chiều rộng đường truyền VRAM 128 192
Bộ đệm L2 24 3
ROP 32 48
TMU 96 112
TFLOPS FP32 (Tăng tốc) 15 12.7
TFLOPS FP16 (FP8) 121 (242) 102 (thưa thớt)
Băng thông (GBps) 272 (453 hiệu quả) 360
TGP (watt) 115 170
Ngày ra mắt tháng 7 năm 2023 Tháng hai 2021
Giá ra mắt $299 $329

Để tham khảo, thông số kỹ thuật của RTX 4060 bao gồm 3072 lõi CUDA, 24 SM, 96 lõi Tensor, 24 lõi RT, bộ đệm L2 24 MB, 48 ROP, 96 TMU và bus 128 bit. Ngoài ra, xung nhịp tăng tốc được đánh giá ở mức 2460 MHz và GPU sẽ có mục tiêu công suất là 115W.

AD107 mang lại cho Nvidia một số lợi thế với RTX 4060; một là GPU sẽ rẻ hơn để sản xuất vì nó sẽ hoạt động trên khuôn GPU nhỏ nhất và dễ sản xuất nhất trong gia đình Ada Lovelace. Một điều nữa là Nvidia có thể giảm tải sản xuất cho một GPU khác chết trong tương lai nếu cần cải thiện năng suất. Ví dụ: Nvidia có thể chọn tận dụng cả AD107 và AD106 cho vanilla RTX 4060 trong tương lai để nâng cao năng suất và giảm lãng phí đối với các khuôn AD106 có khả năng bị hỏng không thể sử dụng với tất cả các lõi được bật.

Đối với những người đam mê và game thủ, thật không may khi thấy RTX 4060 được điều chỉnh theo khuôn AD107, với tiềm năng hiệu suất mà nó có thể có với khuôn AD106 lớn hơn của Nvidia. Nhưng ít nhất chúng ta đang có được một GPU cực kỳ hiệu quả, dễ cấp nguồn và làm mát.

Intel nói về Falcon Shores Flub, hợp nhất lộ trình Habana Gaudi

Ban đầu, Intel đã lên kế hoạch cho các chip Falcon Shores của mình có cả lõi GPU và CPU bên trong, tạo ra ‘XPU’ đầu tiên của công ty dành cho điện toán hiệu năng cao. Tuy nhiên, thông báo bất ngờ cách đây vài tháng rằng họ sẽ chuyển sang thiết kế chỉ có GPU và trì hoãn sản xuất chip đến năm 2025 đã khiến các nhà quan sát trong ngành bị sốc — điều này khiến Intel không thể cạnh tranh với bộ xử lý Instinct MI300 của AMD và bộ xử lý Grace Hopper của Nvidia, cả hai đều có tính năng kết hợp. Thiết kế CPU + GPU.

Hôm nay, Intel đã cung cấp một số lý do có phần đáng ngờ đằng sau quyết định cắt giảm các kế hoạch của mình đối với Falcon Shores để biến nó thành sản phẩm kế thừa duy nhất GPU cho dòng GPU Xeon Max. Intel cũng đã phác thảo một số chi tiết ban đầu về thiết kế Falcon Shores chỉ dành cho GPU mới của mình, mà chúng tôi sẽ đề cập sâu hơn bên dưới.

Intel cũng đã ban hành một lộ trình HPC và AI mới không cho thấy sự kế thừa của bộ xử lý Gaudi3 — thay vào đó, Gaudi và GPU hợp nhất với GPU Falcon Shores khi nó tiếp quản chip HPC và AI ra mắt của Intel. Intel nói với chúng tôi rằng họ ‘có kế hoạch tích hợp sản phẩm Habana và AXG [GPU] lộ trình,’ nhưng các chi tiết của sự tích hợp là rất ít.

Kiến trúc điện toán Gaudi thay đổi đáng kể so với GPU tiêu chuẩn, do đó, có vẻ như kiến ​​trúc điện toán của nó không thể được tích hợp hoàn toàn vào GPU. Do đó, Intel có thể kết hợp các phần nhỏ hơn của thiết kế Gaudi, như giao diện mạng hoặc các khối IP khác, vào GPU của mình. Chúng tôi được biết rằng Jeff McVeigh, Phó chủ tịch kiêm Tổng giám đốc của Nhóm Máy tính tăng tốc của Intel, sẽ cung cấp thêm thông tin chi tiết vào hôm nay. Xin nhắc lại, Intel đã trả 2 tỷ đô la cho Habana Labs và loại bỏ các sản phẩm từ thương vụ mua lại Nervana trị giá 350 triệu đô la để tập trung vào chip Gaudi.

(Nguồn: Intel)

Intel đã chia sẻ một số chi tiết cơ bản về thiết kế Falcon Shores mới, thiết kế này sẽ tiếp tục tập trung vào khối lượng công việc HPC và AI nhưng sẽ sử dụng lõi GPU. Các XPU Falcon Shores tập trung vào HPC được thiết kế cho các ứng dụng siêu máy tính với kế hoạch hợp nhất cả công nghệ CPU và GPU thành một gói chip kết hợp và kết hợp, nhưng giờ đây chúng sẽ xuất hiện lần đầu tiên dưới dạng kiến ​​trúc chỉ GPU vào năm 2025.

Falcon Shores sẽ sử dụng chuyển mạch ethernet tiêu chuẩn, giống như kiến ​​trúc Gaudi tập trung vào AI của Intel, dung lượng bộ nhớ HBM3 không xác định và “I/O được thiết kế để mở rộng quy mô”, có khả năng cho thấy rằng Falcon Shores sẽ đi kèm với các tùy chọn dung lượng bộ nhớ khác nhau. Intel nói rằng Falcon sẽ đi kèm với HBM3 lên tới 288GB và tổng thông lượng bộ nhớ là 9,8 TB/s. Theo dự kiến, nó sẽ hỗ trợ các loại dữ liệu nhỏ hơn, như FP8 và BF16.

Bản phác thảo cơ bản của thiết bị cũng bao gồm giao diện lập trình dựa trên GPU phổ biến, OneAPI, cho phép khả năng tương thích rộng rãi với các CPU và kiến ​​trúc khác. Intel cũng liệt kê hỗ trợ CXL như một điểm khác biệt chính, điều này đưa chúng ta đến lý do đằng sau việc lấy các lõi CPU khỏi gói Falcon Shores.

(Nguồn: Intel)

Intel nói rằng mục tiêu ban đầu của họ là kết hợp các lõi CPU và GPU vào cùng một gói Falcon Shores là quá sớm. Như được hiển thị trong slide trên, Intel nói rằng sự kết hợp tối ưu giữa lõi CPU và GPU đã thay đổi theo thời gian khi khối lượng công việc phát triển và công ty mong đợi những thay đổi nhanh chóng và triệt để hơn đối với tỷ lệ CPU/GPU tối ưu sẽ xảy ra cùng với sự bùng nổ của AI và LLM tổng hợp vào không gian HPC. Do đó, Intel cho biết họ không cảm thấy đã đến lúc phải khóa khách hàng vào các tỷ lệ CPU và GPU cụ thể.

Tuy nhiên, như đã trình bày ở trên, kế hoạch ban đầu cho Falcon Shores đã bao gồm khả năng điều chỉnh tỷ lệ CPU/GPU bằng cách thả một số ô CPU hoặc GPU khác nhau vào thiết kế bốn ô, do đó cho phép nó định cấu hình hỗn hợp tối ưu cho khối lượng công việc khác nhau. Bên cạnh đó, theo thiết kế, các siêu máy tính tiên tiến nhất là những thiết kế chuyên dụng cao cho nhiệm vụ hiện tại và việc điều chỉnh phần mềm cho kiến ​​trúc chỉ đơn giản là một phần thông thường trong công việc vận hành siêu máy tính. Những yếu tố này ngụ ý rằng tỷ lệ CPU/GPU không phải là lý do duy nhất khiến Intel loại bỏ lõi CPU khỏi thiết kế.

Intel cũng chỉ ra việc cho phép khách hàng của mình sử dụng nhiều loại CPU khác nhau, hợp lý sẽ bao gồm chip x86 của AMD và chip Arm của Nvidia, với thiết kế GPU của họ, do đó không khóa khách hàng trong việc chọn lõi x86 của Intel thay vì các công ty khác. Tuy nhiên, một lần nữa, các kế hoạch ban đầu của Intel cũng bao gồm các biến thể chỉ có GPU và CPU của Falcon Shores, vì vậy lý do cơ bản này cũng có vẻ không thuyết phục.

Intel cho biết họ sẽ tận dụng giao diện CXL để cho phép khách hàng của mình tận dụng một kiến ​​trúc có thể kết hợp, có thể kết hợp các tỷ lệ CPU/GPU khác nhau trong các thiết kế tùy chỉnh của họ. Tuy nhiên, giao diện CXL chỉ cung cấp thông lượng 64 GB/giây giữa các phần tử, trong khi các thiết kế CPU+GPU tùy chỉnh như Grace Hopper của Nvidia có thể cung cấp thông lượng bộ nhớ lên tới 1 TB/giây giữa CPU và GPU. Điều đó mang lại cả lợi thế về hiệu suất và hiệu quả so với triển khai CXL cho nhiều loại khối lượng công việc — đặc biệt là khối lượng công việc AI ngốn băng thông bộ nhớ. Đó là chưa kể đến các kết nối vốn có độ trễ thấp hơn giữa các phần tử và các lợi thế khác, chẳng hạn như mật độ hiệu suất cao hơn.

Điều đó có nghĩa là mặc dù ý tưởng của Intel về một kiến ​​trúc có thể kết hợp tốt hơn đối với một số khối lượng công việc, nhưng nó có thể sẽ không thể cạnh tranh với MI300 của AMD hoặc Grace của Nvidia về sức mạnh, chi phí hoặc hiệu suất đối với một số ứng dụng nhất định.

Tương tự như vậy, quyết định làm chậm nhịp phát hành GPU của Intel không phải là lý tưởng vì họ sẽ phải tận dụng các sản phẩm cũ hơn để cạnh tranh với các kiến ​​trúc tiên tiến hơn nhiều cho HPC, như Siêu chip Grace của Nvidia và APU exascale sắp ra mắt của AMD, Instinct MI300, cả hai đều ra mắt vào 2023.

Bất chấp lý do thay đổi mục tiêu của Intel, thật khó để không thấy việc Intel định nghĩa lại Falcon Shores thành một sản phẩm chỉ dành cho GPU do công ty thiếu một điểm uốn kiến ​​trúc sẽ khiến họ gặp bất lợi trong cạnh tranh trong tương lai.

Cooler Master công bố PC Sneaker X với giá 5.999 đô la vào tháng 7

Chúng tôi đã chứng kiến ​​​​sự ra mắt của Cooler Master về hệ thống PC Sneaker X được yêu thích hay không thích tại CES vào đầu năm nay. Cuối cùng, công ty đã công bố phát hành thiết kế PC cao cấp độc đáo này. Nó sẽ ra mắt vào tháng 7 với giá từ 5.999 USD. Trong khi đó, Cooling X, một thiết kế tháp PC truyền thống hơn nhiều với hệ thống làm mát bằng chất lỏng tích hợp đầy đủ, sẽ được phát hành vào tháng 6 với giá từ 6.999 USD.

Jimmy Sha, Giám đốc điều hành của Cooler Master cho biết: “Tôi rất vui khi Cooling X và Sneaker X, hai chiếc máy tính để bàn đột phá thể hiện cam kết của chúng tôi trong việc thúc đẩy ranh giới của sự đổi mới và thiết kế đang được phổ biến rộng rãi. Sha tiếp tục nói về nhu cầu đa dạng của thị trường và tính cá nhân.

(Nguồn: Tương lai)

Sneaker X được coi là một chiếc PC thời trang mang đến sự kết hợp giữa sự sang trọng và hiệu suất. Nó chắc chắn là phong cách, nhưng liệu nó có phong cách hay không vẫn còn là điều gây tranh cãi. Ngoài ra, kích thước vật lý (diện tích) của PC này có nghĩa là sẽ không dễ dàng cất giấu trên hoặc dưới bàn nếu bạn cảm thấy mệt mỏi với sự hiện diện của nó. Kích thước thực của nó là 25,6 x 12,0 x 25,6 inch (650 x 306 x 651 mm). Bạn có thể cảm nhận được mức độ lớn của thiết kế Sneaker X này từ các bức ảnh CES 2023 của chúng tôi, nơi mọi người có mặt (ở trên).

Mặc dù khá cồng kềnh về mặt vật lý, nhưng Sneaker X sử dụng một số thành phần PC tiêu chuẩn nhỏ gọn nhất, chẳng hạn như: nền tảng bo mạch chủ ITX mini, bộ nguồn SFX và chỉ có chỗ cho một ổ đĩa 2,5 inch, nhưng các thành phần mạnh mẽ của nó cần được làm mát. hệ thống với bộ tản nhiệt 360mm. Hơn nữa, Cooler Master đã đảm bảo có đủ chỗ để nâng cấp GPU (hỗ trợ GPU lên tới 304 x 137 x 61mm).

(Nguồn: Cool Master)

Cooler Master sẽ sản xuất các hệ thống Sneaker X với ba phối màu. Tại CES 2023, chúng ta đã thấy phiên bản màu đỏ, nhưng cũng sẽ có phiên bản màu xanh và hồng.

Mặc dù hiện tại đã có ngày phát hành và giá cho Sneaker X, nhưng các thông số kỹ thuật của CPU và GPU lạnh vẫn chưa được cung cấp (và điều tương tự cũng đúng với Cooler X). Sẽ phải có một số thành phần mạnh mẽ trong những chiếc máy này để biện minh cho giá chào bán, cả hai đều trên 5.000 đô la.

Vuốt để cuộn theo chiều ngang
Hàng 0 – Ô 0 Giày thể thao X

làm mát X

Hàng 1 – Ô 0 Phong cách riêng biệt, sức mạnh vượt trội: Một thiết kế độc đáo thách thức tính thẩm mỹ của PC truyền thống Công nghệ làm mát vô song: Sử dụng sáng tạo các tấm bên làm khoang làm mát bằng chất lỏng để tản nhiệt vượt trội
Hàng 2 – Ô 0 Hiệu suất và khả năng tương thích được tối ưu hóa: Hỗ trợ các thế hệ CPU Intel và AMD mới nhất Nhỏ gọn và di động: Tay cầm kiểu dáng đẹp để vận chuyển dễ dàng
Hàng 3 – Ô 0 Làm mát vượt trội cho chơi game đỉnh cao: Hệ thống làm mát bằng nước độc đáo cho chức năng đỉnh cao Linh kiện cao cấp: CPU và GPU làm mát bằng chất lỏng cho hiệu suất cao nhất
Hàng 4 – Ô 0 Giá cả và tính khả dụng: 5.999 đô la Mỹ, có sẵn vào đầu tháng 7 Giá cả và tính khả dụng: 6.999 đô la Mỹ, có sẵn vào cuối tháng 6

Tại CES 2023, chúng tôi lo ngại rằng Cooling X sẽ có các thành phần của AMD đã trở thành ‘thế hệ cuối cùng’ với kiến ​​trúc Zen 3 và RDNA 2 của họ. AMD Ryzen 9 5950X và AMD Radeon 6800XT khó có thể được coi là không đủ sức mạnh, nhưng với mức giá yêu cầu, Cooler Master đã phải nâng cấp các thành phần đã đề cập trước đó này. Thông cáo báo chí mới nhất cho biết hệ thống này đã được nâng cấp lên CPU Zen 4 AMD Ryzen 9 7950X và Ada Lovelace Nvidia GeForce RTX 4080. Các thông số kỹ thuật chính khác của Cooling X mà chúng tôi được biết là nó có tối đa 64GB DDR5-5600 RAM, bộ lưu trữ PCIe Gen4 NVMe M.2 lên đến 4TB và PSU Cooler Master V850 SFX Gold.

(Nguồn: Cool Master)

Một cách phù hợp, lý do tồn tại của Cooler Master Cooling X là hệ thống làm mát bằng chất lỏng, được thiết kế để chế ngự cả CPU và GPU. Chất làm mát chạy qua cả hai tấm bên có gờ. Việc tích hợp thùng máy/bộ làm mát này sẽ giúp các kỹ sư của Cooler Master biến Cooling X trở thành một chiếc PC khá nhỏ gọn, với kích thước 14,63 x 10,47 x 5,88 inch (266 x 149,4 x 371,6 mm, 14,8 lít). Tuy nhiên, nếu bạn đang nghĩ đến việc mang nó đi khắp nơi, thì nó khá đặc và nặng 38,1 pound.

(Nguồn: Cool Master)

Mặc dù thật tốt khi Cooler Master đã xoay sở để sắp xếp ngày phát hành cho hai chiếc PC dựng sẵn ở trên, nhưng những người thích sự táo bạo và kỳ lạ có thể đang chờ đợi Shark X. có lẽ là sản phẩm ấn tượng nhất trong dòng PC CES 2023 của Cooler Master và chúng tôi vẫn đang chờ đợi nó.

AMD hiện cung cấp năng lượng cho 121 siêu máy tính nhanh nhất thế giới

Danh sách Top 500 siêu máy tính nhanh nhất thế giới đã được công bố hôm nay và AMD tiếp tục chuỗi chiến thắng ấn tượng với 121 hệ thống hiện được cung cấp bởi silicon của AMD — tăng 29% so với năm trước. Ngoài ra, AMD tiếp tục giữ vị trí số 1 trong Top 500 với siêu máy tính Frontier, trong khi hệ thống thử nghiệm và phát triển dựa trên cùng một kiến ​​trúc tiếp tục giữ vị trí thứ hai về chỉ số hiệu quả năng lượng trong danh sách Green 500. Nhìn chung, AMD cũng cung cấp năng lượng cho bảy trong số mười hệ thống hàng đầu trong danh sách Green 500.

Frontier do AMD cung cấp vẫn là siêu máy tính loại exascale đủ điều kiện duy nhất trên hành tinh, vì Aurora hai exaflop do Intel cung cấp vẫn chưa gửi kết quả điểm chuẩn sau nhiều năm trì hoãn. Ngược lại, Frontier hiện đã hoạt động đầy đủ và đang được các nhà nghiên cứu sử dụng trong vô số khối lượng công việc khoa học.

Trên thực tế, Frontier tiếp tục cải thiện nhờ điều chỉnh — hệ thống đã lọt vào danh sách Top 500 với hiệu suất 1,02 exaflop vào tháng 6 năm 2022 nhưng hiện đã được cải thiện lên 1,194 exaflop, tăng 17%. Đó là một mức tăng ấn tượng so với 8.699.904 lõi CPU mà nó đã ra mắt. Đối với viễn cảnh, 92 petaflop hiệu suất bổ sung đó từ việc điều chỉnh thể hiện cùng một lượng mã lực tính toán như toàn bộ hệ thống Perlmutter xếp thứ tám trong Top 500.

Giữ vị trí hàng đầu trong Top 500 là một cột mốc quan trọng, nhưng nhiều hệ thống khác do AMD cung cấp cũng đứng đầu danh sách — siêu máy tính do CPU AMD cung cấp tiếp tục giữ bốn trong số mười vị trí hàng đầu trong khi Intel và IBM nắm quyền hai trong số mười người hàng đầu. AMD cũng cung cấp năng lượng cho 12 trong số 20 hệ thống nhanh nhất trên thế giới.

CPU của Intel vẫn thống trị danh sách với tổng số hệ thống trong Top 500 cao hơn AMD. Tuy nhiên, AMD tiếp tục mở rộng thị phần của mình, với 21 trong số 44 hệ thống mới trong danh sách năm ngoái được cung cấp bởi AMD silicon.

Frontier cũng đứng đầu thế giới về điểm chuẩn HLP-MxP, thước đo hiệu suất HPC và AI trong khối lượng công việc có độ chính xác hỗn hợp, với 9,95 exaflop (cải thiện so với điểm số 7,9 exaflop trước đó). Trong khi đó, siêu máy tính LUMI do AMD cung cấp giữ vị trí thứ hai với 2,2 exaflop.

Frontier cũng đứng thứ hai trong điểm chuẩn HPCG, tập trung nhiều hơn vào hiệu suất cấp hệ thống so với Linpack, với 14,05 HPCG-Pflop. LUMI do AMD cung cấp chiếm vị trí thứ hai với 3,41 HPCG-Pflop, trong khi Fugaku giữ vị trí đầu bảng với 16 HPCG-Pflop.

Việc AMD tiếp tục vươn lên các vị trí cao hơn trong các điểm chuẩn Top 500, Green 500, HPCG và HLP-MXP, đồng thời chia sẻ các hệ thống mới, nhấn mạnh rằng CPU của họ có lợi thế về hiệu suất so với các đối thủ cạnh tranh từ Intel. Như chúng ta đã nhiều lần thấy, các xu hướng và công nghệ trong Top 500 có xu hướng lan sang thị trường trung tâm dữ liệu rộng lớn hơn, vẽ nên một bức tranh đầy hứa hẹn cho chip máy chủ EPYC của AMD trong năm tới.

Tiếp theo cho AMD? Siêu máy tính El Capitan 2 exaflop được dự đoán sẽ chiếm vị trí số 1 từ Frontier. Hệ thống này sẽ được cung cấp bởi silicon Instinct MI300 mang tính cách mạng của AMD, kết hợp CPU và GPU vào cùng một gói bộ xử lý để tạo ra một APU exascale. Hệ thống đó sẽ đi vào hoạt động vào cuối năm 2023.

RTX 4060 Ti đánh bại RX 7600 trong các điểm chuẩn chung ban đầu

Cả GeForce RTX 4060 Ti và Radeon RX 7600 đều chưa ra mắt, vì vậy còn quá sớm để biết liệu họ có những gì cần thiết để tranh giành một vị trí trong danh sách card đồ họa tốt nhất hay không. Tuy nhiên, các card đồ họa sắp ra mắt của Nvidia và AMD đã đến tay người đánh giá. Do đó, một số điểm chuẩn đã được đưa ra xung quanh trước khi các bài đánh giá được xuất bản.

VideoCardz đã thu thập các kết quả khác nhau từ nhiều người đánh giá GeForce RTX 4060 Ti 8GB và Radeon RX 7600. Ấn phẩm đã tính toán mức trung bình của dữ liệu được thu thập. Tuy nhiên, trước khi chúng tôi tiếp cận các điểm chuẩn bị rò rỉ, cần chỉ ra rằng những người đánh giá đã sử dụng trình điều khiển GeForce trước khi ra mắt cho báo chí. Do đó, hiệu suất có thể sẽ thay đổi khi Nvidia và AMD phát hành trình điều khiển công khai.

Điểm chuẩn chung, như 3DMark, không phải lúc nào cũng nói lên toàn bộ câu chuyện. Vì vậy, hãy đối xử với các kết quả một cách thận trọng. Hơn nữa, các cửa hàng tin tức đã không xác định liệu các card đồ họa là mô hình tham khảo hay mô hình tùy chỉnh với ép xung nhà máy. Kết quả bao gồm điểm chuẩn Fire Strike kiểu cũ với các cài đặt khác nhau và một số điểm chuẩn gần đây hơn như Time Spy và Speed ​​Way.

Điểm chuẩn GeForce RTX 4060 Ti, Radeon RX 7600

Vuốt để cuộn theo chiều ngang
Card đồ họa điệp viên thời gian Gián điệp thời gian cực độ cách tốc độ
GeForce RTX 4060 Ti 13.395 6,287 3.176
GeForce RTX 3060 Ti 11,723 5,722 2.950
GeForce RTX 3060 8,732 4,096 2.171
Radeon RX 7600 10,687 5,079 1.949
Radeon RX 6650 XT 10.010 4,562 1.673

Kết quả cho thấy GeForce RTX 4060 Ti rõ ràng vượt trội so với Radeon RX 7600. Card đồ họa AD104 vượt trội so với đối thủ Navi 33 của nó 25% trong Time Spy, 24% trong Time Spy Extreme và 63% trong Speed ​​Way. Mặt khác, Radeon RX 7600 chậm hơn GeForce RTX 3060 Ti thế hệ trước.

Tuy nhiên, Radeon RX 7600 đã làm tốt hơn GeForce RTX 3060. Cái trước thể hiện điểm số Time Spy và Time Spy Extreme cao hơn lần lượt là 22% và 24%. GeForce RTX 3060 đã đánh bại Radeon RX 7600 11% trong Speed ​​Way.

So với Radeon RX 6650 XT, Radeon RX 7600 đạt điểm cao hơn lần lượt là 7%, 11% và 16% trong Time Spy, Time Spy Extreme và Speed ​​Way.

Vuốt để cuộn theo chiều ngang
Card đồ họa Đình đám cháy Lửa tấn công cực độ lửa tấn công siêu
GeForce RTX 4060 Ti 33,596 15,873 7,357
GeForce RTX 3060 Ti 29,504 14,377 7,239
GeForce RTX 3060 22,298 10,436 5,059
Radeon RX 7600 30,925 10,436 7,126
Radeon RX 6650 XT 29,546 13,552 6,755

Kết quả Fire Strike đã củng cố những gì chúng ta đã thấy với các điểm chuẩn trước đó. GeForce RTX 4060 Ti nhanh hơn Radeon RX 7600. Mặc dù vậy, trong trường hợp này, tỷ suất lợi nhuận không đáng kể. Card đồ họa của Nvidia lần lượt đạt điểm số cao hơn 9% so với Fire Strike và Fire Strike Extreme. Trong khi đó, đồng bằng trong Fire Strike Ultra chỉ là 3%.

Radeon RX 7600 đã trả thù GeForce RTX 3060 Ti trong Fire Strike. Card đồ họa AMD nhanh hơn 5% trong Fire Strike và nhanh hơn 1% trong Fire Strike Extreme. Trong khi đó, GeForce RTX 3060 Ti chỉ đánh bại Radeon RX 7600 2% trong Fire Strike Ultra.

Đúng như dự đoán, sự khác biệt về hiệu suất giữa Radeon RX 7600 và Radeon RX 6650 XT thấp hơn. Tuy nhiên, điểm trước cao hơn 5% trong Fire Strike và Fire Strike Ultra và lên đến 8% trong Fire Strike Extreme.

Rõ ràng là Radeon RX 7600 không phù hợp với GeForce RTX 4060 Ti. Đối thủ trực tiếp của Radeon RX 7600 phải là GeForce RTX 4060, sẽ không có sẵn cho đến tháng 7, vì vậy chúng tôi có thể phải chờ một thời gian trước khi xem điểm chuẩn cho card đồ họa của Nvidia. Sẽ rất thú vị để xem card đồ họa nào mang lại hiệu năng thuần túy tốt hơn và DLSS và FSR sẽ cân nhắc bao nhiêu trong cuộc chiến.

Road to Zettascale: Intel và RIKEN công bố quan hệ đối tác chiến lược

Intel và RIKEN vào đầu tuần này đã thông báo rằng họ đã đạt được Biên bản ghi nhớ (MOU) về việc tìm ra con đường chung hướng tới điện toán Zettascale. Thông qua đó, các công ty đã đồng ý hợp tác trong nỗ lực chung hướng tới Zettascale, điều này sẽ tận dụng chuyên môn nghiên cứu của cả Intel và RIKEN cũng như bí quyết sản xuất của công ty trước đây. Quyền truy cập của RIKEN vào Dịch vụ đúc của Intel (IFS), bộ phận sản xuất chịu trách nhiệm phục vụ các thiết kế từ khách hàng bên ngoài, là một trong những khía cạnh quan trọng của Biên bản ghi nhớ.

Xem thêm

Đỉnh đồi tiếp theo trong quá trình leo thang sức mạnh tính toán của nhân loại, Zettascale (10 lũy thừa 21, gấp 1.000 lần so với Exascale) đang được chuẩn bị cho các công nghệ có tác động cao. AI và ChatGPT của thế giới này, một số thứ mà chúng tôi yêu thích hơn những thứ khác, là một phần của nó. Nhưng Điện toán hiệu năng cao (HPC) cũng vậy, vỏ bọc chịu trách nhiệm tạo ra các siêu máy tính cổ điển, nhanh nhất thế giới như Summit; và máy tính lượng tử huyền thoại, một giấc mơ đang được thực hiện về việc mở khóa sức mạnh tính toán phi thường ở cấp độ hạ nguyên tử.

Cụ thể, MOU thiết lập hợp tác trong các lĩnh vực liên quan đến siêu máy tính và AI; công nghệ máy tính lượng tử dựa trên silicon và công nghệ mô phỏng lượng tử; và tạo mẫu với sự cộng tác của Intel Foundry Services.

Đối với RIKEN, lợi ích từ chuyên môn của Intel với tư cách là nhà sản xuất cổ điển và lượng tử hàng đầu là không thể phóng đại; nó hoàn toàn phù hợp với chương trình TRIP (Nền tảng đổi mới nghiên cứu chuyển đổi của các nền tảng RIKEN) của RIKEN, chương trình vừa được giới thiệu trong năm nay. Về cơ bản, nó nhằm mục đích ràng buộc lợi ích của tổ chức trong siêu máy tính, cơ sở bức xạ synchrotron quy mô lớn và các dự án tài nguyên sinh học; tăng tốc và phát triển chuyển đổi kỹ thuật số (nghiên cứu DX), và nói theo cách riêng của nó là “cung cấp một động cơ cho sự thay đổi xã hội”. Xem xét công việc của Intel về điện toán lượng tử dựa trên silicon, có vẻ như mọi người đang phát huy thế mạnh của mình.

Đối với Intel, nó có quyền truy cập vào khả năng nghiên cứu và khối lượng kiến ​​thức của RIKEN. Không rõ liệu RIKEN sẽ hoàn thiện lộ trình của mình với thông tin đầu vào của Intel hay liệu họ sẽ thân mật phát triển các giải pháp cho một lộ trình chung hay không. Coi đây là những hệ thống công nghệ tiên tiến nhất của nhân loại – với độ khó tăng thêm của con đường đến Zettascale chỉ kết thúc trong một tương lai mơ hồ – có vẻ như là thông minh khi tập hợp càng nhiều trí tuệ càng tốt.

Xem thêm

Thật thú vị, Giáo sư Satoshi Matsuoka của RIKEN đã làm rõ trên Twitter rằng trong khi RIKEN đang bận rộn làm việc trên FugakuNEXT (kế thừa của siêu máy tính dựa trên Arm nhanh nhất thế giới), Intel vẫn còn một khả năng. Trên thực tế, Intel đang trong cuộc đua trở thành nhà cung cấp chính tiềm năng cho các nghiên cứu khả thi của FugakuNEXT, nhưng như Satoshi đã nói, “có những nhà cung cấp khác cũng cam kết tương tự với các kế hoạch cạnh tranh.”

Trung Quốc cấm chip Micron sau khi đánh giá an ninh mạng

Một tuyên bố chính thức được công bố bởi Cục quản lý không gian mạng Trung Quốc (CAC) nói rằng các nhà khai thác cơ sở hạ tầng thông tin quan trọng “nên ngừng mua các sản phẩm của Micron”. Nghị định, được phát hiện bởi Văn-Yee Leeđược đưa ra sau cuộc đánh giá an ninh mạng đối với các sản phẩm của Micron được bán tại Trung Quốc.

Rõ ràng, đánh giá an ninh của chính phủ Trung Quốc đã phát hiện ra rằng “Các sản phẩm của Micron có các vấn đề an ninh mạng tiềm ẩn tương đối nghiêm trọng, gây rủi ro bảo mật lớn cho chuỗi cung ứng cơ sở hạ tầng thông tin quan trọng của đất nước tôi.” Tuy nhiên, không có chi tiết nào về bất kỳ rủi ro bảo mật cụ thể nào do việc sử dụng các sản phẩm Micron gây ra được đưa ra. Vì vấn đề “an ninh quốc gia”, chúng tôi cho rằng lệnh cấm sản phẩm Micron sẽ được thực hiện nhanh chóng và triệt để.

Cuối tuyên bố của mình, CAC khẳng định rằng tất cả các công ty từ tất cả các quốc gia đều được hoan nghênh gia nhập thị trường Trung Quốc, miễn là họ tuân thủ luật pháp và quy định của địa phương. Một lần nữa, không có gợi ý nào về việc Micron có trụ sở tại Hoa Kỳ đã vi phạm bất kỳ quy định nào.

Bản dịch máy của câu lệnh CAC (Nguồn: CAC)

Nếu không có một số chi tiết đằng sau những tuyên bố của họ về Micron, điều tự nhiên là liệu Trung Quốc có động cơ chính trị và/hoặc kinh tế nào cho việc cấm các sản phẩm của công ty hay không. Do đó, đáng để xem một số tin tức Micron / Trung Quốc đương đại để cung cấp một số bối cảnh cho quyết định.

Đầu tiên, chúng ta hãy xem xét nền tảng chính trị. Các hạn chế thương mại bổ sung của Hoa Kỳ được thực hiện vào tháng 10 năm ngoái có nghĩa là những gã khổng lồ DRAM và NAND mới nổi của Trung Quốc (Yangtze Memory Technologies Co YMTC và ChangXin Memory Technologies CXMT, tương ứng) có thị trường hẹp hơn nhiều để giải quyết. Hậu quả lớn nhất có thể nhìn thấy từ quyết định của chính phủ Hoa Kỳ vào năm ngoái là sau một thời gian hợp tác chặt chẽ, Apple đã phải từ bỏ kế hoạch sử dụng YMTC NAND trong iDevices của mình. Nếu hoạt động trừng phạt của Hoa Kỳ thúc đẩy lệnh cấm Micron mới của Trung Quốc, thì đó sẽ là một cuộc trao đổi ăn miếng trả miếng khá rõ ràng.

Một khả năng khác là các nỗ lực và đầu tư công nghiệp của Trung Quốc đã bắt đầu mang lại hiệu quả trong sản xuất DRAM và NAND. Do đó, quốc gia này hiện cảm thấy các nguồn cung cấp thay thế đủ để họ có thể loại bỏ các sản phẩm của Micron có trụ sở tại Hoa Kỳ mà không gặp vấn đề gì.

(Nguồn: Micron)

Chúng ta cũng phải suy nghĩ về việc Micron có thể bị ảnh hưởng như thế nào bởi lệnh cấm này của Trung Quốc. Micron là một trong ba nhà sản xuất bộ nhớ lớn, nhưng DRAM và NAND là những sản phẩm hàng hóa mà các thương hiệu có ít dấu ấn. Các báo cáo tài chính gần đây cho thấy rằng 25% doanh thu năm 2022 của Micron được tạo ra từ doanh số bán hàng ở Trung Quốc. Tuy nhiên, trong một thị trường hàng hóa, dòng chảy của DRAM và IC NAND có thể điều chỉnh khá nhanh.

Có những dấu hiệu cho thấy những mặt hàng bán dẫn này được dự đoán sẽ tiếp tục giảm mạnh vào năm 2023, nhưng gần đây đã có sự gia tăng tích cực hơn, nhờ vào sự quan tâm đến các công ty hỗ trợ/phục vụ lĩnh vực công nghệ AI. Do đó, cổ phiếu Micron đã trải qua một số thăng trầm trong những tháng gần đây, nhưng vẫn tăng gần 20% trong sáu tháng qua và năm ngày qua đã chiếm một nửa mức tăng đó. Một số điểm tích cực đằng sau Micron cũng bắt nguồn từ khoản đầu tư đáng kể gần đây vào Nhật Bản, với sự hỗ trợ của chính quyền địa phương.

Tại thời điểm viết bài, cổ phiếu Micron hoàn toàn không phản ứng với lệnh cấm của Trung Quốc trong giao dịch sau giờ làm việc. Vì đây là tin tức mới nhất, chúng tôi không thể loại trừ khả năng có thêm phản ứng vào thứ Hai.

Chìa khóa của tiền điện tử: Memristor được tạo bởi máy in phun mở khóa bộ tạo số ngẫu nhiên thực

Một nhóm các nhà nghiên cứu của KAUST (Đại học Khoa học và Công nghệ King Abdullah) đã công bố một kỹ thuật sản xuất mới, mang tính đột phá cho cái được gọi là “memristor” – mạch là một trong bốn thành phần điện cơ bản, bên cạnh điện trở, tụ điện và cuộn cảm . Kỹ thuật mới đã được chứng minh là cho phép tạo ra một trong những thành phần thiết yếu của mật mã, Bộ tạo số ngẫu nhiên thực (TRNG).

Bộ tạo số ngẫu nhiên thực sự là một phần thiết yếu của mật mã và có lẽ vô tình (xét cho cùng, việc tạo ra các số ngẫu nhiên khó đến mức nào?), nó cũng là một trong những bộ dễ bị lỗi nhất. Đó là vì phân phối ngẫu nhiên (nghĩa là khi tất cả các sự kiện có thể xảy ra đều có cơ hội xảy ra như nhau) dễ trở thành phân phối không ngẫu nhiên.

Thông thường, TRNG được triển khai ở cấp độ silicon, chẳng hạn như Bộ đồng xử lý mã hóa (CCP) liên kết với Ryzen và Epyc của AMD (hiện ở phiên bản 5.0). Một cách để tạo ra các số ngẫu nhiên là xem xét các hiện tượng ngẫu nhiên vốn có, chẳng hạn như hiệu ứng quang điện là cơ sở cho hoạt động của máy tính của chúng ta. Từ những hiệu ứng này, các số ngẫu nhiên được tạo ra, sau đó dùng làm cơ sở cho hoạt động mã hóa – mỗi số ngẫu nhiên chuyển thành một phần của thông báo được mã hóa, trong quy trình được gọi là băm. Để hiểu rõ hơn vấn đề, hãy xem xét rằng bộ phận Xilinx của AMD thương mại hóa Mảng cổng có thể lập trình trường (FPGA) với mục đích là đóng vai trò là Trình tạo số ngẫu nhiên thực.

Nhưng các thành phần điện có ranh giới hoạt động và những thay đổi điện áp nhỏ có thể gây ra “lỗi” tính toán hoặc quang điện hình thành các mẫu. Tất nhiên, khi các mẫu xuất hiện trong một nhóm các số được cho là ngẫu nhiên, thì nó không còn là ngẫu nhiên nữa. Có một khuôn mẫu, một xác suất hơi khác để một số được chọn so với số kia. Và nếu nó không thực sự ngẫu nhiên, thì các mẫu mới nổi có thể được trích xuất, phân tích và so sánh với đầu ra được mã hóa… Và con đường mở ra cho thông điệp được cho là an toàn bằng mật mã.

Một số mẫu có thể xuất hiện một cách tự nhiên, do sự mất cân bằng nhất định trong hệ thống đẩy nó ra khỏi trạng thái “cân bằng” ngẫu nhiên (chẳng hạn như sự xuống cấp của phần cứng, nguyên nhân một phần khiến cả CPU và GPU đều giảm tần số hoạt động duy trì tối đa khi chúng già đi ). Chúng tôi đã thấy những thứ đó bị các nhà nghiên cứu khai thác – lấy dữ liệu từ các mẫu chẳng hạn như tốc độ quạt của hệ thống. Nhưng những người khác có thể được giới thiệu bởi các đối thủ đủ tinh vi.

Công trình do các nhà nghiên cứu của KAUST thực hiện giờ đây đã mở khóa quá trình chế tạo TRNG dựa trên memristor trong một quy trình không khác với in 3D. Ngoại trừ thay vì dây tóc thông thường, các lớp boron nitride và điện cực bạc mỏng ở mức nguyên tử được lắng đọng cho đến khi tất cả các phần tử của một memristor xếp vào đúng vị trí. Do quy trình chế tạo cụ thể này, TRNG tiêu hao năng lượng so với các giải pháp thay thế thường được tích hợp CPU, được chế tạo từ các mạch đắt tiền với hàng triệu bóng bán dẫn (tốn kém cả về mức sử dụng năng lượng và không gian mà chúng chiếm trên thiết kế của máy gia tốc).

Pazos, một nhà nghiên cứu trong nhóm KAUS cho biết: “Chúng tôi đã chế tạo một memristor bằng cách sử dụng một vật liệu hai lớp mới có tên là boron nitride hình lục giác, trên đó chúng tôi in các điện cực bạc bằng công nghệ in phun chi phí thấp, có thể mở rộng”. “Các đặc tính độc đáo của 2D h-BN được duy trì sau khi điện cực được in, cho phép tạo ra năng lượng vượt trội và tín hiệu ngẫu nhiên.”

Bộ tạo TRNG thu được dường như phù hợp với kỳ vọng của nhóm: nó cho thấy hiệu suất tốt nhất của TRNG xét về độ ổn định của tín hiệu ngẫu nhiên theo thời gian; nó cho thấy mức tiêu thụ năng lượng cực kỳ thấp; và cuối cùng, khả năng đọc mạch dễ dàng và nhanh chóng, cho phép TRNG dựa trên memristor tạo ra 7 triệu bit ngẫu nhiên mỗi giây.

“Hơn nữa, chúng tôi đã trình diễn một mạch điện tạo ra các số ngẫu nhiên bằng cách kết nối bộ nhớ điện trở của chúng tôi với một bộ vi điều khiển thương mại và thực hiện các thí nghiệm trực tiếp về việc tạo số ngẫu nhiên một cách nhanh chóng,” Pazos nói thêm.

Có vẻ như công nghệ này đã sẵn sàng cho thời điểm quan trọng nhất, trái ngược với hầu hết các đột phá công nghệ khác. Công nghệ này có thể dễ dàng triển khai cho các ứng dụng IoT (Internet of Things) và các thiết bị biên khác, chẳng hạn như mảng nút cảm biến.

Pazos cho biết: “Phương pháp chế tạo chi phí thấp có thể mở rộng của chúng tôi bằng cách sử dụng in phun không chỉ mang lại hiệu suất tuyệt vời mà còn là chìa khóa để tích hợp thành công các thiết bị này vào thiết bị điện tử phức hợp chi phí thấp. “Công trình này chứng minh tiềm năng của các vật liệu 2D như h-BN để tạo nền tảng cho một cuộc cách mạng trong các thiết bị và mạch điện tử vi mô và nano ở trạng thái rắn nhờ các đặc tính điện tử, vật lý, hóa học và nhiệt vượt trội của chúng.”

Thiết kế tham chiếu của RX 7600 dường như phô trương yếu tố hình thức nhỏ gọn

Với các thông số kỹ thuật được đồn đại, không rõ liệu Radeon RX 7600 của AMD có thể cạnh tranh với các card đồ họa tốt nhất hay không. Nhưng, ít nhất, card đồ họa lờ mờ sẽ xuất hiện ở dạng nhỏ gọn, theo kết xuất mới của VideoCardz.

Rõ ràng, AMD đã rất quan tâm đến Radeon RX 7600, được cho là đang sản xuất một thiết kế tham chiếu cho card đồ họa dựa trên Navi 33. Liệu các đối tác của nhà sản xuất chip có đồng ý với thiết kế MBA (do AMD sản xuất) hay không vẫn chưa được biết. Nhưng có một điều chắc chắn, Radeon RX 7600 MBA có thể là một trong những card đồ họa tham khảo nhỏ gọn nhất từ ​​lò của AMD.

Radeon RX 7600 MBA có thiết kế khe cắm kép tiêu chuẩn với hai quạt làm mát. Card đồ họa có bề ngoài đơn giản với ánh sáng RGB bằng 0 và vỏ bọc màu đen. Radeon RX 7600 MBA, có vẻ ngoài ngắn gọn, đi kèm với một tấm ốp lưng phù hợp. Do đó, màn hình hiển thị màu sắc duy nhất trên cạc đồ họa có hình bốn hình tam giác nhỏ trên tấm ốp lưng.

Kích thước của card đồ họa vẫn còn là một bí ẩn, nhưng VideoCardz tuyên bố rằng nó ngắn hơn 21 cm. Nó không phải cỡ nòng mini-ITX, nhưng nó rất gần. Card đồ họa mini-ITX điển hình của bạn dài khoảng 17 cm. Tuy nhiên, Radeon RX 7600 MBA sẽ dễ dàng phù hợp với các hệ thống có hệ số dạng nhỏ (SFF).

Radeon RX 7600 đi kèm với đầu nối PCIe 4.0 x16 tiêu chuẩn, giới hạn ở x8 hoạt động bằng điện. Gắn bó với một kết nối như vậy trên các card đồ họa trong danh mục này là một thực tế phổ biến. Ví dụ: Radeon RX 6600 trước đây và thậm chí cả GeForce RTX 4060 và GeForce RTX 4060 Ti mới được công bố gần đây của Nvidia đều sử dụng cùng một giao diện.

Radeon RX 7600 sẽ tận dụng silicon Navi 33 của AMD, được đồn đại là sử dụng một nút xử lý khác với khuôn Navi 31 cung cấp năng lượng cho Radeon RX 7900 XTX và Radeon RX 7900 XT. TSMC sản xuất Navi 31 cho AMD trên quy trình 5nm của xưởng đúc. Ngược lại, Navi 33 được cho là đến từ quy trình 6nm.

Radeon RX 7600 có khả năng đi kèm với 2.048 Bộ xử lý luồng (SP) với bộ nhớ GDDR6 8GB và giao diện bộ nhớ 128 bit. Chỉ riêng các thông số kỹ thuật đã cho chúng ta biết rằng Radeon RX 7600 không phải là một con quái vật chơi game. Tuy nhiên, card đồ họa phải đủ để chơi game 1080p. Sẽ rất thú vị để xem Radeon RX 7600 nhanh hơn bao nhiêu so với Radeon RX 6650 XT.

Các kết xuất bị rò rỉ cho thấy Radeon RX 7600 có một đầu nối nguồn 8 chân duy nhất, vì vậy đây không phải là một card đồ họa ngốn điện. Đối với đầu ra video, Radeon RX 7600 dường như cung cấp ba đầu ra DisplayPort 2.1 và một cổng HDMI 2.1.

Bất chấp tất cả những rò rỉ và tin đồn, MSRP cho Radeon RX 7600 vẫn là một bí ẩn. Nvidia đã ra mắt GeForce RTX 4060 với giá 299 đô la, vì vậy AMD phải đưa ra mức giá phù hợp hoặc giảm giá để cạnh tranh trừ khi Radeon RX 7600 đánh bại đối thủ. Radeon RX 7600 được đồn đại sẽ tung ra thị trường vào ngày 25 tháng 5, chỉ sau GeForce RTX 4060 Ti của Nvidia một ngày, vì vậy sẽ không lâu nữa chúng ta sẽ thấy card đồ họa hỗ trợ Navi 33 vượt trội so với các đối thủ của nó như thế nào.

Sapphire ra mắt RX 7900 XT rẻ hơn, chậm hơn mà không có buồng hơi

Sapphire đã thêm Radeon RX 7900 XT mới, một trong những card đồ họa tốt nhất, vào dòng sản phẩm của công ty. Radeon RX 7900 XT 20G Ultra Platinum L xuất hiện với hệ thống làm mát và ngoại thất được tân trang lại một chút.

Radeon RX 7900 XT 20G Ultra Platinum L có thiết kế tương tự Radeon RX 7900 XTX Nitro+ Vapor-X có sẵn tại thị trường Hoa Kỳ. Tuy nhiên, có một số thay đổi đáng kể với trước đây. Radeon RX 7900 XT 20G Ultra Platinum L không có biệt danh Vapor-X, nghĩa là card đồ họa không tận dụng buồng hơi của Sapphire để làm mát GPU và bộ nhớ. Thay vào đó, Radeon RX 7900 XT 20G Ultra Platinum L sử dụng một tấm đế bằng đồng tiêu chuẩn. Do đó, nó không cung cấp hiệu suất nhiệt tương tự nhưng rẻ hơn, vì vậy Sapphire có thể giảm giá thành sản phẩm tổng thể.

Hệ thống làm mát khác không ảnh hưởng đến kích thước của Radeon RX 7900 XT 20G Ultra Platinum L. Nó vẫn là một con quái vật 3,5 khe có chiều dài 320 mm, giống như Radeon RX 7900 XTX Nitro + Vapor-X hàng đầu.

Sapphire cũng đã cắt giảm một số góc với thiết kế RGB. Ví dụ: Radeon RX 7900 XT 20G Ultra Platinum L chỉ có một dải RGB trên tấm che, trong khi Radeon RX 7900 XTX Nitro+ Vapor-X có hai dải. Tuy nhiên, nó không ảnh hưởng đến sức hấp dẫn của card đồ họa vì Radeon RX 7900 XT 20G Ultra Platinum L trông vẫn rất hấp dẫn, ngay cả khi không có thêm đèn RGB.

Radeon RX 7900 XT 20G Ultra Platinum L có cùng tốc độ xung nhịp tăng 2.450 MHz như Pulse Radeon RX 7900 XT. Biến thể cắt giảm mới cung cấp hiệu suất thấp hơn một chút so với Radeon RX 7900 XTX Nitro+ Vapor-X. Tuy nhiên, mức chênh lệch không đáng kể vì Radeon RX 7900 XT 20G Ultra Platinum L chỉ có xung nhịp tăng thấp hơn 4% so với Radeon RX 7900 XTX Nitro+ Vapor-X.

Sự thay đổi về bộ làm mát và tốc độ xung nhịp là những khía cạnh duy nhất khiến Radeon RX 7900 XT 20G Ultra Platinum L khác biệt với các mẫu khác của Sapphire. Card đồ họa vẫn phụ thuộc vào ba đầu nối nguồn PCIe 8 chân cho nguồn điện bên ngoài và cung cấp ba đầu ra DisplayPort 2.1 và một cổng HDMI 2.1 để kết nối màn hình.

Các biện pháp cắt giảm chi phí của Sapphire cho phép nhà cung cấp hạ giá Radeon RX 7900 XT 20G Ultra Platinum L xuống còn $899 MSRP. Cửa hàng tin tức Trung Quốc Expreview đã phát hiện ra Radeon RX 7900 XT 20G Ultra Platinum L với giá 898,88 USD trên JD.com. Radeon RX 7900 XTX Nitro+ Vapor-X được bán với giá 970,23 USD tại Trung Quốc. Đó là mức chênh lệch 71,35 đô la, về cơ bản cho chúng ta biết rằng đó là chi phí của dải RGB và buồng hơi bổ sung.

Giá trị CPU chơi game Core i5-13400F của Intel đạt mức thấp nhất mọi thời đại là $165

Core i5-13400 của Intel (và bộ đôi 13400F không có iGPU) đứng đầu danh sách các CPU tốt nhất để chơi game của chúng tôi, bởi vì chúng mang lại hiệu suất chơi game tuyệt vời với mức giá hợp lý. Con chip này có 10 lõi, 6 trong số đó là lõi hiệu suất và 4 trong số đó là lõi hiệu suất, cùng với 16 luồng. Nó có tần số tăng cao nhất là 4,6 GHz và hoạt động ở mức TDP 65W.

Thông thường, bạn sẽ trả khoảng 200 đô la cho 13400F, nhưng ngày nay cả Amazon và Best Buy đều có giá 165 đô la, mức giá thấp nhất từng có ít nhất là 20 đô la. Chúng tôi khuyên dùng 13400F như một phần của hai bản dựng PC tốt nhất của chúng tôi: bản dựng 800 đô la và 1.000 đô la mà chúng tôi định giá là 208 đô la. Bằng cách cắt giảm khoảng 40 đô la so với mức giá đó, bạn có thể tiết kiệm được rất nhiều và có thể chuyển số tiền tiết kiệm được vào một cạc đồ họa nhanh hơn hoặc một ổ SSD dung lượng cao hơn.

Khi đánh giá Core i5-13400F, chúng tôi đã ca ngợi hiệu năng chơi game 1080p mạnh mẽ của con chip này. Trong các thử nghiệm Windows 11 của chúng tôi, 13400 được ghép nối với bộ nhớ DDR4-3600 xuất hiện chỉ sau một vài khung hình / giây so với Ryzen 5 7600 ($ 219) đắt hơn nhiều và nó cũng đánh bại Core i5-12600K của năm ngoái. Bước tiếp theo là Core i5-13600K có giá khoảng 259 đô la và tự hào có xung nhịp tăng 5,1 GHz với 14 lõi và 20 luồng.

(Nguồn: Phần cứng của Tom)

Core i5-13400 (không phải F) được bán với giá $199. Tuy nhiên, chúng tôi không khuyên bạn nên mua chip có GPU tích hợp vì nếu bạn đang xây dựng một hệ thống chơi game, bạn sẽ muốn mua một GPU rời và bất kỳ card đồ họa rời nào, kể cả Intel Arc A380 giá 139 USD, sẽ đồ họa tích hợp của Intel.

Dưới đây, bạn có thể xem thông số kỹ thuật của Core i5-13400 / F và cách chúng so sánh với đối thủ

Vuốt để cuộn theo chiều ngang
Intel Core i5-13400
Ô Tiêu đề – Cột 0 Lõi / Luồng (P+E) Xung nhịp P-Core Base / Boost (GHz) Cơ sở E-Core / Xung nhịp Boost (GHz) Bộ nhớ đệm (L2/L3) TDP / PBP / MTP Ký ức
Ryzen 7 5800X3D 8 /16 3,4/4,5 104MB (8+96) 105W DDR4-3200
Ryzen 7 7700 8 / 16 3,8 / 5,3 40MB (8+32) 65W / 88W DDR5-5200
Lõi i5-13600K / KF 14/20 (6+8) 3.5/5.1 2,6/3,9 44MB (20+24) 125W / 181W DDR4-3200 / DDR5-5600
Lõi i5-12600K / KF 10 / 16 (6+4) 3,7 / 4,9 2,8 / 3,6 29,5MB (9,5+20) 125W / 150W DDR4-3200 / DDR5-4800
Ryzen 5 7600 6/12 3,8 / 5,1 38MB (6+32) 65W / 88W DDR5-5200
Lõi i5-13500 14/20 (6+8) 2,5 / 4,8 1,8 / 3,5 35,5MB (11,5+24) 65W /148W DDR4-3200 / DDR5-4800
Lõi i5-13400F 10 / 16 (6+4) 2,5 / 4,6 1.8/3.3 29,5MB (9,5+20) 65W /148W DDR4-3200 / DDR5-4800
Lõi i5-12400 / F 6 / 12 (6+0) 4,4/2,5 25,5MB (7,5+18) 65W / 117W DDR4-3200 / DDR5-4800
Ryzen 5 5600X 6/12 3,7 / 4,6 35MB (3+32) 65W DDR4-3200
Ryzen 5 5600 6/12 3,5 / 4,4 35MB (3+32) 65W DDR4-3200
Lõi i3-13100F 4/8 (4+0) 3,4/4,5 17MB (5+12) 60W / 89W DDR4-3200 / DDR5-4800

Một điều cần lưu ý về Core i5-13400F là nó có thể hoạt động với RAM DDR4 hoặc DDR5, tùy thuộc vào bo mạch chủ bạn chọn cho nó. Vì RAM DDR4 rẻ hơn RAM DDR5 và sự khác biệt về hiệu suất tương đối nhỏ nên bạn có thể tiết kiệm rất nhiều bằng cách sử dụng tiêu chuẩn cũ hơn. Ngược lại, các chip Ryzen 7000 của AMD đều phải sử dụng bo mạch chủ chỉ nhận bộ nhớ DDR5.

Nếu bạn đang tìm kiếm một bo mạch chủ rẻ tiền để sử dụng với Core i5-13400F, hãy xem xét MSI PRO B760M, chỉ có giá 99 USD. Bạn không cần phải mua bộ làm mát của bên thứ ba cho 13400F, vì nó đi kèm với một bộ làm mát không khí đàng hoàng trong hộp.

Bộ làm mát bằng chất lỏng Bare-Die in 3D phá vỡ các rào cản về sức mạnh của chip, cải thiện tới 3,5 lần

(Nguồn: Phần cứng của Tom)

Một loạt bộ làm mát bộ xử lý in 3D là một trong những bài thuyết trình thú vị nhất tại ITF World, một hội nghị được tổ chức bởi gã khổng lồ nghiên cứu chip imec ở Antwerp, Bỉ. Các khối nước nguyên mẫu này tăng khả năng làm mát các bộ xử lý dày đặc, chẳng hạn như CPU ​​và GPU, lên tới 3,5 lần so với các loại giải pháp mà chúng ta thấy trong các bộ làm mát CPU tốt nhất hiện nay, do đó cho phép mật độ điện năng cao hơn và mở ra hiệu suất chưa được khai thác trong các chip hiện đại. Kết quả của nghiên cứu này có thể dẫn đến các bộ làm mát nước hoàn toàn mới cho tất cả các loại chip.

Làm mát trần bằng chất lỏng trực tiếp trên khuôn bộ xử lý đang nổi lên như một trong những bước tiến rõ ràng nhất để giải quyết lượng nhiệt dư thừa do các chip mới hơn tạo ra và imec đang dẫn đầu với các kỹ thuật mới để mở khóa toàn bộ hiệu suất của các nút xử lý dày đặc nhất. Điều đó trở nên quan trọng hơn với mỗi thế hệ chip mới khi mức tiêu thụ điện năng tăng vọt do quy mô giảm điện năng giảm dần với các nút nhỏ hơn. Ngoài ra, các bóng bán dẫn nhỏ hơn đẩy mật độ điện năng cao hơn, làm phức tạp nỗ lực làm mát và cuối cùng là hạn chế hiệu suất của chip.

Mục tiêu cuối cùng của các nhà thiết kế chip là hoàn thành nhiều công việc hơn trong một không gian nhỏ hơn. Tuy nhiên, các chip ngày nay đã bị hạn chế về năng lượng và các khu vực ‘silic tối’ bị tắt trong khi chip đang hoạt động để duy trì trong các giới hạn nhiệt độ và TDP nhất định. Điều đó có nghĩa là hầu hết các con chip chỉ sử dụng một phần tiềm năng của chúng trong quá trình hoạt động bình thường. Hơn nữa, vấn đề chỉ trở nên nghiêm trọng hơn với mỗi thế hệ chip — các CPU hiện đại như Epyc Genoa của AMD đã đạt mức 400W và lộ trình chỉ ra các chip máy chủ 600W trong tương lai.

Trái ngược với các phương pháp làm mát bằng nước tiêu chuẩn sử dụng khối nước độc lập có tấm lạnh kết hợp với bộ tản nhiệt chip để làm mát bộ xử lý, bộ làm mát in 3D nguyên mẫu được mô tả trong album bên dưới ép chất lỏng trực tiếp lên khuôn bộ xử lý trần, do đó cải thiện khả năng làm mát bằng cách bơm chất làm mát trực tiếp lên bề mặt của bộ xử lý.

Khối nước in 3D cho phép tạo mẫu nhanh và imec sử dụng các loại polyme tiêu chuẩn khác nhau được sử dụng trong in 3D để đảm bảo khối nước có thể xử lý tải nhiệt độ. Không rõ liệu người ta có thể in những thiết kế này trên một trong những máy in 3D tốt nhất hay không.

Các khối nước in 3D có thể được tùy chỉnh theo nhiều cách khác nhau, với các mảng đầu phun tùy chỉnh (bạn có thể thấy chúng trong hình ảnh) phun chất lỏng trực tiếp lên bề mặt chip ở các khu vực được nhắm mục tiêu, chẳng hạn như trực tiếp trên các lõi riêng lẻ hoặc các khu vực tỏa nhiệt cao của con chip được sử dụng cho hoạt động vector, để cải thiện khả năng làm mát.

Các khối nước cũng được tùy chỉnh phù hợp để tiêu tốn ít không gian nhất có thể và hiện đang sử dụng Vòng chữ O để ngăn chất lỏng rò rỉ xung quanh khối nước. Đương nhiên, imec đang thử nghiệm một số loại cơ chế niêm phong khác nhau và các loại vật liệu in 3D khác nhau cho các khối.

Gần như bất kỳ chất lỏng điện môi nào cũng có thể được sử dụng với các bộ làm mát này, chẳng hạn như nước đã qua xử lý hoặc chất làm lạnh. Đương nhiên, mặc dù chất lỏng không dẫn điện, nhưng việc làm mát bằng chất lỏng khuôn trần yêu cầu niêm phong các khu vực xung quanh chip, chẳng hạn như tụ điện và mạch điện tử khác trên PCB. Tuy nhiên, để giữ chất làm mát càng gần chip càng tốt, mặt trên của khuôn không có bất kỳ chất làm kín nào. Các nhà nghiên cứu bơm chất lỏng trực tiếp lên bề mặt khuôn nhẵn, nhưng các phương pháp khác, chẳng hạn như thêm các đường vân vào đỉnh khuôn, có thể mở ra hiệu suất làm mát cao hơn nữa.

Chất bịt kín đặt ra những thách thức về độ tin cậy lâu dài do chu kỳ nhiệt nhanh và tương tác với các chất làm mát khác nhau được sử dụng trong hệ thống. Tuy nhiên, imec đang làm việc một cách có phương pháp để tìm ra sự kết hợp phù hợp của tất cả các vật liệu nhằm đảm bảo độ tin cậy lâu dài.

Album trên chứa một số slide phác thảo các thí nghiệm của nhà nghiên cứu. Nhìn chung, việc làm mát hơn 100W công suất trên mỗi centimet vuông đã chứng tỏ là một vấn đề vô cùng khó khăn, dẫn đến một nguyên tắc chung là trải đều 1W công suất trên 1 MM vuông silicon cho phép làm mát hiệu quả. Tuy nhiên, mật độ năng lượng đang tăng vọt với các nút quy trình nhỏ hơn, do đó, việc tăng khả năng loại bỏ nhiệt từ các nồng độ năng lượng cao hơn là điều tối quan trọng để tiếp tục mở khóa hiệu suất bổ sung.

Hãy nhớ rằng, mức tiêu thụ điện năng nhiều hơn thường tương đương với hiệu suất chip cao hơn (có những lưu ý – hiệu quả có thể bị ảnh hưởng). Các nhà nghiên cứu của imec cho chúng tôi biết rằng họ có thể làm mát tới 1.000W trên một centimet vuông (100W trên mm^2) hoặc thậm chí lên tới 500W trong một mm^2, nhưng loại hiệu suất làm mát đó không phải là tiêu biểu. hiệu suất vì nó không mở rộng tốt cho toàn bộ chip.

Trong các ứng dụng phổ biến, các bộ làm mát chip này có thể cho phép công suất làm mát lên tới 350W trên mỗi centimet vuông, hoặc khoảng 3,5W trên mm^2 — mức tăng 3,5 lần so với mức thường thấy hiện nay. Như đã trình bày trong album ở trên, điều này sẽ cho phép các nhà thiết kế chip tiếp tục đẩy các giới hạn hiệu suất bằng một phương pháp tương đối thận trọng hơn so với các giải pháp làm mát một pha và hai pha vốn sẽ được yêu cầu vượt quá 4W mỗi mm^2.

Đương nhiên, đây là một cái nhìn đơn giản về cách các giải pháp làm mát này sẽ hoạt động, với nhiều biến số khác, chẳng hạn như đồng bằng nhiệt độ và các yếu tố khác, được yêu cầu để đo lường các giá trị khác nhau của phương pháp một cách chính xác. Tuy nhiên, có một điều chắc chắn — phương pháp này đánh dấu một trong những cách dễ dàng nhất để tăng cường khả năng làm mát với mức chi phí tăng hợp lý. Các kỹ thuật khác, chẳng hạn như nghiên cứu của TSMC đề xuất bơm chất làm mát thông qua các vi kênh bên trong chính con chip, rõ ràng là kỳ lạ hơn nhiều và do đó tốn kém hơn và còn xa hơn nữa trong tương lai.

Những nỗ lực của Imec vẫn đang trong giai đoạn nghiên cứu khi các nhà nghiên cứu làm việc để xác định đúng vật liệu, chất lỏng và thiết kế cho phép tạo ra các giải pháp làm mát được sản xuất hàng loạt, với những sản phẩm đầu tiên của nghiên cứu này có thể mất 5 năm trước khi chúng được lọc ra. chợ.

Raspberry Pi Guardian từ Legend of Zelda theo dõi mọi người bằng AI

Với việc phát hành gần đây của Truyền thuyết về Zelda: Nước mắt của Vương quốcngười hâm mộ vô cùng háo hức — một số thậm chí còn phát trực tuyến trò chơi trên máy Nintendo 64 cũ. Hôm nay, chúng tôi có một trò chơi theo chủ đề Zelda thú vị khác quả mâm xôi để chia sẻ với bạn, cái này được tạo bởi nhà sản xuất và nhà phát triển Naomi Pentrel. Với sự trợ giúp của máy in 3D và một chút kiên nhẫn, cô ấy đã tạo ra một bản sao của một trong những người bảo vệ bạn sẽ tìm thấy trong Truyền thuyết về Zelda: Hơi thở của hoang dã và lập trình nó với Pi để theo dõi mọi người bằng AI.

The Guardian được trang bị module camera quan sát khu vực xung quanh. Khi một đối tượng được phát hiện, phía máy học sẽ xử lý hình ảnh để xác định xem nó có nhìn thấy người hay vật nuôi hay không. Nếu nó xác định thành công một sinh vật sống, đầu sẽ quay bằng servo để đi theo nó quanh phòng.

(Nguồn: Naomi Pentrel)

The Guardian được cung cấp năng lượng bằng Raspberry Pi 4 nhưng 3B+ sẽ hoạt động ở vị trí của nó. Nó được kết nối với Raspberry Pi Camera v 1.3 bằng cáp ruy băng 50cm. Một servo SG90 được bao gồm chạy xoay tối đa 180 độ cho dự án này. Một vài đèn LED cũng được đưa vào hỗn hợp và một loa được bao gồm cho đầu ra âm thanh. Trong trường hợp này, Pentrel đang sử dụng loa 2 watt.

Mô hình Người giám hộ được tạo ra bởi một nhà thiết kế tên là Steveut tại Thingiverse. Pentrel giải thích rằng một người bạn đã giúp sửa đổi mô hình có thể hack được để phù hợp với nhu cầu dự án của cô ấy. Nó cũng có thể được tìm thấy tại Thingiverse cho bất kỳ ai muốn in nó ra ở nhà. Một công việc sơn là cần thiết cho lần hoàn thiện cuối cùng cùng với việc tạo ra một cơ sở thực tế để nó có thể ngồi trên cỏ và hoa.

(Nguồn: Naomi Pentrel)

Về mặt phần mềm, nó dựa trên một số tập lệnh được viết bằng Python 3. Các khía cạnh học máy được xây dựng bằng Viam. Pentrel bao gồm rất nhiều chi tiết về cách thiết lập dự án trong Viam, bao gồm cả mô hình được sử dụng để đào tạo nhận dạng hình ảnh được sử dụng bởi máy ảnh trong hướng dẫn của cô ấy.

Nếu bạn muốn xem xét kỹ hơn cách dự án Raspberry Pi này kết hợp với nhau, bạn có thể xem nó hoạt động và đọc qua hướng dẫn của Pentrel trên trang dự án Guardian tại Viam.

HƠN: Bảng RP2040 tốt nhất

HƠN: Dự án Raspberry Pi tốt nhất

HƠN: Raspberry Pi: Cách bắt đầu

Ampere tiết lộ CPU 192 nhân, sau đó đưa ra kết quả thử nghiệm gây tranh cãi

Ampere tuần này đã giới thiệu bộ xử lý AmpereOne dành cho trung tâm dữ liệu đám mây, đây là CPU đa năng đầu tiên trong ngành có tới 132 CPU có thể được sử dụng để suy luận AI.

Các chip mới tiêu thụ nhiều năng lượng hơn so với các chip tiền nhiệm — Ampere Altra (sẽ duy trì trạng thái ổn định của Ampere trong ít nhất một thời gian) — nhưng công ty tuyên bố rằng mặc dù mức tiêu thụ điện năng cao hơn, bộ xử lý có tới 192 lõi của họ cung cấp mật độ tính toán cao hơn so với CPU từ AMD và Intel. Một số tuyên bố về hiệu suất đó có thể gây tranh cãi.

192 Lõi gốc đám mây tùy chỉnh

Bộ xử lý AmpereOne của Ampere có 136 – 192 lõi (trái ngược với 32 đến 128 lõi của Ampere Altra) chạy ở tốc độ lên tới 3,0 GHz dựa trên triển khai độc quyền của công ty về kiến ​​trúc tập lệnh Armv8.6+ (có hai vectơ 128 bit đơn vị hỗ trợ các định dạng FP16, BF16, INT16 và INT8) được trang bị bộ nhớ đệm L2 kết hợp 8 chiều thiết lập 2 MB trên mỗi lõi (tăng từ 1 MB) và được kết nối với nhau bằng mạng mech với 64 nút nhà và rình mò dựa trên thư mục lọc. Ngoài bộ đệm L1 và L2, SoC còn có bộ đệm cấp hệ thống 64MB. Các CPU mới được đánh giá ở mức 200W – 350W tùy thuộc vào SKU chính xác, tăng từ 40W – 180W đối với Ampere Altra.

(Nguồn: Ampe)

Công ty tuyên bố rằng các lõi mới của họ được tối ưu hóa hơn nữa cho khối lượng công việc trên đám mây và AI, đồng thời có các hướng dẫn ‘sức mạnh và hiệu quả’ trên mỗi lần tăng xung nhịp (IPC), điều này có thể có nghĩa là IPC cao hơn (so với Neoverse N1 của Arm được sử dụng cho Altra) mà không có sự gia tăng rõ rệt nào trong tiêu thụ điện năng và khu vực chết. Nói về diện tích khuôn, Ampere không tiết lộ nhưng nói rằng AmpereOne được sản xuất trên một trong những công nghệ xử lý cấp 5nm của TSMC.

(Nguồn: Ampe)

Mặc dù Ampere không tiết lộ tất cả các chi tiết về lõi AmpereOne của nó, nhưng nó nói rằng chúng có tính năng tìm nạp trước dữ liệu L1 có độ chính xác cao (giảm độ trễ, đảm bảo rằng CPU dành ít thời gian chờ dữ liệu hơn và giảm mức tiêu thụ năng lượng của hệ thống bằng cách giảm thiểu truy cập bộ nhớ), khôi phục dự đoán sai nhánh được tinh chỉnh (CPU có thể phát hiện dự đoán sai nhánh và khôi phục càng sớm, nó sẽ giảm độ trễ và sẽ tốn ít năng lượng hơn) và phân định bộ nhớ tinh vi (tăng IPC, giảm thiểu tắc nghẽn đường ống, tối đa hóa việc thực thi không theo thứ tự, giảm độ trễ và cải thiện khả năng xử lý nhiều yêu cầu đọc/ghi trong môi trường ảo hóa).

Mặc dù danh sách các cải tiến kiến ​​trúc lõi của AmpereOne có vẻ không quá dài trên giấy, nhưng những điều này thực sự có thể cải thiện hiệu suất đáng kể và chúng cần thực hiện rất nhiều nghiên cứu (tức là điều gì làm chậm hiệu suất của CPU trung tâm dữ liệu đám mây nhất?) và rất nhiều công việc để thực hiện chúng một cách hiệu quả.

Bảo mật nâng cao và I/O

Do AmpereOne SoC hướng đến các trung tâm dữ liệu đám mây nên nó được trang bị I/O phù hợp, bao gồm tám kênh DDR5 cho tối đa 16 mô-đun hỗ trợ bộ nhớ lên đến 8TB trên mỗi ổ cắm, 128 làn PCIe Gen5 với 32 bộ điều khiển và phân nhánh x4.

Trung tâm dữ liệu cũng yêu cầu độ tin cậy, tính khả dụng, khả năng bảo trì (RAS) và các tính năng bảo mật nhất định. Cuối cùng, SoC hỗ trợ đầy đủ bộ nhớ ECC, mã hóa bộ nhớ khóa đơn, gắn thẻ bộ nhớ, ảo hóa an toàn và ảo hóa lồng nhau, chỉ để nêu tên một vài trong số chúng. Ngoài ra, AmpereOne còn có nhiều khả năng bảo mật như bộ tăng tốc mã hóa và entropy, giảm thiểu tấn công kênh đầu cơ, giảm thiểu tấn công ROP/JOP, v.v.

Kết quả điểm chuẩn tò mò

Không còn nghi ngờ gì nữa, AmpereOne SoC của Ampere là một miếng silicon ấn tượng được thiết kế để xử lý khối lượng công việc trên đám mây và có 192 lõi đa năng, lần đầu tiên trong ngành. Tuy nhiên, để chứng minh quan điểm của mình, Ampere sử dụng kết quả điểm chuẩn khá kỳ lạ.

Ampere coi mật độ tính toán của AmpereOne là lợi thế chính của nó. Công ty tuyên bố rằng một giá đỡ 42U 16,5kW chứa đầy các máy 1S dựa trên AmpereOne SoC 192 lõi có thể hỗ trợ tới 7926 máy ảo, trong khi một giá đỡ dựa trên EPYC 9654 ‘Genoa’ 96 lõi của AMD có thể xử lý 2496 máy ảo và một giá đỡ được hỗ trợ bởi CPU Xeon 8480+ ‘Sapphire Rapids’ có thể mở rộng 56 lõi của Intel có thể xử lý 1680 máy ảo. Sự so sánh này rất có ý nghĩa trong ngân sách điện năng 16,5kW.

Tuy nhiên, mật độ năng lượng của giá đỡ 42U đang tăng lên và các công cụ exascaler như AWS, Google và Microsoft đã sẵn sàng cho điều này, đặc biệt là đối với khối lượng công việc đòi hỏi hiệu năng cao của họ. Dựa trên một cuộc khảo sát từ UpTimeInstolarship vào năm 2020, chúng tôi có thể nói rằng 16% công ty đã triển khai các rakc 42U điển hình với mật độ công suất trên giá đỡ từ 20kW đến hơn 50kW. Cho đến nay, số lượng triển khai điển hình với giá đỡ 20kW đã tăng chứ không giảm, vì các CPU thế hệ trước và mới nhất của AMD đã tăng TDP so với các thế hệ trước.

Khi nói đến hiệu suất, Ampere thể hiện những ưu điểm của hệ thống dựa trên AmpereOne 160 lõi với bộ nhớ 512GB chạy Generative AI (khuếch tán ổn định) và AI Recommenders (DLRM) so với các hệ thống dựa trên CPU EPYC 9654 96 lõi của AMD với 256GB dung lượng lưu trữ. bộ nhớ (có nghĩa là nó hoạt động ở chế độ tám kênh, không phải chế độ 12 kênh được Genoa hỗ trợ). Các máy dựa trên ampe đã tạo ra số khung hình/giây nhiều hơn 2,3 lần đối với AI tổng quát và hơn 2 lần số truy vấn/giây đối với các đề xuất AI.

Trong trường hợp này, Ampere đã so sánh hiệu suất xử lý dữ liệu của các hệ thống của mình với độ chính xác FP16, trong khi các máy dựa trên AMD được tính toán với độ chính xác FP32, đây không phải là phép so sánh táo với táo. Hơn nữa, nhiều khối lượng công việc FP16 hiện đang chạy trên GPU thay vì trên CPU và GPU song song lớn có xu hướng mang lại kết quả ngoạn mục với khối lượng công việc đề xuất AI và AI tổng quát.

Bản tóm tắt

AmpereOne của Ampere là CPU đa năng đầu tiên trong ngành có tới 192 lõi, điều này chắc chắn xứng đáng nhận được nhiều sự tôn trọng. Các CPU này cũng có các khả năng I/O mạnh mẽ, các tính năng bảo mật nâng cao và hứa hẹn cải thiện hướng dẫn trên mỗi lần tăng xung nhịp (IPC). Ngoài ra, chúng có thể chạy khối lượng công việc AI với độ chính xác FP16, BF16, FP8 và INT8.

Nhưng công ty đã chọn sử dụng các phương pháp khá gây tranh cãi để chứng minh quan điểm của mình khi nói đến kết quả điểm chuẩn, điều này phủ bóng đen lên thành tích của họ. Điều đó nói rằng, sẽ rất thú vị khi xem kết quả kiểm tra độc lập của các máy chủ dựa trên AmpereOne.

Bề mặt CPU 16 lõi, 14 lõi của Intel Meteor Lake trong các tiêu chuẩn mới

Intel đã sẵn sàng ra mắt bộ xử lý Meteor Lake thế hệ thứ 14 cho nửa cuối năm nay. Một sản phẩm của quy trình sản xuất Intel 4 (trước đây là 7nm) của nhà sản xuất chip, Hồ sao băng sẽ xuất hiện cho cả định dạng máy tính xách tay và máy tính để bàn nhưng có lẽ là định dạng đầu tiên. Được khai quật bởi thám tử phần cứng momomo_uschúng tôi đạt đỉnh đầu tiên ở hai bộ xử lý được cho là Meteor Lake dành cho thiết bị di động.

Intel tiếp tục đi theo con đường kết hợp với Hồ sao băng. Hồ sao băng, có thiết kế đa ô, sẽ sử dụng lõi hiệu suất Redwood Cove (lõi P) để xử lý khối lượng công việc nặng trong khi tiết kiệm lõi hiệu quả Cresmont (lõi E) cho các tác vụ đơn giản hơn. Thiết kế cho phép tối đa hóa hiệu suất mà không làm giảm mức tiêu thụ điện năng. Tuy nhiên, Hồ sao băng có thể có loại lõi thứ ba, hiện được đồn đại là lõi LP E (lõi hiệu quả năng lượng thấp). Tin đồn có vẻ hợp pháp vì bằng sáng chế của Intel đã cho thấy hai lõi Cresmont bổ sung bên trong ô SoC, dường như có một nút quy trình lớn hơn.

Hồ sao băng có bốn ô: Đồ họa, SoC, CPU và IOE. Các lõi LP E nằm bên trong lát xếp SoC, thực hiện các chức năng tương đương với Khuôn I/O (IOD) trong bộ xử lý AMD Ryzen. Theo các tài liệu bị rò rỉ trước đây, Meteor Lake hỗ trợ “Giảm tải CPU đảo công suất thấp”, ngụ ý rằng công việc của LP E-core có thể liên quan đến việc xử lý các quy trình khi bộ xử lý ở chế độ chờ hoặc chế độ ngủ. Nếu chính xác, nó sẽ giúp giảm đáng kể mức tiêu thụ điện năng trong máy tính xách tay. Hồ sao băng, giống như các chip lai trước đó, sẽ trông đẹp trên lý thuyết do tổng số lõi cao. Trong trường hợp của Hồ sao băng, chúng tôi cũng sẽ tính đến các lõi LP E.

Mẫu Hồ sao băng đầu tiên xuất hiện với 14 lõi có khả năng tuân theo thiết kế 4P + 8E, trong khi mẫu Hồ sao băng thứ hai có 16 lõi nên tuân theo bố cục 6P + 8E. Hai lõi còn lại trong cả hai bộ xử lý mẫu kỹ thuật (ES) đều từ các lõi LP E. Chip 14 nhân Meteor Lake được cho là có 14 MB bộ đệm L2 và 16 MB bộ đệm L3. Bộ xử lý có tốc độ xung nhịp 3,26 GHz. Bộ xử lý rất có thể là Core Ultra 5 1003H bị rò rỉ gần đây. Mặt khác, biến thể 16 lõi dường như có 18 MB bộ đệm L2 và 24 MB bộ đệm L3. Nó chạy với xung nhịp cơ bản 3,07 GHz và xung nhịp boost 4,2 GHz.

Tuy nhiên, báo cáo điểm chuẩn của SiSoftware không chọn bộ nhớ đệm L4 của Meteor Lake (ADM hoặc Adamantine). Mặc dù bằng sáng chế của Intel không đề cập cụ thể đến Meteor Lake, nhưng các bản vá đầu tiên của Linux đã gợi ý rằng ADM có mặt trên các bộ xử lý 7nm sắp tới.

Intel sẽ tổ chức một loạt sự kiện khu vực về Tầm nhìn 2023 trong tháng này, bắt đầu từ sự kiện diễn ra tại Orlando từ ngày 8 tháng 5 đến ngày 10 tháng 5. Vẫn còn ba sự kiện nữa trong danh sách của nhà sản xuất chip: Đài Bắc (24 tháng 5 đến 25 tháng 5, Thượng Hải (30 tháng 5 đến 20 tháng 5) 31) và Amsterdam (13 tháng 6 đến 14 tháng 6) Do đó, chúng ta có thể tìm hiểu thêm về Hồ sao băng trong những tuần tới.

Exit mobile version