Nghiên cứu mới dọc theo ranh giới của kỹ thuật vật liệu hứa hẹn cải thiện hiệu suất thực sự đáng kinh ngạc cho các thiết bị máy tính. Một nhóm nghiên cứu do Markus Hellbrand et al. và liên kết với Đại học Cambridge tin rằng vật liệu mới, dựa trên các lớp ôxít hafnium được đào hầm bởi các gai bari thay đổi điện áp, hợp nhất các đặc tính của bộ nhớ và vật liệu liên kết xử lý. Điều đó có nghĩa là các thiết bị có thể hoạt động để lưu trữ dữ liệu, cung cấp mật độ gấp từ 10 đến 100 lần so với các phương tiện lưu trữ hiện có hoặc có thể được sử dụng như một đơn vị xử lý.
Được công bố trên tạp chí Science Advances, nghiên cứu này cho chúng ta một con đường mà qua đó chúng ta có thể đạt được mật độ, hiệu suất và hiệu suất năng lượng cao hơn nhiều trong các thiết bị máy tính của mình. Trên thực tế, một thanh USB điển hình dựa trên công nghệ này (được gọi là phạm vi liên tục) có thể chứa lượng thông tin nhiều hơn từ 10 đến 100 lần so với thông tin chúng ta hiện đang sử dụng.
Với mật độ RAM tăng gấp đôi sau mỗi bốn năm, như JEDEC đã chỉ ra, các nhà sản xuất RAM phải mất hàng thập kỷ để cuối cùng đạt được mức mật độ như công nghệ này đã cho thấy ngày nay.
Thiết bị này cũng là một tia sáng trong đường hầm của điện toán thần kinh. Giống như các tế bào thần kinh trong não của chúng ta, vật liệu (được gọi là bộ nhớ chuyển đổi điện trở) hứa hẹn sẽ hoạt động như một phương tiện lưu trữ và xử lý. Đó là điều đơn giản là không xảy ra trong công nghệ bán dẫn hiện tại của chúng ta: sự sắp xếp thiết kế vật liệu và bóng bán dẫn quá khác biệt giữa những gì bạn cần cho một ô nhớ và những gì bạn cần cho một bộ xử lý (chủ yếu là về độ bền, cũng như khả năng không bị suy giảm hiệu suất) đến mức hiện tại không có cách nào để hợp nhất chúng.
Việc không thể hợp nhất chúng có nghĩa là thông tin phải được truyền liên tục giữa hệ thống xử lý và các bộ đệm khác nhau của nó (khi nghĩ về một CPU hiện đại), cũng như nhóm bộ nhớ ngoài của nó (hãy nhìn vào bộ công cụ DDR5 tốt nhất trên thị trường). trong điện toán, điều này được gọi là nút cổ chai von Neumann, nghĩa là một hệ thống có bộ nhớ riêng biệt và khả năng xử lý sẽ bị giới hạn về cơ bản bởi băng thông giữa cả hai (thường được gọi là bus). Đây là lý do tại sao tất cả các công ty thiết kế chất bán dẫn (từ Intel đến AMD, Nvidia và nhiều công ty khác) đều thiết kế phần cứng chuyên dụng giúp tăng tốc quá trình trao đổi thông tin này, chẳng hạn như Infinity Fabric và NVLink.
Vấn đề là việc trao đổi thông tin này có chi phí năng lượng và chi phí năng lượng này hiện đang giới hạn các giới hạn trên của hiệu suất có thể đạt được. Hãy nhớ rằng khi năng lượng lưu thông, cũng có những tổn thất vốn có, dẫn đến tăng mức tiêu thụ điện năng (giới hạn cứng hiện tại đối với các thiết kế phần cứng của chúng tôi và ưu tiên ngày càng tăng trong thiết kế chất bán dẫn) cũng như nhiệt — một giới hạn cứng khác nữa dẫn đến sự phát triển của các giải pháp làm mát ngày càng kỳ lạ để thử và cho phép định luật Moore đi trước một thời gian. Tất nhiên, cũng có yếu tố bền vững: dự kiến điện toán sẽ tiêu thụ tới 30% nhu cầu năng lượng trên toàn thế giới trong một tương lai không xa.
“Ở một mức độ lớn, sự bùng nổ nhu cầu năng lượng này là do những thiếu sót của công nghệ bộ nhớ máy tính hiện tại,” Tác giả đầu tiên, Tiến sĩ Markus Hellenbrand, từ Khoa Khoa học Vật liệu và Luyện kim của Cambridge cho biết. “Trong điện toán thông thường, có bộ nhớ ở một bên và xử lý ở bên kia, và dữ liệu được xáo trộn trở lại giữa hai bên, điều này tiêu tốn cả năng lượng và thời gian.”
Lợi ích của việc hợp nhất cả bộ nhớ và quá trình xử lý là khá ngoạn mục, như bạn có thể tưởng tượng. Trong khi bộ nhớ thông thường chỉ có khả năng ở hai trạng thái (một hoặc không, nguyên nhân của danh pháp “nhị phân”), một thiết bị bộ nhớ chuyển đổi điện trở có thể thay đổi điện trở của nó thông qua một loạt các trạng thái. Điều này cho phép nó hoạt động ở các loại điện áp tăng lên, từ đó cho phép mã hóa nhiều thông tin hơn. Ở mức đủ cao, đây gần như là quá trình tương tự xảy ra trong lĩnh vực NAND, với sự gia tăng số bit trên mỗi ô tương ứng với số lượng trạng thái điện áp có thể cao hơn được mở khóa trong thiết kế của ô nhớ.
Một cách để phân biệt quá trình xử lý với lưu trữ là nói rằng quá trình xử lý có nghĩa là thông tin đang được ghi và viết lại (cộng hoặc trừ, biến đổi hoặc sắp xếp lại) nhanh như chu kỳ chuyển đổi của nó được yêu cầu. Lưu trữ có nghĩa là thông tin cần ở trạng thái tĩnh trong một khoảng thời gian dài hơn — chẳng hạn như có lẽ vì thông tin đó là một phần của nhân Windows hoặc Linux.
Để xây dựng những thiết bị khớp thần kinh, như bài báo đề cập đến chúng, nhóm nghiên cứu đã phải tìm cách giải quyết nút thắt cổ chai kỹ thuật vật liệu được gọi là vấn đề đồng nhất. Vì hafni oxit (HfO2) không có bất kỳ cấu trúc nào ở cấp độ nguyên tử nên các nguyên tử hafni và oxy có thể tạo ra hoặc phá vỡ các đặc tính cách điện của nó được lắng đọng một cách ngẫu nhiên. Điều này giới hạn ứng dụng của nó để dẫn điện tử (năng lượng điện); cấu trúc nguyên tử càng trật tự thì càng ít gây ra lực cản, do đó tốc độ và hiệu suất càng cao. Nhưng nhóm nghiên cứu đã phát hiện ra rằng việc lắng đọng bari (Ba) trong các màng mỏng của oxit hafnium không có cấu trúc dẫn đến các cầu (hoặc gai) bari có trật tự cao. Và bởi vì các nguyên tử của chúng có cấu trúc chặt chẽ hơn, những cầu nối này có thể cho phép dòng điện tử di chuyển tốt hơn.
Nhưng niềm vui bắt đầu khi nhóm nghiên cứu phát hiện ra rằng họ có thể tự động thay đổi chiều cao của gai bari, cho phép kiểm soát chi tiết độ dẫn điện của chúng. Họ phát hiện ra rằng các gai có thể cung cấp khả năng chuyển đổi với tốc độ ~20ns, nghĩa là chúng có thể thay đổi trạng thái điện áp (và do đó chứa các thông tin khác nhau) trong cửa sổ đó. Họ nhận thấy độ bền chuyển mạch >10^4 chu kỳ, với cửa sổ bộ nhớ >10. Điều này có nghĩa là mặc dù vật liệu này có tốc độ nhanh nhưng số lần thay đổi trạng thái điện áp tối đa mà nó hiện có thể chịu được là khoảng 10.000 chu kỳ – một kết quả không quá tệ nhưng cũng không phải là một kết quả đáng kinh ngạc.
Nó tương đương với độ bền có sẵn của công nghệ MLC (Multi-Level Cell), điều này đương nhiên sẽ hạn chế ứng dụng của nó – việc sử dụng vật liệu này làm phương tiện xử lý (nơi các trạng thái điện áp được thay đổi nhanh chóng để lưu trữ các phép tính và kết quả trung gian của chúng).
Thực hiện một số phép toán thô sơ, việc chuyển đổi ~20 ns dẫn đến tần số hoạt động là 50 MHz (chuyển đổi thành chu kỳ mỗi nano giây). Với việc hệ thống xử lý các trạng thái khác nhau ở tốc độ tối đa (ví dụ: hoạt động như GPU hoặc CPU), điều đó có nghĩa là các cầu nối bari sẽ ngừng hoạt động (đạt đến giới hạn độ bền của chúng) ở khoảng 0,002 giây (hãy nhớ rằng nó chỉ hoạt động ở 50 MHz). Điều đó dường như không đủ hiệu suất cho một đơn vị xử lý.
Nhưng để lưu trữ? Chà, đó là lúc thanh USB có dung lượng bộ nhớ “đậm đặc hơn từ 10 đến 100 lần”. Các thiết bị khớp thần kinh này có thể truy cập nhiều trạng thái điện áp trung gian hơn cả công nghệ NAND dày đặc nhất trong các thanh USB rộng rãi nhất hiện nay có thể – theo hệ số 10 hoặc 100.
Ai lại không thích có một chiếc USB 7 10 TeraByte hoặc thậm chí 100 TeraByte trên tay?
Có một số công việc phải được thực hiện về độ bền và tốc độ chuyển đổi của cầu bari, nhưng có vẻ như thiết kế đã là một bằng chứng hấp dẫn về khái niệm. Tốt hơn nữa, ngành công nghiệp bán dẫn đã hoạt động với hafni oxit, do đó, sẽ có ít cơn ác mộng về công cụ và hậu cần hơn để vượt qua.
Nhưng đây là một khả năng sản phẩm đặc biệt khéo léo: hãy tưởng tượng rằng công nghệ này cải thiện đến mức nó được chế tạo và có thể sử dụng để thiết kế GPU AMD hoặc Nvidia (ngày nay hoạt động ở mức xung quanh 2 GHz). Có một thế giới nơi cạc đồ họa đó đi kèm với trạng thái xuất xưởng được đặt lại, nơi nó hoạt động hoàn toàn dưới dạng bộ nhớ (bây giờ hãy tưởng tượng một cạc đồ họa có 10 TB, giống như thanh USB giả định của chúng tôi).
Hãy tưởng tượng một thế giới mà những gì AMD và Nvidia cung cấp về cơ bản là GPU có thể lập trình, với GPU dựa trên phạm vi liên tục chết theo sản phẩm được xếp chồng lên nhau về khả năng lưu trữ tối đa (hãy nhớ mật độ dày hơn từ 10 đến 100 so với USB hiện tại). Nếu bạn là một người đam mê AI đang cố gắng xây dựng Mô hình ngôn ngữ lớn (LLM) của riêng mình, bạn có thể lập trình GPU của mình sao cho vừa đủ số lượng thiết bị tổng hợp này, những bóng bán dẫn mô phỏng thần kinh này, chạy các chức năng xử lý — không thể biết được có bao nhiêu nghìn tỷ tham số mô hình cuối cùng sẽ kết thúc khi độ phức tạp của chúng tăng lên, vì vậy bộ nhớ sẽ ngày càng trở nên quan trọng hơn.
Có thể quyết định xem các bóng bán dẫn trong cạc đồ họa của bạn được sử dụng chính xác như bộ nhớ hay chính xác như bộ khuếch đại kẹo mắt để chuyển cài đặt đồ họa lên đến mười một, điều đó hoàn toàn phụ thuộc vào người dùng cuối; từ game thủ thông thường đến trình cài đặt Điện toán hiệu năng cao (HPC). Ngay cả khi điều đó đồng nghĩa với việc giảm tuổi thọ của các bộ phận trong con chip của chúng tôi.
Chúng tôi luôn nâng cấp chúng, phải không?
Nhưng chúng ta đừng vượt lên chính mình. Mặc dù đây không phải là một vấn đề nguy hiểm như sự phát triển của AI và quy định của nó, nhưng ước mơ xa về phía trước sẽ chẳng đạt được gì nhiều. Giống như tất cả công nghệ, nó sẽ đến – khi nó sẵn sàng. nếu nó đã từng là.