En el sistema von Neumann, la computación de la CPU y el almacenamiento de la memoria están separados, y el movimiento de datos entre los dos provocará una alta latencia y un alto consumo de energía.
Con el desarrollo de aplicaciones intensivas en memoria y computación como AI en los últimos años, los problemas de alta latencia y alto consumo de energía se han convertido en problemas urgentes que deben resolverse.
Estrictamente hablando, en la computación de memoria se puede dividir en dos categorías:
proceso que usa memoria: está sesgado hacia la innovación de circuitos, como permitir que la memoria misma tenga poder de cómputo, pero este método actualmente tiene una precisión de cálculo limitada.
proceso cerca de la memoria: la memoria integra unidades informáticas adicionales, como la memoria apilada en 3D, la lógica en los controladores de memoria.
Samsung lanzará el primer chip informático en memoria de la industria basado en MRAM (memoria magnética de acceso aleatorio) en Nature en 2022. El uso de MRAM para la informática en memoria es un gran paso adelante.
Sin embargo, todavía hay muchos factores que dificultan el PIM, como:
El problema del intercalado de memoria. La memoria moderna se intercala según el canal. Después de usar PIM, como la memoria apilada en 3D, cómo distribuir datos
Cómo programar más convenientemente, qué operaciones usan PIM y qué operaciones usan CPU
coherencia de caché
La complejidad del proceso.
…
Se cree que estos problemas se superarán en un futuro próximo.