Basado en computación en tecnología de memoria, logró NN VAD y reconocimiento de voz
Time:2023-03-16

WTM2101 es un chip de reconocimiento de voz y activación basado en tecnología informática en memoria, con un núcleo formado por un conjunto de procesadores de bajo consumo diseñados específicamente para el reconocimiento de voz. En comparación con los procesadores de voz tradicionales, el WTM2101 adopta una serie de medidas de optimización para escenarios de activación y reconocimiento de voz, lo que reduce significativamente el consumo de energía.

Una de las medidas de optimización más importantes es el modelo de algoritmo de fonema completo. Los algoritmos de reconocimiento de voz tradicionales requieren una gran cantidad de conocimientos acústicos y lingüísticos para construir modelos acústicos y lingüísticos complejos para lograr un reconocimiento de alta precisión. El modelo de algoritmo de fonema completo utiliza una unidad de voz más simple, a saber, un solo fonema, para evitar el modelado acústico y lingüístico complejo, lo que reduce en gran medida la complejidad y el consumo de energía del algoritmo.

La tecnología de activación y reconocimiento de voz sin conexión se ha utilizado ampliamente en hogares inteligentes y altavoces inteligentes. El equilibrio entre la tasa de reconocimiento de voz de la IA y la tasa de despertares falsos siempre ha sido un desafío, ya que requiere una tasa de despertares falsos de no más de una vez en 24 horas y lograr una tasa de reconocimiento de más del 95 % en entornos ruidosos. Esto requiere altos requisitos para los modelos de algoritmos y la potencia informática y solo puede usarse ampliamente en altavoces, electrodomésticos y terminales móviles.

Además, la tecnología informática en memoria de WTM2101 puede reducir el consumo de energía decenas de veces hasta el nivel de microamperios mientras ejecuta algoritmos de inteligencia artificial de alta potencia, lo que permite que los dispositivos portátiles con solo decenas de baterías de miliamperios por hora tengan capacidades de activación y reconocimiento de voz. Además, WTM2101 puede ejecutar modelos de algoritmos de fonemas completos. El consumo de energía de activación no solo es bajo, sino que incluso se pueden lograr cientos de reconocimiento de palabras de comando sin activación con un consumo de energía total inferior a 1 mA.

WTM2101 también utiliza una serie de optimizaciones de hardware y algoritmos para un bajo consumo de energía, como tecnología de activación rápida, tecnología de procesamiento de fragmentos de voz de baja potencia, etc., que pueden reducir aún más el consumo de energía y mejorar la precisión y estabilidad de la activación del habla. arriba y reconocimiento.

En general, con el respaldo de la tecnología informática en memoria, el WTM2101 puede lograr funciones de reconocimiento y activación de voz eficientes y de bajo consumo, adecuadas para diversas aplicaciones de voz de bajo consumo, incluidos dispositivos portátiles, hogares inteligentes, altavoces inteligentes y terminales móviles.


未标题-21.png