O Google apresentou a inovadora tecnologia TurboQuant, desenvolvida para reduzir significativamente o consumo de memória durante o processo de inferência (saída) de grandes modelos de linguagem (LLMs). Esta notícia provocou uma reação imediata no mercado, e muitos analistas e representantes da imprensa começaram a discutir ativamente o potencial arrefecimento da demanda por chips DRAM num futuro próximo.
