Jack Kong, CEO da Nano Labs, postou no X. Uma nova estratégia de combinação está sendo sugerida para melhorar a eficiência da recuperação de agentes locais. Ao utilizar uma abordagem de tarefa estruturada com uma arquitetura de árvore de visualização mq e empregar qmd para escanear nomes de arquivos antes da extração precisa, o consumo de tokens pode ser reduzido em mais de 80% sem comprometer a precisão. À medida que os custos de IA em nuvem continuam a subir, otimizar processos locais está se tornando cada vez mais importante.