Jack Kong, PDG de Nano Labs, a publié sur X. Une nouvelle stratégie de combinaison est proposée pour améliorer l'efficacité de la récupération des agents locaux. En utilisant une approche de tâche structurée avec une architecture d'arbre de prévisualisation mq, et en employant qmd pour scanner les noms de fichiers avant une extraction précise, la consommation de jetons peut être réduite de plus de 80 % sans compromettre la précision. Alors que les coûts de l'IA dans le cloud continuent d'augmenter, l'optimisation des processus locaux devient de plus en plus importante.