Il colosso hi-tech cinese Tencent ha rilasciato un nuovo modello di intelligenza artificiale, presentato come in grado di rispondere alle domande più velocemente del successo globale mandarino DeepSeek-R1.
Si tratta di Hunyuan Turbo S, presentato come capace di replicare alle richieste entro un secondo, distinguendosi “da DeepSeek R1, Hunyuan T1 e altri modelli lenti che devono pensare per un po’ prima di rispondere”, ha affermato la compagnia in una nota.
L’ultima proposta di Tencent sottolinea la crescente pressione sui giganti della tecnologia cinese per tenere il passo con i modelli di intelligenza artificiale in rapida evoluzione e i successi delle startup più piccole, a partire da DeepSeek. Il modello rappresenta una svolta significativa nelle capacità di ottimizzazione delle prestazioni dei grandi modelli linguistici.
A differenza dei tradizionali modelli slow-thinking quali Deepseek R1 e Hunyuan T1, Hunyuan Turbo S dà “risposte istantanee”, migliorando significativamente la velocità di output delle risposte e riducendo la latenza della prima parola del 44%: prestazioni che pesano in più aree come conoscenza, matematica e creazione, fornendo una nuova soluzione per la capacità di reazione dei modelli di grandi dimensioni.
L’ispirazione progettuale per Hunyuan Turbo S deriva dalla modalità fast-thinking, su cui gli esseri umani fanno affidamento per il 90%-95% delle decisioni quotidiane basate sull’intuizione. In combinazione con la modalità slow-thinking dell’analisi razionale, fornisce al modello di grandi dimensioni capacità di risoluzione dei problemi più intelligenti ed efficienti.
In termini di architettura innovativa, Hunyuan Turbo S adotta una modalità di fusione Hybrid-Mamba-Transformer, riducendo la complessità computazionale e l’occupazione della cache KV-Cache dello schema Transformer tradizionale.
Attualmente, sviluppatori e utenti aziendali possono accedere a Hunyuan Turbo S tramite API sul sito Web di Tencent Cloud e usufruire di una prova gratuita di una settimana. Il prezzo è di 0,8 yuan/milione di token per l’input e 2 yuan/milione di token per l’output, con una significativa riduzione di prezzo rispetto al modello Hunyuan Turbo della generazione precedente.