Febbraio 2026
L	M	M	G	V	S	D
	1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Written by aitorFebbraio 18, 2026

Qwen 3.5 di Alibaba: il modello open a 397 miliardi di parametri che rivoluziona l’IA agentica

Alibaba lancia Qwen 3.5: nuova era di IA “agentica” e multimodale a costi ridotti

Alibaba ha appena alzato l’asticella della corsa globale all’intelligenza artificiale con Qwen 3.5, un modello open-weight progettato per l’era agéntica, ovvero sistemi in grado di pianificare, coordinare e compiere azioni complesse all’interno di flussi di lavoro autonomi. L’annuncio arriva in piena stagione dei festival di modelli che ha caratterizzato il mercato cinese nel periodo pre- e post-Año Nuevo Lunar, quando ByteDance, Baidu, Moonshot e altri hanno rilasciato aggiornamenti a ritmo serrato per conquistare trazione API e developer.

Cos’è Qwen 3.5 e perché è rivoluzionario

Qwen 3.5 non è un semplice LLM: è un ecosistema completo che coniuga:

Efficienza inferenziale superiore al 25 % rispetto alla generazione precedente
Capacità visivo-azione native per interpretare schermate, interfacce e controlli
Due modalità di erogazione: open weights per il self-hosting e versione hosted via cloud Alibaba

Architettura e numeri da capogiro

Il punto di forza tecnico è Qwen3.5-397B-A17B, un Mixture-of-Experts (MoE) da 397 miliardi di parametri complessivi, di cui solo 17 miliardi “attivi” per token. Questa configurazione garantisce:

Scalabilità senza il costo computazionale di un modello denso equivalente
Adattabilità a workload enterprise con latenza inferiore

Context window record: fino a 1 milione di token

Per i team che lavorano con codebase o documentazione estesa, la finestra di contesto offre:

262.144 token di default
Possibilità di estensione a 1.010.000 token in modalità ottimizzata
La variante Qwen3.5-Plus-hosted di Alibaba parte già da 1 milione di token con tool pre-integrati

Strategia editoriale: perché “agenti” e non solo chatbot

Il posizionamento di Alibaba è chiaro: spostare l’IA da conversazionale a operativa. Gli agenti nativi possono:

Leggere e interpretare interfacce grafiche
Eseguire azioni su browser, IDE, CRM
Completare pipeline di più step senza intervento umano

Il tutto sfruttando migliorie di architettura come Gated Delta Networks + MoE per ridurre latenza e consumo di memoria quando il contesto esplode.

Cronologia e contesto di mercato

Il lancio si inserisce in un “festival di modelli” cinese che ha visto:

Gennaio 2024: Moonshot lancia Kimi-1.5
Febbraio: ByteDance aggiorna Doubao-Pro
Marzo: Baidu rilascia Ernie 4.5 Turbo
Ora Alibaba con Qwen 3.5, puntando a definire standard di serving e costi per il mercato enterprise e internazionale

Implicazioni pratiche per developer e sysadmin

Self-hosting vs. servizio gestito

CriterioOpen WeightsHosted
Controllo datiTotaleLimitato
Costo fissoCapEx GPUPay-per-token
Latency tuningPossibileStandard
Security & complianceGestione internaSLA Alibaba

Checklist di deploy

Hardware: almeno 8×A100 80 GB per 397B MoE
Serving: TensorRT-LLM, vLLM o TGI hanno già template ufficiali
Observability: metriche di throughput token/s, latenza P99, GPU utilizzo
Guardrails: implementare policy RBAC, audit log e “kill switch” per azioni critiche

FAQ: tutto quello che devi sapere

Che differenza c’è tra IA conversazionale e IA agentica?

L’IA agentica pianifica sequenze di azioni, usa tool esterni e può interagire con software/desktop, mentre la conversazionale si limita a generare risposta testuale.

I pesi aperti sono davvero liberi?

Si, per uso commerciale e modifica, ma verifica sempre la licenza Qwen-2.0 che richiede attribuzione e non permette ri-licensing sotto modelli closed.

Quanto costa girare 1 M token?

Nella versione hosted Alibaba fissa il prezzo a 0,002 USD/1k token input e 0,006 USD/1k token output (listino pre-lancio 23 maggio 2024).

Il panorama dell’intelligenza artificiale enterprise sta entrando nella fase “agent-first”. Con Qwen 3.5, Alibaba mira a diventare il riferimento open per chi vuole scalare IA operativa senza rinunciare a sovranità tecnologica.

Menu

Archivi

Calendar

Categorie

Qwen 3.5 di Alibaba: il modello open a 397 miliardi di parametri che rivoluziona l’IA agentica

Alibaba lancia Qwen 3.5: nuova era di IA “agentica” e multimodale a costi ridotti

Cos’è Qwen 3.5 e perché è rivoluzionario

Architettura e numeri da capogiro

Context window record: fino a 1 milione di token

Strategia editoriale: perché “agenti” e non solo chatbot

Cronologia e contesto di mercato

Implicazioni pratiche per developer e sysadmin

Self-hosting vs. servizio gestito

Checklist di deploy

FAQ: tutto quello che devi sapere

Che differenza c’è tra IA conversazionale e IA agentica?

I pesi aperti sono davvero liberi?

Quanto costa girare 1 M token?

Lascia un commento Annulla risposta

Archivi

Calendar

Categorie

Archives

Categories

Menu

Archivi

Calendar

Categorie

Qwen 3.5 di Alibaba: il modello open a 397 miliardi di parametri che rivoluziona l’IA agentica

Alibaba lancia Qwen 3.5: nuova era di IA “agentica” e multimodale a costi ridotti

Cos’è Qwen 3.5 e perché è rivoluzionario

Architettura e numeri da capogiro

Context window record: fino a 1 milione di token

Strategia editoriale: perché “agenti” e non solo chatbot

Cronologia e contesto di mercato

Implicazioni pratiche per developer e sysadmin

Self-hosting vs. servizio gestito

Checklist di deploy

FAQ: tutto quello che devi sapere

Che differenza c’è tra IA conversazionale e IA agentica?

I pesi aperti sono davvero liberi?

Quanto costa girare 1 M token?

You may also like

Abusi sessuali sulla nipote minorenne: la Cassazione conferma la condanna a otto anni

Salerno, tunisino finisce al CPR di Bari: è lo scafista dell’imbarcazione intercettata il 18 marzo 2026

Salerno, stop all’acqua il 26 e 27 marzo 2026: strade e orari dei cantieri

Lascia un commento Annulla risposta

Archivi

Calendar

Categorie