Febbraio 2026
L	M	M	G	V	S	D
	1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Written by aitorFebbraio 18, 2026

M2.5 di MiniMax: il modello open che promette fabbriche di software a 1 $ l’ora

Nei forum di sviluppo e su X si respira un’atmosfera quasi epica: «È iniziata una nuova era», scrivono ingegneri e ricercatori, convinti di poter eseguire livelli di super-intelligenza da una semplice workstation. Il catalizzatore è M2.5, il large language model appena rilasciato da MiniMax. Non punta al piccolo talk, bensì a trasformare conversazione e produttività in catene montanti di codice aperte, veloci ed economiche.

Performance da record: 80,2 % su SWE-Bench Verified e oltre

L’azienda cinese presenta M2.5 come un “frontier model” focalizzato sul lavoro reale e lo correda di numeri che fanno discutere:

80,2 % su SWE-Bench Verified, benchmark che misura la capacità di correggere bug reali.
76,3 su BrowseComp, test di navigazione autonoma nel web.
76,8 su BFCL, metrica di tool calling affidabile.

A ciò si aggiunge la promessa di completare la stessa suite SWE-Bench 37 % più velocemente rispetto al predecessore M2.1, avvicinandosi ai tempi dei modelli proprietari più blasonati.

Da assistente chat a “architetto” di progetti interi

MiniMax insiste sul concetto di planning-first: prima di scrivere una riga, M2.5

descompone il problema,
redige una specifica (spec-writing),
pianifica le dipendenze,
solo infine passa all’implementazione.

Il modello è stato addestrato su oltre 10 linguaggi e 200.000 ambienti reali, in modo da coprire l’intero ciclo: design, setup, iterazione, test e deployment.

Prezzi da shock: 0,30 $ l’ora a 50 token/sec

L’appeal di M2.5 è anche economico. MiniMax fissa i costi operativi a:

1 $/ora a 100 tokens/sec,
0,30 $/ora a 50 tokens/sec.

Due varianti saranno disponibili: Standard (ottimizzata per il budget) e Lightning (per la massima velocità). Un posizionamento pensato per competere con le API chiuse di Big Tech.

Ma “gratis” è una parola grossa. Se si sceglie l’inference locale, entrano in gioco componenti spesso sottostimati: GPU, energia, raffreddamento, manutenzione e il peso reale del modello (non ancora specificato). MiniMax comunque facilita l’auto-hosting: i pesi sono pubblici e si raccomandano vLLM o SGLang per deployment performante, con supporto anche ad altri framework.

Fabbrica di software 24/7: visione e ingegneria

L’idea di un agente che scansiona Reddit, trova una feature richiesta, la implementa e la carica in produzione è affascinante, ma richiede un’architettura robusta:

connettori a fonti esterne,
filtraggio di qualità,
sandbox isolati,
CI/CD,
gestione di segreti,
policy di sicurezza.

M2.5 promette di colmare il gap più critico: mantenere un piano a lungo termine e chiamare strumenti in modo affidabile. Tuttavia, senza guardrail, il rischio è generare debt tecnica a velocità industriale.

Open source, ma con ambizioni enterprise

Il lancio rafforza un trend: i modelli aperti non vogliono più essere la “scelta low-cost”. Mirano a diventare core di IDE avanzate, sistemi di refactoring, agenti di QA interni e deployment on-prem dove il dato non abbandona mai la rete aziendale. Se MiniMax manterrà gli obiettivi di affidabilità, il prossimo passo potrebbe davvero essere la factory di software privata: non magia gratuita, ma IA operativa e misurabile.

Domande frequenti

Che cosa significa “modello aperto” per M2.5?

Significa che MiniMax pubblicherà i pesi, permettendo esecuzioni locali o in cloud privato tramite vLLM, SGLang o altri motori di inference.

Perché SWE-Bench Verified è importante?

È una raccolta di issue reali su GitHub. Un punteggio alto (80,2 %) indica capacità di risolvere problemi di produzione in modo verificabile.

Cos’è il “tool calling” e perché è fondamentale?

È la facoltà del modello di invocare API, browser o comandi in modo strutturato. Senza di essa, un agente resta un semplice generatore di testo.

Si può davvero montare una fabbrica di software su un PC?

L’automatizzazione è possibile, ma richiede pipeline di sicurezza, test e monitoraggio. Il modello è solo uno degli ingredienti di un ecosistema complesso.

Fonte: comunicato MiniMax, benchmark ufficiali e analisi della community su X.

Menu

Archivi

Calendar

Categorie

M2.5 di MiniMax: il modello open che promette fabbriche di software a 1 $ l’ora

Performance da record: 80,2 % su SWE-Bench Verified e oltre

Da assistente chat a “architetto” di progetti interi

Prezzi da shock: 0,30 $ l’ora a 50 token/sec

Fabbrica di software 24/7: visione e ingegneria

Open source, ma con ambizioni enterprise

Domande frequenti

Che cosa significa “modello aperto” per M2.5?

Perché SWE-Bench Verified è importante?

Cos’è il “tool calling” e perché è fondamentale?

Si può davvero montare una fabbrica di software su un PC?

Lascia un commento Annulla risposta

Archivi

Calendar

Categorie

Archives

Categories

Menu

Archivi

Calendar

Categorie

M2.5 di MiniMax: il modello open che promette fabbriche di software a 1 $ l’ora

Performance da record: 80,2 % su SWE-Bench Verified e oltre

Da assistente chat a “architetto” di progetti interi

Prezzi da shock: 0,30 $ l’ora a 50 token/sec

Fabbrica di software 24/7: visione e ingegneria

Open source, ma con ambizioni enterprise

Domande frequenti

Che cosa significa “modello aperto” per M2.5?

Perché SWE-Bench Verified è importante?

Cos’è il “tool calling” e perché è fondamentale?

Si può davvero montare una fabbrica di software su un PC?

You may also like

Pagani, dolore per l’addio al 43enne Giuseppe Abate

Furto sventato a Salerno: arrestato ladro nel bar Armonia di via Gramsci

Potenza-Salernitana a porte chiuse per i granata: il Prefetto vieta la trasferta

Lascia un commento Annulla risposta

Archivi

Calendar

Categorie