Disponibile da ieri Italia 9B, il primo modello linguistico di grandi dimensioni (LLM) open source completamente italiano, addestrato su un dataset massivo di testo e codice. Sviluppato da iGenius in collaborazione con Cineca, Italia 9B offre capacità avanzate di generazione del testo, traduzione, scrittura creativa e conversazione, con un focus sulla lingua e cultura italiana

È arrivata l’intelligenza artificiale italiana. Da ieri è disponibile il Foundational Large Language Model italiano, un modello di linguaggio completamente open source, sviluppato in collaborazione con Cineca. Questa partnership ha permesso di addestrare e ottimizzare il modello su larga scala utilizzando il supercomputer Leonardo, una delle infrastrutture di calcolo più avanzate al mondo e un dataset per il 90% composto da informazioni in lingua italiana.

Il primo modello della serie, chiamato Italia 9B, presenta un’architettura Transformer con 9 miliardi di parametri, una finestra di contesto di 4.096 token e un vocabolario di 50.000 token (ovveri i tasselli di discorso che costituiscono la base delle risposte dell’IA). Il modello è ora disponibile, in versione 0.1, per l’utilizzo e lo sviluppo da parte di ricercatori e aziende.

LLM Italia: addestrato in 5 mesi ed esclusivamente in italiano

Italia 9B è stato addestrato in soli 5 mesi, rendendolo uno dei modelli più avanzati nel suo genere. Addestrato esclusivamente in italiano, Italia 9B comprende tutte le sfumature linguistiche e culturali con una precisione eccezionale. Il LLM è stato addestrato utilizzando un vasto corpus di dati che comprende migliaia di miliardi di token. Questo corpus deriva da una varietà di fonti, tra cui sorgenti pubbliche, dati sintetici e contenuti di settore forniti dai partner commerciali.

La collaborazione con Editoriale Nazionale ha ampliato la sua conoscenza storica su decenni di storia italiana e internazionale.

LLM Italia: conoscenza della cultura e capacità di conversazione

Oltre al vocabolario e alla struttura delle frasi, il modello possiede una profonda conoscenza culturale e storica del paese, essenziale per applicazioni che richiedono una padronanza avanzata della lingua italiana.

Inoltre, Italia si distingue per la sua notevole capacità conversazionale e per l’efficienza nell’elaborazione delle parole italiane. Grazie a un Tokenizer proprietario sviluppato appositamente per questo modello, Italia è in grado di processare e generare token in italiano con una performance che equivale a un incremento del 60% della sua finestra di contesto.

IA: si cercano modelli nazionali

L’attuale tendenza nell’ambito dell’Intelligenza Artificiale è quella di cercare modelli nazionali. Questa scelta di addestrare i Large Language Model (LLM) esclusivamente nella lingua nazionale rappresenta un deciso contrasto rispetto ai modelli attualmente dominanti, come ChatGPT, che sono principalmente addestrati in inglese. Questi modelli possono essere influenzati da un bias culturale che si riflette nei pregiudizi della lingua. Di conseguenza, c’è una crescente richiesta di modelli “nazionali”. In Francia, ad esempio, la startup Mistral sta sviluppando un modello simile, mentre in Germania la startup Aleph Alpha ha ricevuto notevoli investimenti per la stessa finalità. Il “Modello Italia” si propone di creare un modello tricolore che sia rappresentativo del tessuto sociale e culturale del nostro Paese.

LLM Italia: protezione dei dati e integrità etica

Per garantire l’integrità dei contenuti generati, sono stati implementati filtri di sicurezza specifici per l’italiano. Grazie a tecniche avanzate di Data Cleaning, viene mitigato il rischio di bias e garantita la coerenza nella generazione di contenuti, nonché per limitare al massimo l’esposizione di contenuti coperti da copyright.

L’azienda ha investito nella costruzione di un dataset di alta qualità per lo sviluppo del proprio modello di linguaggio, garantendo un approccio aperto, trasparente e conforme alle normative europee sull’intelligenza artificiale, come l’AI Act.

Modello Italia: un LLM pensato per le aziende

Italia è stato progettato per soddisfare le esigenze delle aziende operanti in settori altamente regolamentati come i servizi finanziari o la pubblica amministrazione. La sua specializzazione linguistica lo rende ideale per casi d’uso critici, garantendo affidabilità nei contenuti generati. Il Tokenizer proprietario ottimizza l’elaborazione delle parole italiane, migliorando l’efficienza e riducendo i costi computazionali.

“L’Intelligenza Artificiale generativa è una rivoluzione sociale, prima ancora che tecnologica, oggi le imprese vivono una distuption sociale più che tecnologica, per una crisi di competenze, e un po’ perché la tecnologia da mezzo è diventata un fine” ha detto Uljan Sharka fondatore e Ad di iGenius. “Grazie al suo Dna umanistico, l’Italia ha l’opportunità di promuovere un Rinascimento Digitale, che può dare vita a un nuovo modo di realizzare soluzioni di AI, dove le persone sono al centro”.