Es ist angekommenItalienische künstliche Intelligenz. Seit gestern die Grundlegendes großes Sprachmodell Italienisch, ein vollständig sprachliches Modell Open-Source-, entwickelt in Zusammenarbeit mit Cineca. Diese Partnerschaft hat es möglich gemacht Trainieren und optimieren Sie das Modell im großen Maßstab mit der Leonardo-Supercomputer, eine der fortschrittlichsten Computerinfrastrukturen der Welt und a Datensatz 90 % bestehen aus Informationen in italienischer Sprache.
Das erste Modell der Serie heißt Italien 9B, verfügt über eine Transformer-Architektur mit 9 Milliarden Parametern, einem Kontextfenster von 4.096 Token und einem Vokabular von 50.000 Token (d. h. den Diskursteilen, die die Grundlage für die Antworten der KI bilden). Das Modell ist jetzt in Version 0.1 zur Verwendung und Entwicklung verfügbar von Forschern und Unternehmen.
LLM Italien: Ausbildung in 5 Monaten und ausschließlich auf Italienisch
Italien 9B war in nur 5 Monaten ausgebildetDamit ist es eines der fortschrittlichsten Modelle seiner Art. Italia 9B ist ausschließlich auf Italienisch ausgebildet und versteht alle sprachlichen und kulturellen Nuancen mit außergewöhnlicher Präzision. Das LLM wurde mithilfe eines großen Datenkorpus trainiert, der Billionen von Token umfasst. Dieses Korpus wird aus einer Vielzahl von Quellen abgeleitet, darunter öffentliche Quellen, synthetische Daten und von Geschäftspartnern bereitgestellte Brancheninhalte.
Die Zusammenarbeit mit Editorial Nazionale Er hat sein historisches Wissen über Jahrzehnte italienischer und internationaler Geschichte erweitert.
LLM Italien: Kulturkenntnisse und Konversationsfähigkeiten
Zusätzlich zum Wortschatz und zur Satzstruktur verfügt das Modell über umfassende kulturelle und historische Kenntnisse des Landes, die für Anwendungen, die fortgeschrittene Kenntnisse der italienischen Sprache erfordern, unerlässlich sind.
Darüber hinaus zeichnet sich Italien durch seine aus bemerkenswerte Konversationsfähigkeit und für die Effizienz bei der Verarbeitung italienischer Wörter. Dank eines proprietären Tokenizers, der speziell für dieses Modell entwickelt wurde, ist Italia in der Lage, Token auf Italienisch zu verarbeiten und zu generieren, und zwar mit einer Leistung, die einer Steigerung des Kontextfensters um 60 % entspricht.
IA: Es werden nationale Modelle gesucht
Der aktuelle Trend im Bereich der Künstlichen Intelligenz ist der von Suchen Sie nach nationalen Modellen. Diese Wahl zum Trainieren großer Sprachmodelle (LLMs) ausschließlich in der Landessprache stellt einen scharfen Kontrast zu derzeit vorherrschenden Modellen dar, wie z ChatGPT, die überwiegend auf Englisch ausgebildet sind. Diese Modelle können beeinflusst werden durch a kulturelle Voreingenommenheit was sich in den Vorurteilen der Sprache widerspiegelt. Infolgedessen besteht eine wachsende Nachfrage nach „nationalen“ Modellen. In Frankreich zum Beispiel die Mistral-Startups entwickelt ein ähnliches Modell, während in Deutschland das Startup Aleph Alpha erhebliche Investitionen für den gleichen Zweck erhalten hat. Der „Italien-Modell“ zielt darauf ab, ein Trikolore-Modell zu schaffen, das das soziale und kulturelle Gefüge unseres Landes repräsentiert.
LLM Italia: Datenschutz und ethische Integrität
Um sicherzustellen, dassIntegrität der generierten Inhalte, Wurden umgesetzt Sicherheitsfilter speziell für Italienisch. Dank fortschrittlicher Datenbereinigungstechniken wird das Risiko von Verzerrungen gemindert und die Konsistenz bei der Inhaltserstellung gewährleistet sowie die Offenlegung urheberrechtlich geschützter Inhalte so weit wie möglich begrenzt.
Das Unternehmen hat in den Aufbau eines hochwertigen Datensatzes für die Entwicklung seines Sprachmodells investiert und so einen offenen, transparenten und konformen Ansatz für europäische Vorschriften zur künstlichen Intelligenz gewährleistet, wie zKI-Gesetz.
Model Italy: ein LLM für Unternehmen
Italien wurde entworfen, um dem gerecht zu werden Bedürfnisse von Unternehmen in stark regulierten Sektoren wie Finanzdienstleistungen oder der öffentlichen Verwaltung tätig sind. Aufgrund seiner sprachlichen Spezialisierung eignet es sich ideal für kritische Anwendungsfälle und gewährleistet die Zuverlässigkeit der generierten Inhalte. Der proprietäre Tokenizer optimiert die Verarbeitung italienischer Wörter, verbessert die Effizienz und reduziert die Rechenkosten.
„Generative Künstliche Intelligenz ist ein rsoziale Entwicklung, noch bevor es technologisch war, leben Unternehmen heute in einem eher sozialer als technologischer Umbruch, aufgrund eines Fachkräftemangels und teilweise, weil Technologie nicht mehr nur ein Mittel zum Zweck ist“, sagte er Uljan Sharka Gründer und CEO von iGenius. „Dank seiner humanistischen DNA hat Italien die Möglichkeit, eine zu fördern Digitale Renaissance, was zu einer neuen Art der Entwicklung von KI-Lösungen führen kann, bei denen der Mensch im Mittelpunkt steht.“