Geldiİtalyan yapay zekası. Dünden bu yana Temel Büyük Dil Modeli İtalyancatamamen dil modeli açık kaynak, yılında geliştirildi Cineca'yla işbirliği. Bu ortaklık şunu mümkün kıldı: modeli eğitin ve optimize edin kullanılarak büyük ölçekte Leonardo süper bilgisayarıdünyanın en gelişmiş bilgi işlem altyapılarından biri ve veri kümesi %90'ı İtalyanca bilgilerden oluşmaktadır.
Serinin ilk modeli olarak adlandırılan İtalya 9B, 9 milyar parametreli bir Transformer mimarisine, 4.096 jetonluk bir bağlam penceresine ve 50.000 jetonluk bir kelime dağarcığına (yani yapay zekanın yanıtlarının temelini oluşturan söylem parçalarına) sahiptir. Model artık kullanım ve geliştirme için 0.1 versiyonu mevcuttur araştırmacılar ve şirketler tarafından
LLM İtalya: 5 ayda ve yalnızca İtalyanca eğitim aldı
İtalya 9B oldu sadece 5 ayda eğitildiBu da onu türünün en gelişmiş modellerinden biri haline getiriyor. Yalnızca İtalyanca eğitimi almış olan Italia 9B, tüm dilsel ve kültürel nüansları olağanüstü bir hassasiyetle anlar. LLM, trilyonlarca jetonu kapsayan geniş bir veri kümesi kullanılarak eğitildi. Bu derleme, kamuya açık kaynaklar, sentetik veriler ve iş ortakları tarafından sağlanan sektör içeriği dahil olmak üzere çeşitli kaynaklardan elde edilmiştir.
İle işbirliği Ulusal Editoryal onlarca yıllık İtalyan ve uluslararası tarih boyunca tarihsel bilgisini genişletti.
LLM İtalya: kültür bilgisi ve konuşma becerileri
Kelime dağarcığı ve cümle yapısının yanı sıra model, İtalyanca diline ileri düzeyde hakimiyet gerektiren uygulamalar için gerekli olan, ülkeye ilişkin derin kültürel ve tarihi bilgiye sahiptir.
Ayrıca İtalya bu özelliğiyle öne çıkıyor. olağanüstü konuşma yeteneği ve İtalyanca kelimelerin işlenmesinde verimlilik için. Bu model için özel olarak geliştirilen tescilli Tokenizer sayesinde Italia, bağlam penceresinde %60'lık bir artışa eşdeğer bir performansla İtalyanca tokenleri işleyebiliyor ve üretebiliyor.
IA: ulusal modeller aranıyor
Yapay Zeka alanındaki mevcut eğilim şu şekildedir: ulusal modelleri arayın. Büyük Dil Modellerini (LLM'ler) eğitmek için bu seçim yalnızca ulusal dilde gibi şu anda baskın olan modellerle keskin bir tezat oluşturuyor. ChatGPT, ağırlıklı olarak İngilizce eğitimi alıyorlar. Bu modeller şunlardan etkilenebilir: Kültürel önyargı bu da dilin önyargılarına yansır. Sonuç olarak “milli” modellere olan talep artıyor. Örneğin Fransa'da, Mistral girişimleri benzer bir model geliştiriyor, Almanya'da ise Aleph Alpha girişimi aynı amaç için önemli yatırımlar aldı. “İtalya Modeli” ülkemizin sosyal ve kültürel dokusunu temsil eden üç renkli bir model oluşturmayı hedefliyor.
LLM Italia: veri koruma ve etik dürüstlük
Bunu sağlamak içinoluşturulan içeriğin bütünlüğü, uygulanmıştır güvenlik filtreleri İtalyancaya özel. Gelişmiş Veri Temizleme teknikleri sayesinde önyargı riski azaltılır ve içerik üretiminde tutarlılık garanti edilir, ayrıca telif hakkıyla korunan içeriğin teşhiri mümkün olduğu kadar sınırlandırılır.
Şirket, dil modelinin geliştirilmesi için yüksek kaliteli bir veri kümesi oluşturmaya yatırım yaptı ve yapay zekaya ilişkin Avrupa düzenlemelerine açık, şeffaf ve uyumlu bir yaklaşım sağladı.AI Yasası.
Model İtalya: şirketler için tasarlanmış bir Yüksek Lisans
İtalya, bu gereksinimleri karşılamak üzere tasarlandı. şirketlerin ihtiyaçları Finansal hizmetler veya kamu yönetimi gibi sıkı düzenlemeye tabi sektörlerde faaliyet gösterenler. Dil uzmanlığı, onu kritik kullanım durumları için ideal hale getirerek oluşturulan içeriğin güvenilirliğini sağlar. Tescilli Tokenizer, İtalyanca kelimelerin işlenmesini optimize ederek verimliliği artırır ve hesaplama maliyetlerini azaltır.
“Üretici Yapay Zeka birsosyal evrim, teknolojik olmadan önce bile, bugün işletmeler bir arada yaşıyor teknolojik bozulmadan ziyade sosyal bozulmabeceri krizi nedeniyle ve kısmen de teknolojinin bir araç olmaktan çıkıp bir amaca dönüşmesi nedeniyle” dedi Uljan Sharka iGenius'un kurucusu ve CEO'su. “İnsancıl DNA’sı sayesinde İtalya, Dijital RönesansBu, insanların merkezde olduğu yapay zeka çözümleri yaratmanın yeni bir yolunu ortaya çıkarabilir."