NASK heeft een nieuwe variant van het Poolse PLLuM-model voor kunstmatige intelligentie gepubliceerd

De nieuwe PLLuM-variant die woensdag werd gepubliceerd, is getraind op een grotere dataset, verfijnd voor nieuwe taken, waaronder officiële, en beter beveiligd tegen aanvallen, zo kondigde het NASK Institute aan in een persbericht. Het bijgewerkte Poolse model werd uitgebracht in drie versies.
Volgens NASK-PIB werd de nieuwe variant van het Poolse AI-model, PLLuM-12B-nc-250715, getraind op een "aanzienlijk beter" voorbereide en grotere dataset; het model werd ook afgestemd op nieuwe taken, waaronder officiële taken.
Het model werd getraind met teksten van onder andere het domein gov.pl, het Public Information Bulletin en de Science Library. "De gegevens worden verzameld in volledige overeenstemming met de Poolse en Europese wetgeving", benadrukte dr. Agnieszka Karlińska van de afdeling Taaltechnologie en Tekstanalyse van NASK in een persbericht.
Zoals gemeld is de bijgewerkte PLLuM beschikbaar in drie varianten: basis, instructief, aangepast aan een reeks taken en 'getraind', wat betekent dat het beschermd is tegen misbruik. Deze nieuwste versie is 'de meest geavanceerde', benadrukte NASK. Het is gebaseerd op sets van prompts (vragen - PAP) en reacties die door mensen als beter of slechter worden beoordeeld, waardoor het nauwkeuriger en veiliger kan reageren tijdens gesprekken.
Modellen uit deze serie zijn beschikbaar op het Hugging Face-platform, waar iedere gebruiker ze kan downloaden na het invullen van een formulier, zo werd toegevoegd.
"Vanaf het begin hebben we het standpunt ingenomen dat het massaal kopiëren van kant-en-klare AI-modellen, zogenaamde sterke LLM's, een aantal risico's met zich meebrengt. Daarom ontwikkelen we een methodologie voor het gecontroleerd genereren van synthetische data, d.w.z. data die met andere modellen is gecreëerd, maar door mensen is geverifieerd en gevalideerd", aldus Dr. Piotr Pęzik, hoogleraar aan de Universiteit van Lodz, operationeel manager van het HIVE AI-project, verantwoordelijk voor het Poolse model. Dit stelt PLLuM in staat de Poolse culturele context beter te begrijpen, nauwkeuriger te reageren en minder onnodige en willekeurige woorden te genereren, aldus de auteurs.
Het model was ook verder beveiligd tegen aanvallen, verzekerde NASK. Kwetsbaarheidstests toonden aan dat de effectiviteit van prompt-aanvallen werd teruggebracht tot 2-3 gevallen per 100 pogingen. Dit is aanzienlijk minder dan bij andere open modellen, merkte NASK op. Prompt-injectieaanvallen zijn een techniek waarbij een aanvaller "kwaadaardige" instructies stuurt en de beveiligingsmaatregelen van het model omzeilt. Dit kan bijvoorbeeld leiden tot het genereren van kwaadaardige reacties of het openbaar maken van vertrouwelijke informatie.
Dr. Karlińska kondigde aan dat het HIVE-consortium "binnenkort" het tweede product uit de PLLuM-familie zal presenteren: een prototype van een burgerassistent (chatbot) die door onderzoekers zal worden gebruikt om vragen te verzamelen voor de implementatie van PLLuM-modellen in de mObywatel-applicatie.
NASK heeft aangekondigd dat er in de komende weken meer releases van het HIVE AI-consortium zullen worden aangekondigd.
PLLuM is een taalmodel dat is ontwikkeld voor de overheid, bedrijven, onderzoekers en burgers – in de vorm van een chatbot. Het werd eind februari van dit jaar gelanceerd. Het ministerie van Digitale Zaken kondigde toen de oprichting aan van HIVE AI, een consortium van Poolse onderzoekscentra en instellingen gericht op digitale diensten, onder leiding van NASK-PIB. Het consortium ontwikkelt nieuwe Poolstalige PLLuM-taalmodellen en implementeert deze binnen de overheidsadministratie. (PAP)
mbl/ mick/
De PAP Foundation staat het kosteloos overnemen van artikelen van de website van Nauka w Polsce toe, mits u ons maandelijks per e-mail op de hoogte stelt van uw gebruik van de website en de bron van het artikel vermeldt. Vermeld op portals en websites het gelinkte adres: Bron: naukawpolsce.pl, en in tijdschriften de annotatie: Bron: Nauka w Polsce website - naukawpolsce.pl. Deze toestemming geldt niet voor informatie in de categorie "Wereld" of voor foto's of videomateriaal.
naukawpolsce.pl