AI heeft de manier waarop we omgaan met technologie fundamenteel veranderd. Tools zoals ChatGPT, DALL·E en Midjourney kunnen op basis van eenvoudige tekstinstructies complexe en creatieve content genereren. Maar hoe werkt deze technologie precies? En hoe zorg je ervoor dat jouw input niet wordt hergebruikt als trainingsdata?
Wat is generatieve AI?
Generatieve AI (of GenAI) verwijst naar systemen die in staat zijn om nieuwe, originele inhoud te creëren – tekst, afbeeldingen, audio, … – op basis van de patronen en structuren die ze geleerd hebben uit bestaande gegevens. Deze technologie gebruikt geavanceerde algoritmen en neurale netwerken om materie te genereren die overeenkomt met wat mensen zouden kunnen produceren.
Hoe werkt een generatieve ai zoals ChatGPT?
ChatGPT is een voorbeeld van een generatief AI-model dat is getraind op enorme hoeveelheden tekstdata. Het model leert patronen en structuren in taal te herkennen en kan op basis daarvan nieuwe, samenhangende teksten genereren. Wanneer je een prompt invoert, analyseert ChatGPT de context en genereert het een passend antwoord. Dit proces is mogelijk dankzij transformer-gebaseerde neurale netwerken, die in staat zijn om complexe relaties in data te begrijpen en te reproduceren.
Een machine learning model zoals ChatGPT is opgemaakt uit grote lijnen aan cijfers, “gewichten” of “parameters” genoemd, en code die deze interpreteert en uitvoert. Deze modellen slaan geen kopieën van informatie op waaruit ze leren. In plaats daarvan veranderen de cijfertjes en weerspiegelt de verandering aan cijfertjes in het model hetgeen geleerd werd.
Waarom is het belangrijk om je prompts te beschermen?
Hoewel generatieve AI krachtige mogelijkheden biedt, roept het ook vragen op over privacy en gegevensgebruik. Sommige AI-systemen slaan gebruikersinvoer op en gebruiken deze als trainingsdata om hun modellen verder te trainen. Dit betekent dat jouw prompts, inclusief eventuele gevoelige informatie en fotomateriaal, kunnen worden hergebruikt in toekomstige modelupdates. Het is daarom essentieel om bewust om te gaan met wat je invoert en hoe je je gegevens beschermt.
Drie manieren om te voorkomen dat je prompts worden gebruikt als trainingsdata voor ChatGPT
Gebruik de ‘tijdelijke chat’ feature.
De ‘tijdelijke chat’ optie zorgt ervoor dat ChatGPT jouw info niet deelt en niet opslaat na het gesprek. Deze chats blijven maximaal 30 dagen bewaard en de informatie uit deze chats wordt sowieso niet gebruikt voor trainingsdoeleinden.
Zet “improve model for everyone” uit.
Via deze weg schakel je ChatGPT’s mogelijkheid om jouw prompts als trainingsdata te gebruiken om het model te verbeteren uit. Deze instelling is account gebonden dus de keuze om dit uit te schakelen wordt automatisch doorgetrokken over al jouw toestellen waarop je hetzelfde ChatGPT account gebruikt.
Opt out via een formulier.
Via de website van OpenAI kan je en formulier (https://privacy.openai.com/policies) indienen om een extra privacy request te maken. Momenteel kan je de aanvraag doen om jouw ChatGPT account te verwijderen, de data die ChatGPT over je verzamelde te downloaden, de persoonlijke data waarover ChatGPT beschikt te laten verwijderen of om ChatGPT niet langer op jouw prompts te laten trainen. Deze laatste kan ingediend worden als extra veiligheid bovenop de twee eerste tips. Goed om te weten is dat dit geen invloed heeft op GPT’s die je zelf maakte. Jouw aangepaste persoonlijke assistent onthoudt nog steeds wat je hem/haar vertelt zodat deze jou zo goed mogelijk kan blijven helpen!
Voor bijkomende informatie en/of vragen kan je altijd een kennismakingsgesprek boeken via deze link.