Wat is ChatGPT?
ChatGPT (Chat Generative Pre-trained Transformer) is een complex machine-learning model dat in staat is om natuurlijke taalgeneratie (NLG) taken uit te voeren met zo’n hoge nauwkeurigheid dat het model een Turing test kan doorstaan.
ChatGPT is getraind met enorme hoeveelheden ongelabelde gegevens die vóór 2022 van het internet zijn gehaald. Het model voor kunstmatige intelligentie wordt voortdurend gecontroleerd en geoptimaliseerd voor specifieke taalgerichte taken met aanvullende datasets die door mensen zijn gelabeld.
De taken waartoe ChatGPT in staat is omvatten:
- Antwoorden geven op vragen.
- Een gegeven tekst of zin afmaken.
- Fictieve en niet-fictieve inhoud schrijven op basis van aanwijzingen.
- Mensachtige chatbotreacties creëren.
- Computercode genereren.
- Vertalen van tekst van de ene taal naar de andere.
- Berekeningen uitvoeren.
- Een gegeven tekst samenvatten.
- Tekst in verschillende categorieën indelen.
- De stemming in een tekst analyseren.
- Tekst genereren die gegevens in tabellen en spreadsheets samenvat.
- Reageren op gebruikersinput op een conversationele manier.
ChatGPT is gebaseerd op een Large Language Model (LLM) genaamd GPT-3 (Generative Pre-trained Transformer 3). Een Large Language Model is een soort ”deep neural network” dat miljarden parameters gebruikt en getraind wordt met petabytes aan data. Het model is ontwikkeld door OpenAI, een onderzoeksbedrijf opgericht door Elon Musk.
Techopedia legt ChatGPT uit
Technisch gezien kan ChatGPT worden geclassificeerd als een type generatieve AI. Eenmaal getraind kan een generatief AI-model resultaten produceren die lijken op, maar niet hetzelfde zijn als, de trainingsgegevens.
Hoe is ChatGPT getraind?
Datawetenschappers en machine learning ingenieurs hebben ChatGPT getraind met behulp van semi-supervised learning.
Semi-supervised learning algoritmen worden getraind op datasets die gedeeltelijk gelabeld zijn; sommige datapunten hebben labels, andere niet. Het model gebruikt de gelabelde gegevens om de output van de ongelabelde gegevens te voorspellen.
Volgens OpenAI verzamelden de datawetenschappers de enorme hoeveelheid ongelabelde gegevens die nodig waren om de LLM te trainen, door het internet te scrapen. Ze vulden dit aan met tekstbronnen die ofwel publiekelijk beschikbaar waren of door onderzoekers en mogelijk overheden werden aangeleverd.
OpenAI heeft niet precies bekendgemaakt hoe ze de immens grote datasets die nodig waren om het model te verfijnen, konden labelen, maar het is bekend dat ze een deel van het labelen hebben uitbesteed en het is waarschijnlijk dat ze ook gebruik hebben gemaakt van crowdsourcing-platforms zoals Amazon’s Mechanical Turk.
ChatGPT gebruikt prompts om nauwkeurigere en relevantere antwoorden te genereren op een breed scala van inputs, en wordt voortdurend verfijnd met gebruikers prompts die relevant zijn voor een bepaalde taak.
Het proces bestaat uit het model een prompt te geven en het dan een antwoord te laten genereren. De gegenereerde output wordt dan beoordeeld door een menselijke beoordelaar en het model wordt aangepast op basis van de feedback. Dit verfijningsproces wordt herhaald totdat de resultaten van het model aanvaardbaar zijn.
Daarom is het belangrijk dat gebruikers die met ChatGPT werken, feedback geven over de kwaliteit van de modeloutput. Door de resultaten van het model te evalueren en feedback te geven, kunnen gebruikers bijdragen aan de verfijning van het model en de voortdurende ontwikkeling en verbetering ervan.
ChatGPT en Responsible AI
Responsible AI is een beheerskader dat tot doel heeft complexe black-box AI-modellen zoals ChatGPT beter te helpen verklaren, zodat ze betrouwbaarder worden. OpenAI neemt verschillende stappen om ervoor te zorgen dat ChatGPT het concept van verantwoorde AI ondersteunt.
- Onderzoekers en ontwikkelaars bij OpenAI zoeken naar manieren om dit deep learning-model transparanter te maken en proberen zo open mogelijk te zijn over de mogelijkheden, beperkingen en mogelijk misbruik van het model.
- De datawetenschappers van OpenAI bekijken voortdurend feedback van gebruikers en hebben mensen in het proces (HITL) opgenomen om bias in de trainingsgegevens te voorkomen.
- OpenAI-ingenieurs controleren voortdurend de ChatGPT-gebruikersprompts en de output van het model om ervoor te zorgen dat het verantwoord wordt gebruikt.
ChatGPT en onderwijs
De nieuwste versie van ChatGPT genereert zulke natuurlijke tekst dat opvoeders alarm hebben geslagen over misbruik van het model door leerlingen. Als reactie daarop hebben sommige scholen ChatGPT simpelweg verboden. Andere testen plagiaathulpmiddelen die de taalkundige watermerken van de modellen statistisch kunnen identificeren.
OpenAi, bijvoorbeeld, biedt zijn leden momenteel een gratis plagiaathulpmiddel, AI classifier genaamd. Volgens de website van OpenAI werkt de tool echter het best wanneer de inhoud die op originaliteit wordt gecontroleerd minstens 250 woorden bedraagt en geschreven is door een volwassene die Engels spreekt.
Voorstanders van ChatGPT in de klas zien de waarde van anti-plagiaat tools, maar beweren ook dat dit soort kunstmatige intelligentie (AI) niet zal verdwijnen. In plaats van het gebruik ervan te verbieden, zouden studenten moeten leren hoe ze het hulpmiddel ethisch verantwoord kunnen gebruiken, en docenten zouden dit type kunstmatige intelligentie (AI) moeten gebruiken om kritisch denken aan te leren.
Zakelijke toepassingen voor ChatGPT
ChatGPT wordt gebruikt als een augmented intelligence tool voor diverse zakelijke taken. Momenteel wordt het gebruikt om:
- Het automatiseren van het content creatie proces voor social media posts, website artikelen en productbeschrijvingen.
- Het creëren van chatbots voor klantgesprekken die ook zonder script kunnen werken.
- Het samenvatten en categoriseren van feedback van klanten uit verschillende kanalen.
- Bedrijfsrapporten en marketingdocumenten vertalen van de ene taal naar de andere.
- Standaard computercode en generieke scripts schrijven.
- Code om een app te ontwikkelen, zoals bijvoorbeeld een crypto app.
- Informatie in een spreadsheet of spreadsheet vertalen naar tekst.
- Chatbots maken ter ondersteuning van “just-in-time learning” voor interne trainingsprogramma’s.
- Metabeschrijvingen schrijven en synoniemen voorstellen voor SEO-zoekwoorden.
ChatGPT concurrenten
Google Bard – een conversationele AI-dienst die nauwkeurige en actuele antwoorden geeft op vragen door informatie van het internet te verzamelen. Hoewel het niet precies bekend is hoe de chatbotdienst van Google verschilt van ChatGPT, speculeren insiders uit de sector dat de onderscheidende factor van BARD is dat hij toegang heeft tot actuele informatie van het internet, terwijl ChatGPT alleen toegang heeft tot informatie die vóór 2022 is gepubliceerd.
Facebook Blender – een large language model (LLM) ontwikkeld door Facebook AI. Blender kan verschillende taaltaken uitvoeren, waaronder het beantwoorden van vragen, het genereren van tekst en het samenvatten van lange documenten.