Supervised & Unsupervised
Supervised en unsupervised learning zijn twee manieren waarop computers leren van gegevens. Bij supervised learning gebruiken computers de toegekende gegevens om te leren en bij unsupervised learning richten de computers zich op de niet toegekende gegevens.Supervised Learning:
Bij supervised learning ontvangen computers toegekende gegevens, wat betekent dat deze gegevens al zijn voorzien van de juiste antwoorden. Het is makkelijk te vergelijken met het lezen van een boek waarbij elke afbeelding een label heeft dat beschrijft wat het is bijvoorbeeld hond of kat. De computer leert door de afbeeldingen en probeert nieuwe afbeeldingen in te delen op basis van deze bekende labels. Er bestaan twee soorten problemen bij supervised learning: indeling en regressie. indeling gaat over het indelen van dingen in specifieke groepen, zoals het onderscheiden van de hiervoor genoemde hond en kat. Regressie helpt bij het voorspellen van resultaten op basis van andere variabelen, zoals het voorspellen van de prijs van een huis aan de hand van grootte en locatie.Unsupervised Learning:
Unsupervised learning werkt anders omdat de gegevens niet toegekend zijn en dus ook niet gelabeld zijn. Het is makkelijk te vergelijken met een doos vol foto's zonder enige labels erop. De computer moet zelf indelingen vinden zonder te weten wat elke foto precies voorstelt. Binnen unsupervised learning zijn er drie belangrijke taken: clustering, associatie en dimensionaliteit vermindering. Clustering is het indelen van vergelijkbare dingen bijvoorbeeld het groeperen van foto's van verschillende dieren. Associatie draait om het vinden van relaties tussen verschillende gegevenspunten, bijvoorbeeld in de vorm van mensen die vaak koffie kopen die ook suiker kopen. Dimensionaliteit vermindering helpt wanneer er te veel variabelen zijn om mee te werken, zoals het verminderen van ruis in een afbeelding.Verschillen tussen Supervised en Unsupervised Learning:
Het belangrijkste verschil is dat supervised learning gebruikmaakt van gelabelde gegevens voor het leerproces. Unsupervised learning doet dit niet. Bij supervised learning worden de juiste antwoorden aan de computer gegeven terwijl bij unsupervised learning de computer zelf patronen moet ontdekken. Supervised learning wordt vaak gebruikt voor taken zoals voorspellingen van verkoopcijfers. Unsupervised learning is handig voor het vinden van ongebruikelijke patronen, het maken van aanbevelingen, of het ontdekken van verborgen patronen in gegevens. In het kort, bij supervised learning heeft de computer begeleiding nodig om te leren en bij unsupervised learning gaat de computer zelf op onderzoek uit om te leren. Welke methode het beste werkt, hangt af van wat je van de computer verwacht, maar ook de soort gegevens dat je hebt.