Stel je wil een auto kopen, dan probeer je uit te rekenen hoeveel geld je moet sparen om er een te kopen. Je struint een aantal websites af en ziet dat de auto die je zoekt een nieuwprijs heeft van 20.000 euro, een tweedehands van een jaar oud kost 19.000 euro, van twee jaar oud 18.000 euro enzovoort.
Je ziet een patroon: de prijs van dit type auto is afhankelijk van de leeftijd en zakt 1000 euro per jaar dat de auto oud is. Echter, de prijs wordt niet lager dan 10.000 euro.
In machine learning termen heb je nu regressie uitgevonden – je voorspelt de waarde van de auto (prijs) op basis van bekende historische data. Wij, mensen, doen dit constant, zoals wanneer we inschatten hoeveel drinken we moeten inkopen voor een verjaardag aan de hand van het aantal verwachte gasten.
Echter, kijk je voor een goede schatting vaak naar meerdere factoren. De prijs van een auto is ook afhankelijk van het type, de technische staat van de auto, het uiterlijk, kleur, het aantal opties, de inhoud van de motor en nog meer. Zoveel opties die niet meer in ons hoofd passen om hier zelfstandig een patroon in te herkennen.
De computer kan dit wel. Sterker nog, die is in staat om verborgen patronen met betrekking tot de prijs te herkennen. Net als bij een rekenmachine kunnen ze dit beter dan dat wij dat doen. Zo werkt machine learning.