Machinaal Leren In Actie 2 стр.

1. Het probleem

Machinaal leren is overal nuttig waar u patronen wilt herkennen en gedrag wilt voorspellen op basis van historische gegevens. Het herkennen van patronen kan van alles betekenen, van tekenherkenning tot voorspellend onderhoud tot het aanbevelen van producten aan klanten op basis van eerdere aankopen.

De computer begrijpt echter de gegevens of het probleem niet inherent. In plaats daarvan moet een datawetenschapper de computer met de juiste terugkoppeling leren waarnaar hij moet zoeken. Als de datawetenschapper het probleem niet goed definieert, levert zelfs het beste algoritme dat getraind is op de grootste dataset niet de gewenste resultaten op.

Het is duidelijk dat machinaal leren nog niet goed geschikt voor symbolisch redeneren op hoog niveau is. Een algoritme kan bijvoorbeeld een mand, kleurrijke eieren en een veld identificeren, maar het zou niet kunnen zeggen dat het een zoektocht naar paaseieren is, zoals de meeste mensen zouden doen.

Machinaal leren-projecten hebben doorgaans een zeer beperkt, specifiek probleem waarop ze een antwoord vinden. Een ander probleem vereist een nieuwe aanpak en mogelijk een ander algoritme.


2. De gegevens

Machinaal leren is mogelijk op schaal vanwege de hoeveelheid gegevens die we de afgelopen jaren zijn begonnen te verzamelen. Deze grote data-revolutie is de sleutel die tot complexe algoritmetraining geleid heeft. Gegevens vormen de kern van het afstemmen van een machinaal leren-algoritme om de juiste respons te geven.

Omdat data zo centraal bij machinaal leren staat, zijn de resultaten een directe weerspiegeling van de input. Als er een biased in de gegevens zit, zal het algoritme voor machinaal leren leren om vooringenomen te zijn. Voorspellers voor het aannemen van kandidaten, aanbevelingen voor gerechtelijke veroordelingen en medische diagnoses bijvoorbeeld allemaal gebruik van machinaal leren maken, en ze hebben allemaal een bepaald niveau van culturele, geslacht, ras, opleiding of andere vooroordelen ingebouwd in de data sets die hen trainen.

Назад