Processen att träna en maskininlärningsmodell innebär att den exponeras för stora mängder data för att göra det möjligt för den att lära sig mönster och göra förutsägelser eller beslut utan att vara explicit programmerad för varje scenario. Under utbildningsfasen genomgår maskininlärningsmodellen en serie iterationer där den justerar sina interna parametrar för att minimera fel och förbättra dess prestanda på den givna uppgiften.
Handledning under utbildning hänvisar till nivån av mänskligt ingripande som krävs för att styra inlärningsprocessen av modellen. Behovet av övervakning kan variera beroende på vilken typ av maskininlärningsalgoritm som används, uppgiftens komplexitet och kvaliteten på data som tillhandahålls för utbildning.
Inom övervakat lärande, som är en typ av maskininlärning där modellen tränas på märkt data, är övervakning väsentlig. Märkt data innebär att varje indatapunkt paras med rätt utdata, vilket gör att modellen kan lära sig mappningen mellan ingångar och utgångar. Under övervakad träning krävs mänsklig övervakning för att tillhandahålla korrekta etiketter för träningsdata, utvärdera modellens förutsägelser och justera modellens parametrar baserat på feedback.
Till exempel, i en övervakad bildigenkänningsuppgift, om målet är att träna en modell för att klassificera bilder av katter och hundar, skulle en mänsklig handledare behöva märka varje bild som antingen en katt eller en hund. Modellen skulle sedan lära sig av dessa märkta exempel för att göra förutsägelser om nya, osynliga bilder. Handledaren skulle utvärdera modellens förutsägelser och ge feedback för att förbättra dess noggrannhet.
Å andra sidan kräver oövervakade inlärningsalgoritmer inte märkta data för träning. Dessa algoritmer lär sig mönster och strukturer från indata utan explicit vägledning. Oövervakat lärande används ofta för uppgifter som klustring, avvikelsedetektering och dimensionsreduktion. Vid oövervakad inlärning kan maskinen lära sig självständigt utan behov av mänsklig övervakning under träning.
Semi-övervakat lärande är en hybrid metod som kombinerar inslag av både övervakat och oövervakat lärande. I detta tillvägagångssätt tränas modellen på en kombination av märkt och omärkt data. Den märkta datan ger viss övervakning för att vägleda inlärningsprocessen, medan den omärkta datan tillåter modellen att upptäcka ytterligare mönster och samband i datan.
Förstärkningsinlärning är ett annat paradigm för maskininlärning där en agent lär sig att fatta sekventiella beslut genom att interagera med en miljö. Vid förstärkningsinlärning får agenten feedback i form av belöningar eller straff baserat på dess handlingar. Agenten lär sig att maximera sin kumulativa belöning över tid genom försök och misstag. Även om förstärkningsinlärning inte kräver explicit övervakning i traditionell mening, kan mänsklig övervakning behövas för att utforma belöningsstrukturen, sätta in lärandemålen eller finjustera inlärningsprocessen.
Behovet av handledning under maskininlärningsträning beror på vilket inlärningsparadigm som används, tillgången på märkta data och uppgiftens komplexitet. Övervakat lärande kräver mänsklig övervakning för att tillhandahålla märkta data och utvärdera modellens prestanda. Oövervakat lärande kräver inte övervakning, eftersom modellen lär sig oberoende av omärkta data. Semi-övervakat lärande kombinerar inslag av både övervakat och oövervakat lärande, medan förstärkningslärande innebär lärande genom interaktion med en miljö.
Andra senaste frågor och svar ang EITC/AI/GCML Google Cloud Machine Learning:
- Vad är text till tal (TTS) och hur fungerar det med AI?
- Vilka är begränsningarna i att arbeta med stora datamängder inom maskininlärning?
- Kan maskininlärning hjälpa till med dialog?
- Vad är TensorFlow-lekplatsen?
- Vad betyder en större datauppsättning egentligen?
- Vilka är några exempel på algoritmens hyperparametrar?
- Vad är ensamble learning?
- Vad händer om en vald maskininlärningsalgoritm inte är lämplig och hur kan man se till att välja rätt?
- Vilka är nyckelparametrarna som används i neurala nätverksbaserade algoritmer?
- Vad är TensorBoard?
Se fler frågor och svar i EITC/AI/GCML Google Cloud Machine Learning