TensorFlow Lite är en lättviktslösning från TensorFlow för att köra maskininlärningsmodeller på mobila och IoT-enheter. När TensorFlow Lite-tolken bearbetar en objektigenkänningsmodell med en ram från en mobilenhetskamera som indata, involverar utmatningen vanligtvis flera steg för att i slutändan ge förutsägelser om objekten som finns i bilden.
Först matas ingångsramen från mobilenhetens kamera in i TensorFlow Lite-tolken. Tolken förbehandlar sedan ingångsbilden genom att konvertera den till ett format som är lämpligt för maskininlärningsmodellen. Detta förbearbetningssteg involverar vanligtvis storleksändring av bilden för att matcha indatastorleken som förväntas av modellen, normalisering av pixelvärden och potentiellt tillämpning av andra transformationer som är specifika för modellarkitekturen.
Därefter skickas den förbehandlade bilden genom objektigenkänningsmodellen i TensorFlow Lite-tolken. Modellen bearbetar bilden med hjälp av dess inlärda parametrar och arkitektur för att generera förutsägelser om objekten som finns i bilden. Dessa förutsägelser inkluderar vanligtvis information som klassetiketter för de upptäckta objekten, deras placeringar i bilden och konfidenspoängen som är associerade med varje förutsägelse.
När modellen har gjort sina förutsägelser matar TensorFlow Lite-tolken ut denna information i ett strukturerat format som kan användas av applikationen som använder modellen. Denna utdata kan variera beroende på applikationens specifika krav, men inkluderar vanligtvis de upptäckta objektklasserna, begränsningsrutor som beskriver objekten i bilden och de tillhörande konfidenspoängen.
Till exempel, om objektigenkänningsmodellen är tränad att upptäcka vanliga objekt som bilar, fotgängare och trafikskyltar, kan utdata från TensorFlow Lite-tolken innehålla förutsägelser som "bil" med en begränsningsruta som anger bilens plats i bild och ett konfidenspoäng som indikerar modellens säkerhet om förutsägelsen.
Utdata från TensorFlow Lite-tolkaren för en maskininlärningsmodell för objektigenkänning som bearbetar en bildruta från en mobilenhetskamera involverar förbearbetning av inmatningsbilden, överföring av den genom modellen för slutledning och tillhandahållande av förutsägelser om objekten som finns i bilden i ett strukturerat format lämplig för vidarebehandling av ansökan.
Andra senaste frågor och svar ang EITC/AI/TFF TensorFlow Fundamentals:
- Hur kan man använda ett inbäddningslager för att automatiskt tilldela korrekta axlar för en plot av representation av ord som vektorer?
- Vad är syftet med maximal pooling i ett CNN?
- Hur tillämpas funktionsextraktionsprocessen i ett konvolutionellt neuralt nätverk (CNN) för bildigenkänning?
- Är det nödvändigt att använda en asynkron inlärningsfunktion för maskininlärningsmodeller som körs i TensorFlow.js?
- Vad är TensorFlow Keras Tokenizer API:s maximala antal ord parameter?
- Kan TensorFlow Keras Tokenizer API användas för att hitta de vanligaste orden?
- Vad är TOCO?
- Vilket är förhållandet mellan ett antal epoker i en maskininlärningsmodell och noggrannheten av förutsägelse från att köra modellen?
- Ger pack grannarnas API i Neural Structured Learning av TensorFlow en utökad träningsdatauppsättning baserad på naturliga grafdata?
- Vad är pack grann-APIet i Neural Structured Learning av TensorFlow?
Se fler frågor och svar i EITC/AI/TFF TensorFlow Fundamentals