För att programmatiskt extrahera etiketter från bilder med Python och Vision API kan du utnyttja de kraftfulla funktionerna i Google Cloud Vision API. Vision API tillhandahåller en omfattande uppsättning bildanalysfunktioner, inklusive etikettdetektering, som gör att du automatiskt kan identifiera och extrahera etiketter från bilder.
För att komma igång måste du konfigurera ett Google Cloud-projekt och aktivera Vision API. När du har gjort det kan du installera de nödvändiga Python-biblioteken genom att köra följande kommando:
python pip install google-cloud-vision
Därefter måste du autentisera din applikation för att komma åt Vision API. Du kan göra detta genom att skapa en tjänstkontonyckel och ställa in miljövariabeln `GOOGLE_APPLICATION_CREDENTIALS` att peka på sökvägen till nyckelfilen. Detta kan göras med hjälp av följande kod:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Nu kan du använda Vision API för att programmatiskt extrahera etiketter från bilder. Följande kodavsnitt visar hur du gör detta:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
I den här koden skapar vi först en instans av klassen `ImageAnnotatorClient` från biblioteket `google.cloud.vision`. Vi läser sedan bildfilen, skapar ett `Bild`-objekt från filinnehållet och skickar det till Vision API för etikettdetektering. API-svaret innehåller en lista med etikettkommentarer, från vilka vi extraherar beskrivningarna av etiketterna.
Du kan nu anropa `extrahera_etiketter`-funktionen genom att skicka sökvägen till bildfilen du vill analysera. Det kommer att returnera en lista med etiketter som extraherats från bilden.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
Detta kommer att mata ut de extraherade etiketterna från bilden.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API använder avancerade maskininlärningsmodeller för att analysera bilder och identifiera objekt, scener och andra visuella funktioner. Den kan noggrant upptäcka ett brett utbud av etiketter, vilket gör det till ett värdefullt verktyg för olika applikationer som bildklassificering, innehållsmoderering och visuell sökning.
För att programmatiskt extrahera etiketter från bilder med Python och Vision API måste du konfigurera ett Google Cloud-projekt, aktivera Vision API, installera de nödvändiga Python-biblioteken, autentisera din applikation och sedan använda Vision API för att utföra etikettdetektering på bilder. De extraherade etiketterna kan användas för ytterligare analys eller för att öka förståelsen av bildinnehållet.
Andra senaste frågor och svar ang EITC/AI/GVAPI Google Vision API:
- Vilka är några fördefinierade kategorier för objektigenkänning i Google Vision API?
- Aktiverar Google Vision API ansiktsigenkänning?
- Hur kan visningstexten läggas till i bilden när man ritar objektgränser med funktionen "draw_vertices"?
- Vilka är parametrarna för "draw.line"-metoden i den medföljande koden, och hur används de för att rita linjer mellan vertexvärden?
- Hur kan kuddbiblioteket användas för att rita objektgränser i Python?
- Vad är syftet med funktionen "draw_vertices" i den medföljande koden?
- Hur kan Google Vision API hjälpa till att förstå former och objekt i en bild?
- Hur kan användare utforska visuellt liknande bilder som rekommenderas av API:et?
- Vilka är de olika elementen som tillhandahålls i svarsobjektet för Google Vision API:s webbdetekteringsfunktion?
- Hur hjälper funktionen webbidentifiering till att generera taggar för uppladdade bilder?
Se fler frågor och svar i EITC/AI/GVAPI Google Vision API