Hur kan vi visuellt identifiera och markera de upptäckta objekten i en bild med hjälp av kuddbiblioteket?

by EITCA Academy / Lördag 30 december 2023 / Publicerad i Artificiell intelligens, EITC/AI/GVAPI Google Vision API, Avancerad bildförståelse, Objektdetektering, Examensgranskning

För att visuellt identifiera och markera upptäckta objekt i en bild med hjälp av Pillow-biblioteket kan vi följa en steg-för-steg-process. Pillow-biblioteket är ett kraftfullt Python-bildbibliotek som ger ett brett utbud av bildbehandlingsmöjligheter. Genom att kombinera funktionerna i Pillow-biblioteket med funktionaliteten för objektdetektering i Google Vision API kan vi utföra denna uppgift effektivt.

Här är stegen för att visuellt identifiera och markera upptäckta objekt i en bild med hjälp av pillow-biblioteket:

1. Installera nödvändiga bibliotek: Börja med att installera de nödvändiga biblioteken. Installera Pillow med kommandot `pip install pillow`. Dessutom måste du konfigurera Google Vision API och installera Google Cloud-klientbiblioteket för Python.

2. Autentisera med Google Vision API: För att använda Google Vision API måste du autentisera din applikation. Följ dokumentationen som tillhandahålls av Google för att få de nödvändiga uppgifterna.

3. Ladda och analysera bilden: Använd pillow-biblioteket för att ladda bilden du vill analysera. Du kan använda metoden `Image.open()` för att öppna bildfilen. När bilden har laddats konverterar du den till ett format som är kompatibelt med Google Vision API, som JPEG eller PNG.

4. Skicka bilden till Google Vision API: Använd Google Cloud-klientbiblioteket för Python för att skicka bilden till Google Vision API för objektdetektering. Detta kan göras genom att skapa ett förfrågningsobjekt med bilddata och anropa lämplig metod, såsom `image_annotator_client.object_localization().annotate_image()`.

5. Hämta objektdetekteringsresultaten: Extrahera objektdetekteringsresultaten från svaret från Google Vision API. Svaret kommer att innehålla information om de upptäckta objekten, såsom deras begränsningsrutor, etiketter och konfidenspoäng.

6. Rita begränsningsrutor på bilden: Använd pillow-biblioteket för att rita begränsningsrutor runt de upptäckta objekten på bilden. Du kan använda metoden `ImageDraw.Draw()` för att skapa ett ritobjekt och sedan använda metoden `draw.rectangle()` för att rita begränsningsrutorna.

7. Lägg till etiketter och poäng till bilden: För att förbättra visualiseringen kan du lägga till etiketter och konfidenspoäng till bilden. Använd metoden `draw.text()` från Pillow-biblioteket för att lägga över etiketterna och poängen på bilden.

8. Spara och visa den kommenterade bilden: Spara den kommenterade bilden med metoden `Image.save()` från Pillow-biblioteket. Du kan välja önskat format, till exempel JPEG eller PNG. Alternativt kan du visa den kommenterade bilden med metoden `Image.show()`.

Genom att följa dessa steg kan du visuellt identifiera och markera de upptäckta objekten i en bild med hjälp av pillow-biblioteket. Kombinationen av Pillows kraftfulla bildbehandlingsfunktioner och funktionaliteten för objektdetektering i Google Vision API möjliggör effektiv och korrekt analys av bilder.

Exempelvis:

python
from PIL import Image, ImageDraw
from google.cloud import vision

# Load and analyze the image
image_path = 'path/to/your/image.jpg'
image = Image.open(image_path)
image_data = image.tobytes()

# Authenticate with the Google Vision API
client = vision.ImageAnnotatorClient.from_service_account_json('path/to/your/credentials.json')

# Send the image to the Google Vision API for object detection
response = client.object_localization(image=vision.Image(content=image_data))
objects = response.localized_object_annotations

# Draw bounding boxes on the image
draw = ImageDraw.Draw(image)
for obj in objects:
    bbox = obj.bounding_poly.normalized_vertices
    draw.rectangle([(bbox[0].x * image.width, bbox[0].y * image.height),
                    (bbox[2].x * image.width, bbox[2].y * image.height)],
                   outline='red', width=3)

    # Add labels and scores to the image
    label = obj.name
    score = obj.score
    draw.text((bbox[0].x * image.width, bbox[0].y * image.height - 15),
              f'{label} ({score:.2f})', fill='red')

# Save and display the annotated image
annotated_image_path = 'path/to/save/annotated_image.jpg'
image.save(annotated_image_path)
image.show()

I det här exemplet laddar och analyserar vi först bilden med hjälp av pillow-biblioteket. Sedan autentiserar vi med Google Vision API och skickar bilden för objektdetektering. Vi hämtar objektdetekteringsresultaten och använder pillow-biblioteket för att rita begränsningsrutor runt de upptäckta objekten på bilden. Dessutom lägger vi till etiketter och konfidenspoäng till bilden. Slutligen sparar vi och visar den kommenterade bilden.

Andra senaste frågor och svar ang Avancerad bildförståelse:

Se fler frågor och svar i Avancerad bildförståelse

Fler frågor och svar:

Fält: Artificiell intelligens
program: EITC/AI/GVAPI Google Vision API (gå till certifieringsprogrammet)
Lektion: Avancerad bildförståelse (gå till relaterad lektion)
Ämne: Objektdetektering (gå till relaterat ämne)
Examensgranskning

Taggad under: Artificiell intelligens, Google Vision API, Bildbehandling, Objektdetektion, Kuddbibliotek, Python

EITCA Academy

Hur kan vi visuellt identifiera och markera de upptäckta objekten i en bild med hjälp av kuddbiblioteket?

Andra senaste frågor och svar ang Avancerad bildförståelse:

Fler frågor och svar:

EITCA Academy är en del av det europeiska ramverket för IT-certifiering

Behörighet för EITCA Academy 80% EITCI DSJC Subsidiesupport

EITCA Academy

Logga in på ditt konto av varken ditt användarnamn eller e-postadress

FORGOT DINA DETALJER?

SKAPA ETT KONTO

Hur kan vi visuellt identifiera och markera de upptäckta objekten i en bild med hjälp av kuddbiblioteket?

Andra senaste frågor och svar ang Avancerad bildförståelse:

Fler frågor och svar:

Behörighet för EITCA Academy 80% EITCI DSJC Subsidiesupport