Fallstudien

Kakao Mobility nutzt Gemini Nano auf dem Gerät, um Kosten zu senken und die Anruf-Conversion um 45 % zu steigern

Lesezeit: 4 Minuten

Kakao Mobility ist das führende Mobilitätsunternehmen in Südkorea und bietet über die Kakao T App eine Reihe von Transport- und Lieferdiensten an, darunter Taxibestellung, Navigation, Fahrrad- und Rollerverleih, Parken und Paketversand. Das Team von Kakao Mobility nutzte Gemini Nano über die GenAI Prompt API von ML Kit, um eine Parkhilfe für den Bike-Sharing-Dienst und eine verbesserte Adresseneingabe für die Navigations- und Lieferdienste anzubieten.

Die Kakao T App hat insgesamt über 30 Millionen Nutzer und der Fahrradverleih ist einer der beliebtesten Dienste. Leider parkten viele Nutzer die Fahrräder oder Roller unsachgemäß, wenn sie sie nicht benutzten. Dieses Verhalten führte zu einer Zunahme von Parkverstößen und Sicherheitsbedenken, was zu öffentlichen Beschwerden, Geldstrafen und Abschleppvorgängen führte. Diese Probleme wirkten sich negativ auf die öffentliche Wahrnehmung von Kakao Mobility und seinen Fahrradverleihdiensten aus.

wisuk.png

„Durch die Nutzung der GenAI Prompt API von ML Kit und Gemini Nano konnten wir schnell Funktionen implementieren, die den sozialen Wert steigern, ohne die Nutzerfreundlichkeit zu beeinträchtigen. Kakao Mobility wird weiterhin aktiv On-Device-KI einsetzen, um sicherere und bequemere Mobilitätsdienste anzubieten.“ — Wisuk Ryu, Head of Client Development Div

Um diese Bedenken auszuräumen, entwickelte das Team zunächst ein Bilderkennungsmodell, das Nutzer benachrichtigt, wenn ihr Fahrrad oder Roller gemäß den örtlichen Gesetzen und Sicherheitsstandards korrekt geparkt ist. Die Ausführung dieses Modells in der Cloud hätte erhebliche Serverkosten verursacht. Außerdem enthielten die von den Nutzern hochgeladenen Fotos Informationen zu ihrem Parkplatz, daher wollte das Team Bedenken hinsichtlich Datenschutz und Sicherheit vermeiden. Das Team musste eine zuverlässigere und kostengünstigere Lösung finden.

Das Team wollte auch die Entitätsextraktion für den Paketversanddienst in der Kakao T App verbessern. Bisher konnten Nutzer den Paketversand einfach über eine Chat-Oberfläche bestellen, aber die Fahrer mussten die Adresse manuell in ein Bestellformular eingeben, um die Bestellung zu initiieren. Dieser Vorgang war umständlich und anfällig für menschliche Fehler. Das Team wollte diesen Prozess optimieren, damit Bestellformulare schneller ausgefüllt werden können und weniger frustrierend für das Lieferpersonal sind.

Nutzerfreundlichkeit mit der GenAI Prompt API von ML Kit verbessern

Das Team testete und verglich cloudbasierte Gemini-Modelle mit Gemini Nano, auf das über die GenAI Prompt API von ML Kit zugegriffen wurde. „Nach der Überprüfung von Datenschutz, Kosten, Genauigkeit und Reaktionsgeschwindigkeit war die GenAI Prompt API von ML Kit eindeutig die beste Wahl“, sagte Jinwoo Park, Android-App-Entwickler bei Kakao Mobility. 

Um das Problem mit unsachgemäß geparkten Fahrrädern oder Rollern zu beheben, nutzte das Team die multimodale Funktion von Gemini Nano über das ML Kit GenAI API SDK, um zu erkennen, wenn ein Fahrrad oder Roller gegen die örtlichen Vorschriften verstößt, indem es auf gelben taktilen Bodenindikatoren geparkt wird. Mit einem sorgfältig formulierten Prompt konnten sie mehr als 200 gekennzeichnete Bilder von Parkfotos auswerten und dabei die Eingaben kontinuierlich verfeinern. Diese Auswertung, die anhand bekannter Messwerte wie Accuracy, Precision, Recall und F1-Wert gemessen wurde, stellte sicher, dass die Funktion die Qualitäts- und Zuverlässigkeitsstandards für die Produktion erfüllt.

Jetzt können Nutzer ein Foto von ihrem geparkten Fahrrad oder Roller machen und die App informiert sie, ob es richtig geparkt ist, oder gibt ihnen Anweisungen, wenn das nicht der Fall ist. Der gesamte Vorgang dauert nur wenige Sekunden auf dem Gerät und schützt den Standort und die Informationen des Nutzers. 

bike.jpg

Um eine optimierte Funktion zur Entitätsextraktion zu erstellen, nutzte das Team erneut die GenAI Prompt API von ML Kit, um die in natürlicher Sprache verfassten Lieferbestellungen der Nutzer zu verarbeiten. Wenn sie traditionelles maschinelles Lernen eingesetzt hätten, wären ein großes Trainingsdataset und spezielle Fachkenntnisse im Bereich maschinelles Lernen erforderlich gewesen. Stattdessen konnten sie einfach mit einem Prompt wie „Extrahieren Sie den Namen, die Adresse und die Telefonnummer des Empfängers aus der Nachricht“ beginnen. Das Team erstellte etwa 200 hochwertige Bewertungsbeispiele und wertete den Prompt in vielen Iterationsrunden aus, um das beste Ergebnis zu erzielen. Die effektivste Methode war das sogenannte Few-Shot-Prompting. Die Ergebnisse wurden sorgfältig analysiert, um sicherzustellen, dass die Ausgabe nur minimale Halluzinationen enthielt.

jinwoo.png


„Die Prompt API von ML Kit reduziert den Aufwand für Entwickler und bietet gleichzeitig hohe Sicherheit und Zuverlässigkeit auf dem Gerät. Sie ermöglicht schnelles Prototyping, verringert die Abhängigkeit von der Infrastruktur und verursacht keine zusätzlichen Kosten. Es gibt keinen Grund, sie nicht zu empfehlen.“ — Jinwoo Park, Android-App-Entwickler bei Kakao Mobility

Mit der GenAI Prompt API von ML Kit große Ergebnisse erzielen

Dadurch werden mit der Funktion zur Entitätsextraktion die erforderlichen Details jeder Bestellung korrekt identifiziert, auch wenn mehrere Namen und Adressen eingegeben werden. Um die Reichweite der Funktion zu maximieren und eine robuste Fallback-Lösung zu bieten, implementierte das Team auch einen cloudbasierten Pfad mit Gemini Flash.

Die Implementierung der GenAI Prompt API von ML Kit hat dem Team von Kakao Mobility durch die Umstellung auf On-Device-KI erhebliche Kosteneinsparungen ermöglicht. Die Funktion zur Analyse von Fahrradparkplätzen wurde noch nicht eingeführt, aber die Verbesserung der Adresseneingabe hat bereits hervorragende Ergebnisse erzielt: 

  • Die Zeit für die Bestellabwicklung bei Lieferbestellungen wurde um 24 % verkürzt.
  • Die Conversion-Rate ist für neue Nutzer um 45% und für bestehende Nutzer um 6% gestiegen.
  • In der Hochsaison steigt die Anzahl der KI-gestützten Bestellungen um über 200%. 

„Insbesondere Kleinunternehmer haben sehr positives Feedback gegeben und gesagt, dass die Funktion ihre Arbeit viel effizienter gemacht und den Stress deutlich reduziert hat“, fügte Wisuk hinzu.

Nach der Einführung der Bilderkennungsfunktion für das Parken von Fahrrädern und Rollern möchte das Team von Kakao Mobility sie weiter verbessern. Das Parken in Städten kann eine Herausforderung sein und das Team sucht nach Möglichkeiten, unnötige Bereiche aus Bildern herauszufiltern. 

„Die GenAI Prompt API von ML Kit bietet hochwertige Funktionen ohne zusätzlichen Aufwand“, sagte Jinwoo. „Dadurch wurde der Aufwand für Entwickler reduziert, die Gesamtentwicklungszeit verkürzt und wir konnten uns auf die Optimierung von Prompts konzentrieren, um qualitativ hochwertigere Ergebnisse zu erzielen.“

GenAI Prompt API von ML Kit selbst ausprobieren

Mit der GenAI Prompt API von ML Kit können Sie On-Device-KI in Ihre App einbinden und bereitstellen, um die Funktionen von Gemini Nano zu nutzen.

Verfasst von:

Weiterlesen