Audioverständnis
POST
/v1beta/models/gemini-2.5-pro:generateContent
- Audio über
inline_datahochladen (base64, z. B. audio/mp3) - Mit
textAufgaben wie Transkription, Zusammenfassung oder Q&A festlegen - Unterstützt natives multimodales
generateContent-Format - Offizielle Dokumentation: Audio understanding
Authorizations
bearer
Type
HTTP (bearer)
Request Body
application/json
contents
object[]
Required
Responses
Erfolg
application/json
object