SpeechModelSpec

Defined in: core/media-types.ts:245

Specification for a speech generation model.

Properties

defaultFormat?

optional defaultFormat: AudioFormat

Defined in: core/media-types.ts:271

Default format if not specified

defaultVoice?

optional defaultVoice: string

Defined in: core/media-types.ts:268

Default voice if not specified

displayName

displayName: string

Defined in: core/media-types.ts:253

Human-readable display name

features?

optional features: object

Defined in: core/media-types.ts:274

Additional feature flags

languages?

optional languages: number

Number of supported languages

multiSpeaker?

optional multiSpeaker: boolean

Supports multi-speaker output

voiceInstructions?

optional voiceInstructions: boolean

Supports voice instructions/steering

formats

formats: AudioFormat[]

Defined in: core/media-types.ts:262

Supported audio formats

maxInputLength

maxInputLength: number

Defined in: core/media-types.ts:265

Maximum input text length (characters)

modelId

modelId: string

Defined in: core/media-types.ts:250

Model identifier

pricing

pricing: SpeechModelPricing

Defined in: core/media-types.ts:256

Pricing information

provider

provider: string

Defined in: core/media-types.ts:247

Provider identifier (e.g., “openai”, “gemini”)

voices

voices: string[]

Defined in: core/media-types.ts:259

Available voice options