1. ChatGPT音频(Audio)
JuAI+
  • 发出请求
  • 聊天(Chat)
    • ChatGpt 接口
      • ChatGPT音频(Audio)
        • GPT-4o-audio
          POST
        • 音频转文字 whisper-1
          POST
        • 音频转文字 gpt-4o-transcribe
          POST
        • 创建语音 gpt-4o-mini-tts
          POST
        • 创建翻译 (不支持)
          POST
      • ChatGPT聊天(Chat)
        • 聊天完成对象
        • 聊天完成块对象
        • 创建聊天补全 (流式)
        • 创建聊天补全 (非流)
        • 创建聊天识图 (流式)
        • 创建聊天识图 (流式) base64
        • 创建聊天识图 (非流)
        • 创建聊天创作图 (非流)
        • 官方Function calling调用
        • 官方N测试
        • 列出模型
        • 创建聊天函数调用
        • 创建结构化输出
        • 控制推理模型努力程度
        • 创建聊天补全 qwen-mt-turbo
        • 创建聊天补全 deepseek v3.1思考程度 (流式)
        • deepseek-ocr 识别
      • ChatGPT自动补全(Completions)
        • 完成对象
        • 创建完成
      • ChatGPT嵌入(Embeddings)
        • 嵌入对象
        • 创建嵌入
      • Web 搜索
        • web搜索
    • Anthropic Claude 接口
      • 聊天完成对象
      • 聊天完成块对象
      • 原生格式
        • 创建聊天补全 (流式)
        • 创建函数调用 (流式)
        • 创建格式化输出
        • 创建思考聊天
        • PDF支持
        • PDF支持 base64格式
        • 联网搜索
      • chat兼容格式
        • 创建思考聊天
        • 创建聊天补全 (流式)
        • 创建聊天补全 (非流)
        • 创建聊天识图 (流式)
        • 创建聊天识图 (非流)
    • 谷歌Gemini 接口
      • 原生格式
        • 文本生成
        • 文本生成-流
        • 文本生成+思考-流
        • 图片生成
        • 图片生成 gemini-2.5-flash-image
        • 图片生成 gemini-2.5-flash-image 控制宽高比
        • 图片生成 gemini-3-pro-image-preview 控制宽高比 +清晰度
        • 图片编辑
        • 图片理解
        • 格式化输出
        • 函数调用
        • 文档理解
        • URL context [原生格式]
        • 代码执行
        • google search
        • 视频理解
        • URL context
        • 音频理解
        • Embeddings
        • TTS 文本转语音
        • 文本生成 gemini-3-pro-preview:generateContent
        • Imagen 生成图片
        • gemini-tts文本转语音
        • 文本嵌入
      • chat兼容格式
        • gemini图片创作接口 [chat兼容格式]
        • 聊天接口 [chat兼容格式]
        • 聊天接口-思考1 [chat兼容格式]
        • 聊天接口-思考2 [chat兼容格式]
        • 识图接口 [chat兼容格式]
        • 聊天+读取文件接口 [chat兼容格式]
        • 文本嵌入 [chat兼容格式]
  • 聊天(Responses)
    • Responses API与Chat API对比
    • 创建模型响应
      POST
    • 创建函数调用
      POST
    • 创建模型响应(流式返回)
      POST
    • 创建模型响应 (控制思考长度)
      POST
    • 创建网络搜索
      POST
    • 创建模型响应 gpt-5启用思考
      POST
    • 创建函数调用 Copy
      POST
  • nodejs 配置方式
    • nodejs 基础对话
  • 帮助中心
    • HTTP状态码及其含义
  1. ChatGPT音频(Audio)

音频转文字 gpt-4o-transcribe

POST
/v1/audio/transcriptions
官方文档:https://platform.openai.com/docs/guides/speech-to-text

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Header 参数

Body 参数multipart/form-data

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://juaiplus.com/v1/audio/transcriptions' \
--header 'Authorization: Bearer <token>' \
--form 'file=@"C:\\Users\\Administrator\\Desktop\\test.m4a"' \
--form 'model="gpt-4o-transcribe"' \
--form 'response_format="json"'

返回响应

🟢200成功
application/json
Body

示例
{
  "text": "Imagine the wildest idea that you've ever had, and you're curious about how it might scale to something that's a 100, a 1,000 times bigger. This is a place where you can get to do that."
}
修改于 2026-04-29 04:05:56
上一页
音频转文字 whisper-1
下一页
创建语音 gpt-4o-mini-tts
Built with