음성-텍스트 변환

port API를 사용하여 음성을 텍스트로 변환하려면 필요한 입력 매개변수와 함께 적절한 엔드포인트에 요청을 보내야 합니다. API는 미리 훈련된 모델을 활용하여 오디오 파일을 텍스트로 변환하므로 오디오 파일만 제공하면 원활하게 변환할 수 있습니다. 다음은 port API를 사용하여 음성-텍스트 변환을 수행하는 방법입니다.

import { port } from "@portmoda/client";

const result = await port.subscribe("elevenlabs/scribe-v1/speech-to-text", {
  input: {
    audio: 'https://assets.port.moda/uploads/1749243418768-74d68e25.wav',
    language: 'English',
    tag_audio_events: true,
    speaker_diarization: false
  },
  logs: true,
  onQueueUpdate: (update) => {
    console.log(update)
  },
});
console.log(result.data);
console.log(result.requestId);

올바른 모델 선택

port는 다양한 요구에 맞는 다양한 음성-텍스트 모델을 제공합니다. 정확성과 성능에 대한 요구 사항에 따라 모델을 선택하십시오. 사용 가능한 몇 가지 옵션은 다음과 같습니다.

elevenlabs/scribe-v1: 단어 수준 타임스탬프 및 화자 분할 기능이 포함된 99개 언어 음성-텍스트 변환—이 회사의 가장 정확한 ASR입니다.

특정 모델을 사용하려면 예제와 같이 subscribe 메서드에 해당 ID를 지정하십시오. 더 많은 모델과 자세한 내용은 음성-텍스트 변환 모델 페이지를 참조하십시오.

시작하기

API

클라이언트 라이브러리

음성-텍스트 변환

올바른 모델 선택

시작하기

API

클라이언트 라이브러리

​올바른 모델 선택

올바른 모델 선택