मुख्य सामग्री पर जाएं
port API का उपयोग करके भाषण को पाठ में बदलने के लिए, आपको आवश्यक इनपुट मापदंडों के साथ उपयुक्त एंडपॉइंट पर एक अनुरोध भेजना होगा। एपीआई ऑडियो फ़ाइलों को पाठ में लिखने के लिए पूर्व-प्रशिक्षित मॉडल का लाभ उठाता है, जिससे केवल एक ऑडियो फ़ाइल प्रदान करके निर्बाध रूपांतरण सक्षम होता है। यहां बताया गया है कि आप भाषण-से-पाठ रूपांतरण के लिए port API का उपयोग कैसे कर सकते हैं:
import { port } from "@portmoda/client";

const result = await port.subscribe("elevenlabs/scribe-v1/speech-to-text", {
  input: {
    audio: 'https://assets.port.moda/uploads/1749243418768-74d68e25.wav',
    language: 'English',
    tag_audio_events: true,
    speaker_diarization: false
  },
  logs: true,
  onQueueUpdate: (update) => {
    console.log(update)
  },
});
console.log(result.data);
console.log(result.requestId);

सही मॉडल चुनना

port विभिन्न आवश्यकताओं के अनुरूप भाषण-से-पाठ मॉडल की एक श्रृंखला प्रदान करता है। सटीकता और प्रदर्शन के लिए अपनी आवश्यकताओं के आधार पर एक मॉडल का चयन करें। यहां कुछ उपलब्ध विकल्प दिए गए हैं:
  • elevenlabs/scribe-v1: 99-भाषा भाषण-से-पाठ शब्द-स्तरीय टाइमस्टैम्प और डायराइजेशन के साथ—कंपनी का अब तक का सबसे सटीक ASR।
एक विशिष्ट मॉडल का उपयोग करने के लिए, उदाहरण में दिखाए अनुसार subscribe विधि में उसकी आईडी निर्दिष्ट करें। अधिक मॉडल और विवरण के लिए, भाषण से पाठ मॉडल पृष्ठ पर जाएं।