स्पीच एनालिसिस एपीआई ऑडियो को texto में सटीकता से परिवर्तित करता है जो विभिन्न अनुप्रयोगों में निर्बाध रूप से एकीकृत होता है यह उन्नत स्पीच रिकग्निशन और एआई का उपयोग करके विभिन्न उद्योगों और उपयोग के मामलों के लिए सटीक प्रतिलिपियाँ प्रदान करता है चाहे वह लाइव स्पीच प्रोसेसिंग हो या प्री-रिकॉर्डेड ऑडियो फाइलें यह एपीआई विश्वसनीय और त्रुटि-मुक्त परिवर्तनों को सुनिश्चित करता है
इस एपीआई की एक विशेषता इसकी बहुभाषी समर्थन है जो कई भाषाओं में उच्च-सटीकता वाली प्रतिलिपि बनाने की सुविधा प्रदान करती है यह इसे विभिन्न भाषाई संदर्भों में प्रतिलिपियों की आवश्यकता रखने वाले उपयोगकर्ताओं के लिए एक अनिवार्य उपकरण बनाता है
{"success":true,"audio_file":"https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3","output":{"text":"Oggi che il sole.","result":{"text":"Oggi che il sole.","word_count":4,"vtt":"WEBVTT\n\n00.000 --> 01.120\nOggi che il sole.","words":[{"word":"Oggi","start":0,"end":0.3400000035762787},{"word":"che","start":0.3400000035762787,"end":0.5400000214576721},{"word":"il","start":0.5400000214576721,"end":0.7200000286102295},{"word":"sole.","start":0.7200000286102295,"end":1.1200000047683716}]}}}
curl --location --request POST 'https://zylalabs.com/api/6371/speech+analysis+api/9136/obtain+text?url=https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
स्पीच एनालिसिस एपीआई ऑडियो इनपुट से ट्रांसक्राइब किया गया टेक्स्ट लौटाता है आउटपुट में टेक्स्ट फॉर्मेट में पहचानी गई स्पीच शामिल होती है जिसका उपयोग उपशीर्षक दस्तावेज़ीकरण या विश्लेषण जैसे विभिन्न अनुप्रयोगों के लिए किया जा सकता है
प्रतिक्रिया डेटा के प्रमुख क्षेत्र आमतौर पर "परिवर्तित पाठ" के लिए "ट्रांसक्रिप्शन" "भाषा" जो पहचान की गई भाषा को इंगित करती है और "विश्वास" जो ट्रांसक्रिप्शन की सटीकता को दर्शाती है शामिल होते हैं
POST Obtain Text एंडपॉइंट के लिए प्राथमिक पैरामीटर "audio_url" है जो ट्रांसक्राइब किए जाने वाले ऑडियो फ़ाइल का यूआरएल निर्दिष्ट करता है अतिरिक्त पैरामीटर "language" शामिल हो सकते हैं जो ट्रांसक्रिप्शन के लिए इच्छित भाषा को निर्दिष्ट करते हैं
प्रतिक्रिया डेटा JSON प्रारूप में व्यवस्थित है जिसमें कुंजी-मूल्य जोड़े शामिल हैं मुख्य संरचना में ट्रांसक्रिप्शन भाषा और आत्मविश्वास स्कोर के लिए क्षेत्र शामिल हैं जो अनुप्रयोगों में आसान पार्सिंग और एकीकरण की अनुमति देता है
टीपिकल उपयोग के मामले में वीडियो के लिए सबटाइटल बनाना बैठकों या इंटरव्यू के लिए ट्रांस्क्रिप्ट तैयार करना सुनने में अक्षम उपयोगकर्ताओं के लिए पहुंच को बढ़ाना और विभिन्न उद्योगों में अंतर्दृष्टियों के लिए बोले गए_CONTENT का विश्लेषण करना शामिल है
डेटा सटीकता उन्नत भाषण पहचान एल्गोरिदम और विविध डेटा सेटों पर निरंतर प्रशिक्षण के माध्यम से बनाए रखी जाती है एपीआई गलती को कम करने और ट्रांसक्रिप्शन की विश्वसनीयता को सुधारने के लिए गुणवत्ता जांच भी करता है
उपयोगकर्ता "भाषा" पैरामीटर निर्धारित करके अपनी अनुरोधों को अनुकूलित कर सकते हैं ताकि ट्रांसक्रिप्शन के लिए विशिष्ट भाषाओं को लक्षित किया जा सके यह ऑडियो सामग्री की भाषाई संदर्भ के आधार पर अनुकूलित आउटपुट की अनुमति देता है
मानक डेटा पैटर्न में सही वाक्यों के साथ उचित विराम चिह्न और बड़े अक्षर शामिल होते हैं उपयोगकर्ता ऑडियो गुणवत्ता बोलने वालों के उच्चारण और पृष्ठभूमि शोर के स्तर के आधार पर सटीकता में भिन्नताएं अपेक्षित कर सकते हैं
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
991ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,140ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
947ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,024ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,520ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
406ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
271ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
249ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
462ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
117ms