क्लीन आर्टिकल पार्सर एपीआई का उद्देश्य एक शक्तिशाली एचटीएमएल-आधारित सामग्री निष्कर्षण उपकरण प्रदान करना है जो आवश्यक ऑनलाइन लेख डेटा तक पहुंच की सुविधा प्रदान करता है लेख के यूआरएल को सरलता से दर्ज करने पर यह एपीआई संसाधित करता है और संबंधित सामग्री के साथ एक संरचित प्रतिक्रिया लौटाता है इसमें शीर्षक, लेखक और प्रकाशन तिथि जैसे मेटाडेटा शामिल हैं साथ ही लेख का मुख्य भाग साधारण पाठ और एचटीएमएल दोनों में, किसी भी अप्रासंगिक विज्ञापनों या सामग्री को हटाकर शामिल है यह डेवलपर्स को अपने अनुप्रयोगों में सामग्री निष्कर्षण को प्रभावी रूप से एकीकृत करने की अनुमति देता है ताकि विश्लेषण, सामग्री संकलन या किसी अन्य अनुप्रयोग को बढ़ाया जा सके जिसे ऑनलाइन लेखों से संरचित डेटा की आवश्यकता होती है इसकी की सूचना निकालने और लौटाने की क्षमता के साथ यह एपीआई उन परियोजनाओं के लिए आदर्श है जिनमें सामग्री संग्रह, समाचार विश्लेषण, स्वचालित सारांश निर्माण या प्रवृत्ति अनुसंधान शामिल है यह एक सरल लेकिन शक्तिशाली समाधान है जो लेख प्रसंस्करण की सुविधा प्रदान करता है और मूल्यवान जानकारी निकालने में उपयोगकर्ता अनुभव को बढ़ाता है
{"url":"https://www.foxnews.com/politics/matt-gaetz-faces-gop-senate-opposition-after-trump-selection-attorney-general","title":"Matt Gaetz faces GOP Senate opposition after Trump selection for attorney general","author":"Julia Johnson, Kelly Phares, Krista Garvin, Elizabeth Elkind, Tyler Olson, Michael Dane","_note":"Response truncated for documentation purposes"}
curl --location --request GET 'https://zylalabs.com/api/5126/clean+article+parser+api/6546/article+data?url=https://en.wikipedia.org/wiki/Lionel_Messi' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
एक GET अनुरोध भेजें जिसमें लेख का URL हो और API सामग्री को सामान्य पाठ और HTML प्रारूप में लौटाएगा
क्लीन आर्टिकल पार्सर एपीआई यह एपीआई ऑनलाइन लेखों से सामग्री निकालने और संरचना करने के लिए डिज़ाइन की गई है जिसमें विज्ञापन या अप्रासंगिक सामग्री के बिना साधारण पाठ और एचटीएमएल प्रारूप में डेटा प्रदान किया जाता है
एपीआई एक लेख यूआरएल को इनपुट के रूप में प्राप्त करता है और मैटाडाटा प्लेन टेक्स्ट सामग्री और एचटीएमएल को आउटपुट के रूप में प्रदान करता है
समाचार पोर्टलों के लिए स्वचालित सामग्री संग्रहण अनुसंधान या सामग्री संग्रहण के लिए लेख विश्लेषण संक्षेप या स्वचालित रिपोर्ट बनाने के लिए सामग्री निष्कर्षण
बेसिक योजना: 100 अनुरोध प्रति घंटा प्रो योजना: 200 अनुरोध प्रति घंटा प्रो प्लस योजना: 1 अनुरोध प्रति सेकंड प्रीमियम योजना: 1 अनुरोध प्रति सेकंड
हर किसी के लिए विभिन्न योजनाएँ हैं जिसमें छोटी संख्या में अनुरोधों के लिए एक निःशुल्क परीक्षण शामिल है लेकिन इसकी दर का सीमित होना सेवा के दुरुपयोग को रोकने के लिए है
एपीआई प्रमाणीकरण के लिए एपीआई कुंजियों का उपयोग करता है एपीआई तक पहुँचने के लिए अपने एपीआई कुंजी को अनुरोध अंतरमुख में शामिल करें एपीआई कुंजी पंजीकरण के समय प्रदान की जाती है और इसे सुरक्षित रखना चाहिए
एपीआई एक डोमेन की उम्र और इतिहास के बारे में विस्तृत जानकारी लौटाता है जिसमें इसके निर्माण के बाद के वर्ष महीने और दिन शामिल होते हैं साथ ही समाप्ति और अद्यतन तिथियां भी शामिल होती हैं
API संरचित डेटा लौटाती है जिसमें लेख का शीर्षक लेखक प्रकाशन की तारीख और मुख्य सामग्री दोनों सामान्य पाठ और HTML प्रारूप में होती है यह लेख डेटा की आवश्यकता वाले अनुप्रयोगों में आसानी से एकीकरण की अनुमति देती है
प्रतिक्रिया में मुख्य क्षेत्र "url" (लेख का लिंक) "title" (लेख का शीर्षक) "author" (लेख के लेखक) और "content" (लेख का मुख्य भाग HTML प्रारूप में) हैं
प्रतिक्रिया डेटा एक JSON प्रारूप में व्यवस्थित है जिसमें प्रत्येक क्षेत्र के लिए कुंजी-मूल्य जोड़े होते हैं यह संरचना डेवलपर्स को उनके अनुप्रयोगों में डेटा को आसानी से पार्स और उपयोग करने की अनुमति देती है
एपीआई जानकारी प्रदान करता है जैसे लेख का शीर्षक लेखक प्रकाशन तिथि और मुख्य सामग्री जिससे उपयोगकर्ता विश्लेषण या सामग्री संग्रह के लिए प्रासंगिक विवरण निकाल सकते हैं
उपयोगकर्ता GET अनुरोध में विभिन्न लेख यूआरएल निर्दिष्ट करके अपने अनुरोध को अनुकूलित कर सकते हैं एपीआई प्रदान किए गए यूआरएल को संसाधित करता है ताकि संबंधित लेख डेटा लौटाया जा सके
यह डेटा प्रदान की गई लेख URLs से सीधे प्राप्त किया गया है API वेबपेज की HTML संरचना से सामग्री निकालता है यह सुनिश्चित करते हुए कि जानकारी अद्यतन और प्रासंगिक है
डेटा की सटीकता स्रोत यूआरएल से सीधे सामग्री निकालकर बनाए रखी जाती है यह सुनिश्चित करते हुए कि वापस की गई जानकारी ऑनलाइन प्रकाशित लेख की वर्तमान स्थिति को दर्शाती है
सामान्य उपयोग के मामले समाचार वेबसाइटों के लिए सामग्री संकलन स्वचालित संक्षेपण उत्पन्न करने के लिए अनुसंधान और विभिन्न अनुप्रयोगों के लिए ऑनलाइन लेखों में प्रवृत्तियों का विश्लेषण शामिल हैं
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
371ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
819ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
290ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
183ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
315ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,815ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
5,253ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
85ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
356ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
59ms