एचटीएमएल कोड एक्सट्रैक्शन एपीआई डेवलपर्स को किसी भी वेबपेज के कच्चे एचटीएमएल को प्राप्त और प्रोसेस करने का एक सरल लेकिन शक्तिशाली तरीका प्रदान करता है स्क्रैपर्स को मैन्युअली सेट करने, यूजर एजेंट संभालने या ब्लॉकिंग के बारे में चिंता करने के बजाय यह एपीआई साफ और सुसंगत एचटीएमएल डेटा प्रदान करता है जिसे आपके अनुप्रयोगों में सीधे इंटीग्रेट किया जा सकता है
इस एपीआई के साथ, आप:
किसी भी सार्वजनिक रूप से सुलभ यूआरएल से पूरा एचटीएमएल स्रोत कोड प्राप्त करें
डेटा पाइपलाइनों, क्रॉलर्स और सामग्री विश्लेषक को अतिरिक्त सेटअप के बिना पावर करें
निकाले गए एचटीएमएल का उपयोग वेब स्क्रैपर्स, सर्च इंजन्स, एसईओ टूल या एआई-चालित विश्लेषण बनाने के लिए आधार के रूप में करें
मेटाडेटा एक्सट्रैक्शन, डोम पार्सिंग और संरचित सामग्री जनरेशन जैसे वर्कफ़्लो को स्वचालित करें
चाहे आप डेटा खनन, वेबसाइटों की निगरानी या एसईओ टूल को बढ़ाने पर काम कर रहे हों एचटीएमएल एक्स्ट्रैक्शन एपीआई एचटीटीपी अनुरोधों, हैडर और साइट फ़ेचिंग का सारा भारी काम संभालकर समय बचाता है यह तेज, विश्वसनीय है और आपकी जरूरतों के साथ स्केल करने के लिए डिजाइन किया गया है
{"link_count":1,"image_count":0,"heading_tag_count":{"h1":1,"h2":0,"h3":0,"h4":0,"h5":0,"h6":0},"p_count":2,"character_encoding":"utf-8","page_language":null,"total_size_kb":1.25,"character_count":1283,"word_count":127,"line_count":54,"title":"Example Domain","description":null,"keywords":null,"final_url":"https://www.example.com/","status_code":200,"headers":{"headers":{"date":"Fri, 05 Sep 2025 14:58:16 GMT","content-length":"648","vary":"Accept-Encoding","content-encoding":"gzip","last-modified":"Mon, 13 Jan 2025 20:11:20 GMT","content-range":"bytes 0-647/648","content-type":"text/html","etag":"\"84238dfc8092e5d9c0dac8ef93371a07:1736799080.121134\"","connection":"keep-alive","accept-ranges":"bytes","cache-control":"max-age=86000","alt-svc":"h3=\":443\"; ma=93600,h3-29=\":443\"; ma=93600","x-status-normalized":"206->200"}},"html_code":"<html>"}
curl --location --request GET 'https://zylalabs.com/api/10189/html+code+extractor+api/19560/extract+html?url=https://forkthis.io/' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
HTML निष्कर्षण एपीआई किसी भी सार्वजनिक रूप से सुलभ वेबपृष्ठ का कच्चा HTML स्रोत कोड एकल एपीआई कॉल के साथ प्राप्त करता है
आपको बस एक मान्य यूआरएल प्रदान करने की आवश्यकता है एपीआई पृष्ठ का एचटीएमएल लाएगा और वापस करेगा
API एक JSON प्रतिक्रिया लौटाता है जिसमें पूर्ण HTML सामग्री एक स्ट्रिंग के रूप में होती है अतिरिक्त डेटा जैसे लिंक_गिनती इमेज_गिनती हेडिंग_टैग_गिनती p_गिनती कैरेक्टर_एनकोडिंग पृष्ठ_भाषा कुल_आकार_kb कैरेक्टर_गिनती शब्द_गिनती पंक्ति_गिनती शीर्षक विवरण कीवर्ड अंतिम_यूआरएल स्थिति कोड और हेडर शामिल हैं
एपीआई संरचित एचटीएमएल लौटाता है जिसे ब्यूटीफुलसूप लाइब्रेरी के माध्यम से पार्स किया जाता है
बिल्कुल यह HTML से मेटाडेटा हेडिंग्स टैग्स और ऑन-पेज SEO तत्वों का विश्लेषण करने के लिए इस्तेमाल किया जा सकता है
वर्तमान संस्करण प्रति अनुरोध एक पृष्ठ निकालता है लेकिन आप अपनी एप्लिकेशन में कई URL को संभालने के लिए अनुरोधों को बैच कर सकते हैं
एपीआई को गति के लिए अनुकूलित किया गया है आमतौर पर इसे साइट की जटिलता और लोड समय के आधार पर मिलीसेकंड में प्रतिक्रिया मिलती है
वेब स्क्रैपिंग और डेटा संग्रहण एसईओ ऑडिटिंग और मेटाडेटा विश्लेषण सामग्री निगरानी और संग्रहण शोध और मशीन लर्निंग डेटा सेट खोज या क्रॉलर उपकरण बनाना
हाँ, एपीआई रीडायरेक्ट (301/302) का पालन करता है और अंतिम गंतव्य पृष्ठ का एचटीएमएल लौटाता है
एपीआई केवल सार्वजनिक रूप से उपलब्ध डेटा लाता है उपयोगकर्ता लक्ष्य वेबसाइट की सेवा की शर्तों और robots.txt का पालन करने के लिए जिम्मेदार हैं
एक्सट्रैक्ट एचटीएमएल एंडपॉइंट एक JSON ऑब्जेक्ट लौटाता है जिसमें अनुरोधित वेबपेज का पूरा एचटीएमएल कोड होता है साथ ही मेटाडेटा जैसे लिंक की संख्या इमेज की संख्या हेडिंग टैग्स कैरेक्टर एन्कोडिंग और अधिक
मुख्य क्षेत्रों में `link_count`, `image_count`, `heading_tag_count`, `title`, `description`, `final_url`, `status_code`, और `html_code` शामिल हैं ये पृष्ठ की संरचना और सामग्री के बारे में अंतर्दृष्टि प्रदान करते हैं
उत्तर को नेस्टेड फ़ील्ड्स के साथ एक JSON ऑब्जेक्ट के रूप में संरचित किया गया है मुख्य विशेषताओं में HTML सामग्री और मेटाडेटा शामिल हैं जो `title` और `link_count` जैसे विशिष्ट डेटा प्रोफाइल तक पहुँच की अनुमति देते हैं
यह एन्डपॉइंट वेबपेज की संरचना के बारे में जानकारी प्रदान करता है जिसमें लिंक, छवियों, शीर्षकों और अनुच्छेदों की गिनती शामिल है इसके साथ ही HTML सामग्री स्वयं और HTTP प्रतिक्रिया की जानकारी भी शामिल है
उपयोगकर्ता विभिन्न पृष्ठों से HTML निकालने के लिए विभिन्न URL निर्दिष्ट करके अनुरोधों को अनुकूलित कर सकते हैं API स्वचालित रूप से प्रदान किए गए URL को लाने और पार्स करने का प्रबंधन करता है
उदाहरण के लिए, `link_count` पृष्ठ पर हाइपरलिंक की संख्या को इंगित करता है, जबकि `heading_tag_count` विभिन्न शीर्षक स्तरों (h1, h2, आदि) का विवरण प्रदान करता है, जिससे उपयोगकर्ताओं को पृष्ठ की सामग्री की पदानुक्रम को समझने में मदद मिलती है
API निर्दिष्ट URLs से सीधे लाइव डेटा लाता है यह सुनिश्चित करते हुए कि HTML और मेटाडेटा वेबपेज की वर्तमान स्थिति को दर्शाते हैं साइट की उपलब्धता के अधीन
विशिष्ट उपयोग के मामलों में डेटा विश्लेषण के लिए वेब स्क्रैपिंग SEO ऑडिट्स जो ऑन-पेज तत्वों का मूल्यांकन करने के लिए हैं परिवर्तन के लिए सामग्री मॉनिटरिंग और खोज इंजनों या क्रॉलर्स के लिए उपकरण बनाना शामिल है
विशिष्ट उपयोग के मामलों में डेटा विश्लेषण के लिए वेब स्क्रैपिंग सामग्री अनुकूलन के लिए एसईओ ऑडिट और उन क्रॉलर या सर्च इंजन का निर्माण करना शामिल है जिन्हें प्रसंस्करण के लिए संरचित एचटीएमएल डेटा की आवश्यकता होती है
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
173ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,429ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
17ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
105ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,869ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
299ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
219ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
935ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
546ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
83ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
878ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,429ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
10,154ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,134ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,877ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,434ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
223ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
5,748ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,845ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,054ms