
AI को कहां से मिलता है डेटा (File Photo)
आर्टिफिशियल इंटेलिजेंस (AI) की दुनिया में यह सवाल लंबे समय से चर्चा में रहा है कि ये मशीनें अपनी जानकारी कहां से प्राप्त करती हैं। स्टेटिस्टा की हालिया रिपोर्ट ने इस रहस्य को कुछ हद तक सुलझाया है। 5,000 रैंडम कीवर्ड्स और 1.5 लाख उद्धरणों पर आधारित इस अध्ययन ने बताया कि इंटरनेट के कौन-से प्लेटफॉर्म एआई को सबसे अधिक डेटा प्रदान करते हैं।
रिपोर्ट के अनुसार, रेडिट एआई के लिए डेटा का सबसे बड़ा स्रोत है, जिसकी हिस्सेदारी 40.1% है। इसके बाद विकिपीडिया (26.3%) और यूट्यूब (23.5%) का स्थान है। अन्य प्रमुख स्रोतों में गूगल (23.3%), येल्प (21.0%), फेसबुक (20.0%), अमेजन (18.7%), ट्रिपएडवाइजर (12.5%), मेपबॉक्स (11.3%), और ओपनस्ट्रीटमैप (11.3%) शामिल हैं।
एआई के डेटा स्रोतों को लेकर पारदर्शिता का अभाव रहा है, और कई कंपनियों पर डेटा चोरी के आरोप लगे हैं। रेडिट ने हाल ही में इंटरनेट आर्काइव की वेबैक मशीन को अपनी वेबसाइट से ब्लॉक कर दिया, यह दावा करते हुए कि एआई कंपनियां इस टूल के माध्यम से उसका डेटा कॉपी कर रही थीं। नतीजतन, रेडिट अब अपनी साइट के बड़े हिस्से को इंडेक्स होने से रोकने की योजना बना रहा है। वेबैक मशीन एक ऐसा टूल है जो वेबसाइटों के पुराने संस्करण और सामग्री को संग्रहीत करता है।
2023 में रेडिट ने अपने एपीआई (एप्लिकेशन प्रोग्रामिंग इंटरफेस) में बदलाव किए, जिसके कारण कई थर्ड-पार्टी ऐप्स बंद हो गए। इससे यूजर्स में भारी नाराजगी देखी गई और विरोध प्रदर्शन हुए। रेडिट ने दावा किया कि इन एपीआई का उपयोग बिना अनुमति के एआई मॉडल्स को प्रशिक्षित करने के लिए किया जा रहा था।
एआई के उपयोग को लेकर विशेषज्ञ सतर्कता बरतने की सलाह देते हैं। चैटजीपीटी के प्रमुख निक टर्ले ने कहा है कि एआई चैटबॉट्स को हमेशा ‘दूसरी राय’ के रूप में लिया जाना चाहिए, न कि अंतिम सत्य के रूप में। ओपनएआई ने भी स्वीकार किया है कि भले ही गलतियों में कमी आई है, फिर भी लगभग 10% मामलों में एआई गलत जवाब दे सकता है।
आंकड़े: 5,000 रैंडम कीवर्ड्स और 1.5 लाख उद्धरणों पर आधारित
Updated on:
18 Aug 2025 02:58 pm
Published on:
18 Aug 2025 08:45 am
बड़ी खबरें
View Allविदेश
ट्रेंडिंग
