आज हम आपको बताएंगे कि आर्टिफिशियल इंटेलिजेंस के जरिए लोग लाखों रुपए कैसे कमा रहे हैं! बेंगलुरु से तीन घंटे की दूरी पर अगरा नाम का एक छोटा सा गांव हैं। इस गांव की एक शांत गली में एक कमरे वाले अपने घर में प्रीथी पी. सिलाई मशीन के पास एक स्टूल पर बैठी है। आमतौर पर, वह औसतन 100 रुपये प्रति दिन की कमाई के लिए सिलाई करने में घंटों बिताती है। आज वह अपने फोन में एक ऐप पर कन्नड़ में एक वाक्य पढ़ रही है। वह थोड़ी देर के लिए ठहरती है, फिर दूसरा वाक्य पढ़ती है। प्रिथी अगरा और पास के गांवों में से एक स्टार्टअप कार्य द्वारा भर्ती किये गए 70 वर्कर्स में से एक है। मॉडल के लिए ट्रेनिंग डेटा एकत्र करने में अरबों डॉलर खर्च करती हैं। इस तरह के काम के लिए कम वेतन देना एक इंडस्ट्री फेलियर है।’ माइक्रोसॉफ्ट ने अपने एआई प्रोडक्ट्स के लिए लोकल स्पीच डेटा प्राप्त करने में कार्या का इस्तेमाल किया है। बिल एंड मेलिंडा गेट्स फाउंडेशन कार्या के साथ मिलकर काम कर रहा है, ताकि बड़े भाषा मॉडलों के लिए डेटा में लिंग पूर्वाग्रह को कम किया जा सके।ये भारत की स्थानीय भाषाओं में टेक्स्ट, वॉयस और इमेज डेटा इकट्ठा करते हैं। प्रीथी एक विशाल और अदृश्य ग्लोबल वर्कफोर्स का हिस्सा है, जो भारत, केन्या और फिलीपिंस जैसे देशों में काम कर रही है। ये लोग उस डेटा को एकत्र और लेबल करते है जिसके आधार पर AI चैटबॉट और वर्चुअल असिस्टेंट रिलेवेंट रिस्पांस जनरेट करते हैं। हालांकि, कई दूसरे डेटा कॉन्ट्रैक्टर्स की तुलना में प्रिथी को उनके प्रयासों के लिए लोकल स्टैंडर्ड को देखते हुए ठीक पेमेंट मिल जाता है।
कार्या के साथ काम करते हुए 3 दिन में प्रिथी ने 4,500 रुपये कमाए हैं। एक 22 साल का हाई स्कूल ग्रेजुएट आमतौर पर एक दर्जी के रूप में पूरे महीने जिनता कमाया है, यह उससे 4 गुना अधिक रकम है। प्रिथी ने कहा कि घर की मरम्मत के लोन की उस महीने की किस्त का पमेंट करने के लिए यह रकम पर्याप्त है। कार्या की स्थापना 2021 में ChatGPT के आने से पहले हुई थी। इस साल जेनरेटिव एआई का जो भूचाल आया है, उसने टेक कंपनियों की डेटा की डिमांड को काफी अधिक बढ़ा दिया है। अकेले भारत में 2030 तक लगभग दस लाख डेटा एनोटेशन वर्कर होने की उम्मीद है। यह अनुमान देश की टेक इंडस्ट्री ट्रेड बॉडी नैसकॉम का है। कार्या ने दूसरे डेटा वेंडर्स की तुलना में खुद को कुछ अलग बनाया है। इसके कॉन्ट्रैक्टर्स में अधिकतर महिलाएं होती हैं और ये अधिकतर गांवों की होती हैं। कंपनी इन वर्कर्स को प्रचलित न्यूनतम मजदूरी से 20 गुना तक अधिक रकम की पेशकरश करती है।
स्टार्टअप के सीईओ 27 वर्षीय स्टैनफोर्ड से पढ़े कंप्यूटर इंजीनियर मनु चोपड़ा ने एक इंटरव्यू में ब्लूमबर्ग को बताया, ‘हर साल, बड़ी टेक कंपनियां अपने एआई और मशीन लर्निंग मॉडल के लिए ट्रेनिंग डेटा एकत्र करने में अरबों डॉलर खर्च करती हैं। इस तरह के काम के लिए कम वेतन देना एक इंडस्ट्री फेलियर है।’ माइक्रोसॉफ्ट ने अपने एआई प्रोडक्ट्स के लिए लोकल स्पीच डेटा प्राप्त करने में कार्या का इस्तेमाल किया है। बिल एंड मेलिंडा गेट्स फाउंडेशन कार्या के साथ मिलकर काम कर रहा है, ताकि बड़े भाषा मॉडलों के लिए डेटा में लिंग पूर्वाग्रह को कम किया जा सके।
उधर Alphabet का गूगल 85 भारतीय जिलों में स्पीच डेटा इकट्ठा करने के लिए कार्या और दूसरे लोकल पार्टनर्स पर निर्भर है। गूगल की योजना हर जिले में विस्तार करने की है, जिसमें बहुसंख्यक भाषा या बोली शामिल।विशाल और अदृश्य ग्लोबल वर्कफोर्स का हिस्सा है, जो भारत, केन्या और फिलीपिंस जैसे देशों में काम कर रही है। ये लोग उस डेटा को एकत्र और लेबल करते है जिसके आधार पर AI चैटबॉट और वर्चुअल असिस्टेंट रिलेवेंट रिस्पांस जनरेट करते हैं। हालांकि, कई दूसरे डेटा कॉन्ट्रैक्टर्स की तुलना में प्रिथी को उनके प्रयासों के लिए लोकल स्टैंडर्ड को देखते हुए ठीक पेमेंट मिल जाता है। अकेले भारत में 2030 तक लगभग दस लाख डेटा एनोटेशन वर्कर होने की उम्मीद है। यह अनुमान देश की टेक इंडस्ट्री ट्रेड बॉडी नैसकॉम का है। कार्या ने दूसरे डेटा वेंडर्स की तुलना में खुद को कुछ अलग बनाया है। इसके कॉन्ट्रैक्टर्स में अधिकतर महिलाएं होती हैं और ये अधिकतर गांवों की होती हैं।गूगल 125 भारतीय भाषाओं के लिए एक जनरेटिव AI मॉडल बनाना है। इस तरह आप समझ सकते हैं कि दिशा में अभी कितना विस्तार होना बाकी है। इसका सीधा फायदा भारतीय स्टार्टअप कार्या और स्थानीय लोगों को होगा।