Google Launches Gemini 2.5 Computer Use Model to Automate Web and Mobile Tasks

Google ने Gemini 2.5 कंप्यूटर उपयोग मॉडल पेश किया: AI जो कंप्यूटर को इंसानों की तरह संचालित करता है

Google Launches Gemini 2.5 Computer Use Model to Automate Web and Mobile Tasks

Google Launches Gemini 2.5 Computer Use Model to Automate Web and Mobile Tasks

Google ने Gemini 2.5 कंप्यूटर उपयोग मॉडल पेश किया: AI जो कंप्यूटर को इंसानों की तरह संचालित करता है

Google ने Gemini 2.5 कंप्यूटर उपयोग मॉडल पेश किया है, जो एक नया AI मॉडल है जिसे वेब और मोबाइल इंटरफ़ेस के साथ सीधे इंटरैक्ट करने के लिए डिज़ाइन किया गया है। Gemini 2.5 Pro की उन्नत दृश्य तर्क और समझ क्षमताओं पर आधारित, यह मॉडल AI एजेंटों को कंप्यूटर पर स्वतंत्र रूप से क्लिक करना, टाइप करना, स्क्रॉल करना और वेबसाइट नेविगेट करना जैसी मानवीय क्रियाएँ करने में सक्षम बनाता है।

अब Google AI स्टूडियो और Vertex AI में Gemini API के माध्यम से उपलब्ध, यह सुविधा अधिक स्वायत्त AI सहायता की दिशा में एक बड़ा कदम है।

यह मॉडल नए computer_use टूल के माध्यम से संचालित होता है, जो एक लूप में काम करता है। यह उपयोगकर्ता के अनुरोध, वर्तमान परिवेश के स्क्रीनशॉट और हाल की क्रियाओं के रिकॉर्ड सहित इनपुट को संसाधित करता है। डेवलपर्स आवश्यकतानुसार विशिष्ट UI क्रियाओं को अनुकूलित या प्रतिबंधित कर सकते हैं।

इन इनपुट का विश्लेषण करने के बाद, Gemini 2.5 फ़ंक्शन कॉल के साथ प्रतिक्रिया करता है—जैसे क्लिक करने या टाइप करने का आदेश। खरीदारी जैसी संवेदनशील क्रियाओं के लिए, सिस्टम उपयोगकर्ता की पुष्टि का अनुरोध कर सकता है। कमांड निष्पादित होने के बाद, एक नया स्क्रीनशॉट और URL मॉडल को वापस भेज दिया जाता है, जिससे लूप फिर से शुरू हो जाता है। यह पुनरावृत्त प्रक्रिया तब तक जारी रहती है जब तक कार्य पूरा नहीं हो जाता, कोई त्रुटि उत्पन्न नहीं हो जाती, या उपयोगकर्ता द्वारा शुरू किया गया स्टॉप ट्रिगर नहीं हो जाता।

मुख्य रूप से वेब ब्राउज़र के लिए अनुकूलित होने के बावजूद, जेमिनी 2.5 मोबाइल UI नियंत्रण कार्यों के लिए भी आशाजनक परिणाम दिखाता है, हालाँकि Google नोट करता है कि डेस्कटॉप ऑपरेटिंग सिस्टम नियंत्रण अभी समर्थित नहीं है। कंपनी के अनुसार, जेमिनी 2.5 सबसे कम विलंबता पर ब्राउज़र नियंत्रण में अग्रणी प्रदर्शन प्रदान करता है, जैसा कि ऑनलाइन-माइंड2वेब के लिए ब्राउज़रबेस हार्नेस द्वारा बेंचमार्क किया गया है।