स्मार्टफोन्स के लिए माइक्रोसॉफ्ट लाया Phi-3-Vision एआई मॉडल

माइक्रोसॉफ्ट ने अपने लेटेस्ट स्मॉल लैंग्वेज मॉडल Phi-3 को नए फीचर्स के साथ लॉन्च किया है। कंपनी के सीईओ सत्या नडेला ने माइक्रोसॉफ्ट बिल्ड 2024 इवेंट में Phi-3 फैमिली के तीन नए एआई मॉडल्स को लॉन्च किया। नए एआई मॉडल स्मार्टफोन पर शानदार कन्वर्सेशनल एआई एक्सपीरियंस देंगे। Phi-3 Vision इन्हीं में से एक है। यह एक मल्टीमोडल मॉडल है, जो इमेज, चार्ट और डायग्राम इनपुट का जवाब टेक्स्ट में देता है। यह 4.2 बिलियन पैरामीटर मॉडल मोबाइल डिवाइसेज के लिए डिजाइन किया गया है। जेनरल विजुअल रीजनिंग टास्क में इसका रिस्पॉन्स जबरदस्त है।

इमेज ऐनालिसिस और समझ में काफी तेज
यूजर फोटोज या चार्ट के बारे में Phi-3-Vision से सवाल पूछ सकते हैं। यह पूछे गए सवाल का सही जवाब देगा। हालांकि, यह DALL-E या स्टेबल डिफ्यूजन जैसा इमेज जेनरेशन टूल नहीं है, लेकिन यह इमेज ऐनालिसिस और समझ में काफी तेज है। Phi-3-Vision की एंट्री Phi-3-Mini के ठीक बाद हुई है, जो 3.8 बिलियन पैरामीटर्स के साथ Phi-3 फैमिली का सबसे छोटा मेंबर है। पूरे परिवार में अब Phi-3-Mini, Phi-3-Vision, Phi-3-Small (7 बिलियन पैरामीटर), और Phi-3-Medium (14 बिलियन पैरामीटर) शामिल हैं।

ऐंड्रॉयड, वेब, iOS, विंडोज ऐप बनाने में करेगा मदद
नडेला ने कहा कि Phi मॉडल्स के जरिए यूजर ऐंड्रॉयड, वेब, iOS, विंडोज और एज के लिए ऐप बना सकते हैं। छोटे मॉडलों पर यह फोकस एआई डेवेलपमेंट के ट्रेंड को दिखाता है। छोटे मॉडलों को कम प्रोसेसिंग पावर और मेमरी की जरूरत होती है, जो उन्हें मोबाइल डिवाइस बेस्ट बनाते हैं। माइक्रोसॉफ्ट को इस अप्रोच से पहले ही सफलता मिल चुकी है, कथित तौर पर कंपनी का Orca-Math मॉडल मैथ के प्रॉबल्म्स को सॉल्व करने में बड़े कॉम्पिटिटर्स से आगे निकल गया है।

Phi-3-Vision अभी प्रीव्यू में उपलब्ध है, जबकि बाकी Phi-3 फैमिली (मिनी, छोटा और मध्यम) को Azure की मॉडल लाइब्रेरी के जरिए से एक्सेस किया जा सकता है। बताते चलें कि माइक्रोसॉफ्ट के सीईओ सत्या नडेला ने कन्फर्म कर दिया है कि ओपन एआई का लेटेस्ट मल्टी-मोडल लार्ज लैंग्वेज मॉडल (LLM) GPT-4o अब Azure OpenAI में उपलब्ध हो गया है।