Home Technology मेटा ने एसएएम का अनावरण किया, एक एआई उपकरण जो एक छवि के भीतर वस्तुओं की पहचान कर सकता है; यहां बताया गया है कि यह कैसे काम करेगा

मेटा ने एसएएम का अनावरण किया, एक एआई उपकरण जो एक छवि के भीतर वस्तुओं की पहचान कर सकता है; यहां बताया गया है कि यह कैसे काम करेगा

0
मेटा ने एसएएम का अनावरण किया, एक एआई उपकरण जो एक छवि के भीतर वस्तुओं की पहचान कर सकता है;  यहां बताया गया है कि यह कैसे काम करेगा

[ad_1]

मेटा ने कहा कि एसएएम छवियों और वीडियो के भीतर वस्तुओं की पहचान करने में सक्षम है – यहां तक ​​कि उन मामलों में भी जहां उसने अपने प्रशिक्षण में उन वस्तुओं का सामना नहीं किया था।

कार्रवाई में मेटा एसएएम ऐ।  (छवि क्रेडिट: मेटा)
एक वीडियो से वस्तुओं का पता लगाने के दौरान कार्रवाई में मेटा एसएएम एआई (छवि क्रेडिट: मेटा)

न्यूयॉर्क: फेसबुक पैरेंट मेटा ने बुधवार को अपने नवीनतम एआई मॉडल का विवरण देते हुए एक पेपर जारी किया जो तस्वीरों के भीतर विभिन्न वस्तुओं को “खंडित” कर सकता है। कंपनी के अनुसंधान प्रभाग ने कहा कि उसने कंप्यूटर विजन के लिए फाउंडेशन मॉडल में अनुसंधान को बढ़ावा देने के लिए सेगमेंट एनीथिंग मॉडल (एसएएम) और संबंधित डेटासेट जारी किया।

मेटा ने कहा कि एसएएम छवियों और वीडियो के भीतर वस्तुओं की पहचान करने में सक्षम है – यहां तक ​​कि उन मामलों में भी जहां उसने अपने प्रशिक्षण में उन वस्तुओं का सामना नहीं किया था। उपयोगकर्ता उन पर क्लिक करके या पाठ संकेतों का उपयोग करके वस्तुओं का चयन कर सकते हैं, जैसे शब्द “बिल्ली” या “कुर्सी” और इसी तरह। एक प्रदर्शन में, एसएएम लिखित संकेत के जवाब में सटीक रूप से एक तस्वीर में कई बिल्लियों के चारों ओर बक्से बनाने में सक्षम था।

यहां बताया गया है कि सैम कैसे काम करता है

एसएएम अन्य एआई मॉडल से कैसे अलग है

  • एसएएम संकेत देने योग्य है, जिसका अर्थ है कि यह किस वस्तु को खंडित करने के लिए निर्दिष्ट करने के लिए विभिन्न इनपुट संकेत ले सकता है, जैसे बिंदु या बक्से। उदाहरण के लिए, आप किसी व्यक्ति के चेहरे के चारों ओर एक बॉक्स बना सकते हैं, और सेगमेंट एनीथिंग मॉडल चेहरे के लिए एक मुखौटा उत्पन्न करेगा। आप एक साथ कई ऑब्जेक्ट को सेगमेंट करने के लिए कई संकेत भी दे सकते हैं। एसएएम मॉडल जटिल दृश्यों को अवरोधन, प्रतिबिंब और छाया के साथ संभाल सकता है।
  • एसएएम को 11 मिलियन छवियों और 1.1 बिलियन मास्क के विशाल डेटासेट पर प्रशिक्षित किया गया है, जो अब तक का सबसे बड़ा विभाजन डेटासेट है। यह डेटासेट जानवरों, पौधों, वाहनों, फ़र्नीचर, भोजन, और बहुत कुछ जैसे वस्तुओं और श्रेणियों की एक विस्तृत श्रृंखला को शामिल करता है। एसएएम उन वस्तुओं को खंडित कर सकता है जिन्हें उसने पहले कभी नहीं देखा है, इसकी सामान्यीकरण क्षमता और डेटा विविधता के लिए धन्यवाद।
  • एसएएम के पास विभिन्न प्रकार के सेगमेंटेशन कार्यों पर शून्य-शॉट प्रदर्शन है। जीरो-शॉट का अर्थ है कि एसएएम किसी विशिष्ट कार्य या डोमेन पर बिना किसी अतिरिक्त प्रशिक्षण या फाइन-ट्यूनिंग के वस्तुओं को खंडित कर सकता है। उदाहरण के लिए, एसएएम चेहरे, हाथ, बाल, कपड़े और सहायक उपकरण बिना किसी पूर्व ज्ञान या पर्यवेक्षण के खंडित कर सकता है। SAM वस्तुओं को विभिन्न तौर-तरीकों में भी विभाजित कर सकता है, जैसे इन्फ्रारेड इमेज या डेप्थ मैप्स।

खंड कुछ भी मॉडल (एसएएम मॉडल) सुविधाएँ

  • एसएएम मॉडल का उपयोग करते हुए, उपयोगकर्ता विभाजन से शामिल करने या छोड़ने के लिए अलग-अलग बिंदुओं का चयन करके वस्तुओं को जल्दी और आसानी से खंडित कर सकते हैं। मॉडल के लिए एक क्यू के रूप में एक सीमा बॉक्स का भी उपयोग किया जा सकता है।
  • जब आइटम खंडित होने के संबंध में अनिश्चितता मौजूद होती है, तो एसएएम मॉडल वास्तविक दुनिया में विभाजन को हल करने के लिए एक महत्वपूर्ण और महत्वपूर्ण कौशल, कई वैध मास्क का उत्पादन कर सकता है।
  • सेगमेंट एनीथिंग मॉडल के साथ स्वचालित ऑब्जेक्ट डिटेक्शन और मास्किंग अब सरल हैं।
  • इमेज एम्बेडिंग की प्रीकंप्यूटिंग के बाद, सेगमेंट एनीथिंग मॉडल तुरंत किसी भी प्रॉम्प्ट के लिए एक सेगमेंटेशन मास्क प्रदान कर सकता है, जिससे मॉडल के साथ रीयल-टाइम इंटरैक्शन सक्षम हो जाता है।

सेगमेंट एनीथिंग मॉडल (एसएएम मॉडल) का उपयोग कैसे करें?

एसएएम मेटा एआई रिसर्च (पूर्व में फेसबुक एआई रिसर्च) द्वारा विकसित किया गया है, और यह गिटहब पर सार्वजनिक रूप से उपलब्ध है। आप SAM को ऑनलाइन एक डेमो के साथ आज़मा सकते हैं या 1 बिलियन मास्क और 11 मिलियन छवियों का डेटासेट (SA-1B) डाउनलोड कर सकते हैं।

  1. डेमो डाउनलोड करें या सेगमेंट एनीथिंग मॉडल डेमो पर जाएं।
  2. एक छवि अपलोड करें या गैलरी में से किसी एक को चुनें।
  3. जोड़ें और विषय क्षेत्रों
  4. अंक जोड़कर मास्क क्षेत्र। क्षेत्र जोड़ें का चयन करें, फिर वस्तु का चयन करें। चयन करके मास्क को परिष्कृत करें
  5. क्षेत्र हटाएं, फिर क्षेत्र का चयन करें।

मेटा जनरेटिव एआई के साथ प्रयोग कर रहा है, जो डेटा को केवल पहचानने या वर्गीकृत करने के बजाय नई सामग्री बनाता है। सीईओ मार्क जुकरबर्ग ने कहा है कि इस साल मेटा के ऐप्स में ऐसी तकनीक को शामिल करना प्राथमिकता है। कंपनी द्वारा विकसित किए जा रहे जनरेटिव एआई टूल्स के उदाहरणों में एक ऐसा है जो टेक्स्ट प्रॉम्प्ट से असली वीडियो बनाता है और दूसरा जो गद्य से बच्चों की किताब के चित्र तैयार करता है।

मेटा पहले से ही फ़ोटो टैग करने, निषिद्ध सामग्री को मॉडरेट करने और Facebook और Instagram के उपयोगकर्ताओं को पोस्ट की अनुशंसा करने के लिए समान तकनीक का आंतरिक रूप से उपयोग करता है। एसएएम के जारी होने से इस प्रकार की प्रौद्योगिकी तक पहुंच के विस्तार की उम्मीद है।




प्रकाशित तिथि: 7 अप्रैल, 2023 7:41 पूर्वाह्न IST





[ad_2]

LEAVE A REPLY

Please enter your comment!
Please enter your name here