🔴هوش مصنوعی مرموز Nano-Banana خبرساز شد؛ تولید و ویرایش عکس با دقتی خیرهکننده
🔸در دنیای پرسرعت #هوش_مصنوعی ، یک مدل جدید و مرموز برای تولید و ویرایش تصویر با نام Nano-Banana ظهور کرده که با عملکرد خیرهکننده خود، توجه جامعه فناوری را جلب کرده است. این مدل بدون هیچگونه معرفی رسمی و در پلتفرم LMArena مشاهده شده است و میتواند دستورات متنی پیچیده را درک و با دقت بالایی تصاویر را ویرایش کند.
🔸برخلاف مدلهای مشهور، Nano-Banana با کمپینهای تبلیغاتی معرفی نشد؛ بلکه بیسروصدا در بخش ویرایش تصویر پلتفرم LMArena ظاهر شد. البته طولی نکشید که کاربران با به اشتراکگذاشتن خروجیهای جالب، از توانایی بینظیر آن در دنبالکردن دستورات پیچیده تعجب کردند. برای مثال، این مدل قادر است دستورات چندمرحلهای مانند «شخصیت پایینی را به شخصیت 2B از بازی Nier: Automata و شخصیت بالایی را به Master Chief از بازی Halo تبدیل کن» را با دقتی خیرهکننده اجرا کند، و نورپردازی، پرسپکتیو و ترکیببندی کلی صحنه را دستنخورده باقی بگذارد.
🔸عملکرد فوقالعاده مدل Nano-Banana باعث شده تا گمانهزنیهای زیادی درمورد هویت سازنده آن شکل بگیرد. اگرچه هیچ شرکتی رسماً اعلام نکرده که این مدل را ساخته، اما قویترین نظریه این است که Nano-Banana یک پروژه مخفی متعلق به گوگل است، آن هم به دو دلیل: اول، کیفیت و بافت تصاویر تولیدشده شباهت زیادی به مدلهای Imagen و Gemini گوگل دارد؛ و دوم، گوگل سابقهای طولانی در استفاده از نام میوهها به عنوان اسم رمز برای پروژههای داخلی خود دارد.
#AI #Nano_Banana
🇮🇷https://eitaa.com/science_ai
💢 رقیبی برای فتوشاپ؛ هوش مصنوعی جدید علیبابا ویرایش دقیق تصاویر را ساده میکند
🔸تیم #هوش_مصنوعی Qwen علیبابا از یک مدل هوش مصنوعی متنباز جدید به نام Qwen-Image Edit رونمایی کرد. این ابزار قدرتمند قادر است تنها با دریافت دستورات متنی ساده، طیف وسیعی از ویرایشهای پیچیده را که پیشازاین در انحصار نرمافزارهای حرفهای مانند فتوشاپ بود، در چند ثانیه انجام دهد. این مدل به صورت متنباز منتشر شده است.
🔸قدرت Qwen-Image Edit ریشه در مدل مادر خود، Qwen-Image، دارد که به دلیل توانایی بینظیرش در رندرکردن متون پیچیده به زبانهای چینی و انگلیسی شهرت یافته بود. این مدل جدید از یک معماری هوشمندانه «رمزگذاری دوگانه» (Dual Encoding) بهره میبرد. این یعنی تصویر ورودی بهطور همزمان به دو بخش مختلف از هوش مصنوعی فرستاده میشود: یکی برای درک معنای کلی صحنه و دیگری برای حفظ جزئیات بصری و سبک تصویر اصلی. این رویکرد به مدل اجازه میدهد تا دو نوع ویرایش کاملاً متفاوت را با دقتی خیرهکننده انجام دهد.
#AI
🇮🇷https://eitaa.com/science_ai
منابع اصلی اطلاعاتی هوش مصنوعی
https://B2n.ir/hu6615
🇮🇷https://eitaa.com/science_ai