✍🏻پنج ابزار جذاب برای به Sora# این مدل "درکی عمیق از زبان" دارد و می‌تواند "شخصیت‌های قابل قبولی را ایجاد کند که احساسات را بیان می‌کنند." Lumiere# گوگل هوش مصنوعی ویدیویی خود به نام Lumiere را دارد که توسط یک مدل انتشار جدید به نام Space-Time-U-Net طراحی شده است. لومیر مکان اشیاء را در یک ویدیومشخص می‌کند و نحوه حرکت و تغییر همزمان آنها را ردیابی می‌کند. VideoPoet# یک مدل زبان بزرگ است که بر روی مجموعه داده عظیمی از فیلم‌ها،تصاویر،صدا و متن آموزش داده شده است. این مدل می‌تواند وظایف مختلف تولیدویدیو را انجام دهد، از تبدیل متن یا تصاویر به ویدیو گرفته تا جذاب‌تر کردن ویدیوها با سبک، رنگ‌آمیزی درونی و بیرونی ویدیو، و ویدیو به صدا. Emu_Video# مدل هوش مصنوعی متا شامل دو مرحله است. ابتدا از متن یک عکس می‌سازد. سپس، از آن متن و تصویر برای ایجاد یک ویدیوی درجه یک استفاده می‌کند. Phenaki# تیم پشتیبان Phenaki Video از Mask GIT برای تولید ویدیوهای هدایت‌شده متنی در PyTorch استفاده کرد. این مدل می‌تواند ویدیوهایی با هدایت متن تولید کرده که تا مدت زمان 2 دقیقه‌ای، بسازد. @science_ai