✍🏻پنج ابزار
#هوش_مصنوعی جذاب برای
#تبدیل #متن به
#ویدیو
Sora#
این مدل "درکی عمیق از زبان" دارد و میتواند "شخصیتهای قابل قبولی را ایجاد کند که احساسات را بیان میکنند."
Lumiere#
گوگل هوش مصنوعی ویدیویی خود به نام Lumiere را دارد که توسط یک مدل انتشار جدید به نام Space-Time-U-Net طراحی شده است. لومیر مکان اشیاء را در یک ویدیومشخص میکند و نحوه حرکت و تغییر همزمان آنها را ردیابی میکند.
VideoPoet#
یک مدل زبان بزرگ است که بر روی مجموعه داده عظیمی از فیلمها،تصاویر،صدا و متن آموزش داده شده است. این مدل میتواند وظایف مختلف تولیدویدیو را انجام دهد، از تبدیل متن یا تصاویر به ویدیو گرفته تا جذابتر کردن ویدیوها با سبک، رنگآمیزی درونی و بیرونی ویدیو، و ویدیو به صدا.
Emu_Video#
مدل هوش مصنوعی متا شامل دو مرحله است. ابتدا از متن یک عکس میسازد. سپس، از آن متن و تصویر برای ایجاد یک ویدیوی درجه یک استفاده میکند.
Phenaki#
تیم پشتیبان Phenaki Video از Mask GIT برای تولید ویدیوهای هدایتشده متنی در PyTorch استفاده کرد. این مدل میتواند ویدیوهایی با هدایت متن تولید کرده که تا مدت زمان 2 دقیقهای، بسازد.
@science_ai