Alibaba прави публично достъпен модела на AI за генериране на видео и изображения

сряда, 26 февруари 2025 г.

Китайският лидер в електронната търговия Alibaba заяви в сряда, че неговият модел за генериране на видео и изображения с изкуствен интелект Wan 2.1 вече е публично достъпен – или с отворен код – което вероятно ще увеличи разпространението му и ще засили конкуренцията в областта на изкуствения интелект.

Съобщението на Alibaba следва подобни действия от страна на стартъпа DeepSeek, чиито привидно евтини модели с отворен код по-рано тази година предизвикаха вълнение сред технологичните инвеститори и изненада в капиталоемкия сектор с резултати, сходни с тези на по-утвърдени конкуренти като OpenAI.

Alibaba заяви, че е пуснала четири варианта на Wan 2.1 – T2V-1.3B, T2V-14B, I2V-14B-720P и I2V-14B-480P – които генерират изображения и видеоклипове от въведени текстове и изображения. „14B“ означава, че вариантът приема 14 милиарда параметри, което означава, че може да обработва много повече входни данни, за да получи по-точни резултати.

Моделите са достъпни в световен мащаб на платформите ModelScope и HuggingFace на Alibaba Cloud за академични, изследователски и търговски цели.

През януари Alibaba представи най-новата версия на своя модел на изкуствен интелект за генериране на видео и изображения – по-късно съкрати името му на Wan от Wanx – изтъквайки способността му да генерира изключително реалистични визуализации.

Във вторник Alibaba пусна предварителен преглед на модела за разсъждение QwQ-Max, който планира да направи с отворен код при пълното му пускане.

Тази седмица тя обяви и плановете си да инвестира поне 380 млрд. юана (52 млрд. долара) през следващите три години, за да укрепи инфраструктурата за изчисления в облак и изкуствен интелект.