Змінюй хід війни! Допомагай ЗСУ!

Малюємо з AI

🔴 03:57 Повітряна тривога в Харків.обл.

Іронія

Куратор теми
Статус: Offline
Реєстрація: 28.01.2013
Повідом.: 52427
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #1
Тут буде оголошення. Колись.
 
Останнє редагування:
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2501
2DCS4L8QQ9jUFIUj4rmIuY3Rji8p7bOzDO.jpg
 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2502
Котів AI малює найкраще, мені здається
 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2503
OpenAI Sora

Первая txt2video модель от OpenAI. Генерирует видео длиной до минуты по текстовому запросу или картинке. Способна генерировать консистентные сцены с разных ракурсов, имеет хорошее понимание мира.

Sora — это диффузионная модель, которая генерирует видео, начиная с изображения, похожего на статический шум, и постепенно преобразует его, удаляя шум на протяжении многих шагов.

Sora способна генерировать целые видео за один раз или расширять уже созданные видео, делая их длиннее. Давая модели на вход множество кадров за раз, мы решили сложную задачу обеспечения темпорального постоянства объекта, даже если он временно исчезает из виду.

Подобно моделям GPT, Sora использует архитектуру трансформера, что делает ее масштабируемой.

Мы представляем видео и изображения как совокупности меньших юнитов данных, называемых патчами, каждый из которых аналогичен токену в GPT. Объединяя подход к представлению данных, мы можем обучать диффузионные трансформеры на более широком спектре визуальных данных, чем это было возможно ранее, охватывая различные продолжительности, разрешения и соотношения сторон.

Sora основывается на предыдущих исследованиях моделей DALL·E и GPT. Она использует технику описания (captioning) из DALL·E 3, которая включает генерацию высококачественных описаний к визуальным тренировочным данным. В результате модель более точно следует текстовым инструкциям пользователя в сгенерированном видео.

Помимо возможности генерировать видео исключительно по текстовым инструкциям, модель может взять существующее изображение и создать из него видео, анимируя содержимое изображения с точностью и вниманием к мелким деталям. Модель также может взять существующее видео и расширить его или восстановить отсутствующие кадры. Узнать больше можно в нашем техническом докладе (который будет опубликован сегодня позднее).

Sora служит основой для моделей, способных понимать и имитировать реальный мир, что, по нашему мнению, будет важной вехой на пути к достижению AGI (искусственного общего интеллекта).

Архитектура, похожа на мультимодальный трансформер с diffusion энкодером/декодером.

Примеры видео

На 3:20 море краисвое

 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2505
Офигеть. Скоро можно будет свое кино снимать :клас:
 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2506
Тем временем ИИ уже генерирует вот такие видео
Я теж замовляла з котом, але там з ним була якась проблема весь час, то на якесь чудовисько перетворювався, то три лапи...

Котів AI малює найкраще, мені здається
Бо "котиків люблять усі" :ги:
 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2509
dz1dqt0ods2ttj.jpg
 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2511
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2513
Цікаво було б все-таки утрьох :-)
Чи можемо розпочати, а якщо хтось захоче, то приєднається.
Пані та панове, гайда в Дзеркалля писати гумористичне оповідання!
 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2515
OpenAI Sora

Первая txt2video модель от OpenAI. Генерирует видео длиной до минуты по текстовому запросу или картинке. Способна генерировать консистентные сцены с разных ракурсов, имеет хорошее понимание мира.

Sora — это диффузионная модель, которая генерирует видео, начиная с изображения, похожего на статический шум, и постепенно преобразует его, удаляя шум на протяжении многих шагов.

Sora способна генерировать целые видео за один раз или расширять уже созданные видео, делая их длиннее. Давая модели на вход множество кадров за раз, мы решили сложную задачу обеспечения темпорального постоянства объекта, даже если он временно исчезает из виду.

Подобно моделям GPT, Sora использует архитектуру трансформера, что делает ее масштабируемой.

Мы представляем видео и изображения как совокупности меньших юнитов данных, называемых патчами, каждый из которых аналогичен токену в GPT. Объединяя подход к представлению данных, мы можем обучать диффузионные трансформеры на более широком спектре визуальных данных, чем это было возможно ранее, охватывая различные продолжительности, разрешения и соотношения сторон.

Sora основывается на предыдущих исследованиях моделей DALL·E и GPT. Она использует технику описания (captioning) из DALL·E 3, которая включает генерацию высококачественных описаний к визуальным тренировочным данным. В результате модель более точно следует текстовым инструкциям пользователя в сгенерированном видео.

Помимо возможности генерировать видео исключительно по текстовым инструкциям, модель может взять существующее изображение и создать из него видео, анимируя содержимое изображения с точностью и вниманием к мелким деталям. Модель также может взять существующее видео и расширить его или восстановить отсутствующие кадры. Узнать больше можно в нашем техническом докладе (который будет опубликован сегодня позднее).

Sora служит основой для моделей, способных понимать и имитировать реальный мир, что, по нашему мнению, будет важной вехой на пути к достижению AGI (искусственного общего интеллекта).

Архитектура, похожа на мультимодальный трансформер с diffusion энкодером/декодером.

Примеры видео

На 3:20 море краисвое


Це за гроші? Чи поки не має у доступі в принципі?
 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2516
Ubuntu (походить від
⚠ Тільки зареєстровані користувачі бачать весь контент та не бачать рекламу.
концепції
⚠ Тільки зареєстровані користувачі бачать весь контент та не бачать рекламу.
, яку можна висловити приблизно, як «людяність»)
 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2517
Ubuntu (походить від
⚠ Тільки зареєстровані користувачі бачать весь контент та не бачать рекламу.
концепції
⚠ Тільки зареєстровані користувачі бачать весь контент та не бачать рекламу.
, яку можна висловити приблизно, як «людяність»
а вот это действительно - мысль
 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2518
 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2519
Робимо малюнки (не реалістичне зображення, а саме малюнки) до казок чи дитячих книжок. Перекручування сюжету вітається :-)
 
  • 🔴 03:57 Повітряна тривога в Харків.обл.
  • #2520
Ви меломан, давно помічала :) (Я вкотре залипла слухати всевітньо відомий хіт :навушники:)

Давайте замовимо ШІ візуалізацію цієї пісні. У всіх буде по-різному. Долучайтеся усі, хто захоче!

 
Назад
Зверху Знизу