XZ Blog XZ Blog
首页
  • 人体姿态估计
  • 2D-3D-Lifting
  • 动作质量评估
  • 基于RGBD视觉信息的异常行为识别
  • 基于RGB视频的行为识别
  • 大模型应用
  • 网络结构

    • Transformer
    • GCN
    • Graph Transformers
    • Diffusion Model
  • 深度学习
  • 论文解读
  • 后端开发
  • Git
  • 博客搭建
  • Debug
  • 面试
  • 实用技巧
  • 友情链接
关于
收藏
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

xzhouzeng

@渐行。
首页
  • 人体姿态估计
  • 2D-3D-Lifting
  • 动作质量评估
  • 基于RGBD视觉信息的异常行为识别
  • 基于RGB视频的行为识别
  • 大模型应用
  • 网络结构

    • Transformer
    • GCN
    • Graph Transformers
    • Diffusion Model
  • 深度学习
  • 论文解读
  • 后端开发
  • Git
  • 博客搭建
  • Debug
  • 面试
  • 实用技巧
  • 友情链接
关于
收藏
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • 人体姿态估计

  • 动作质量评估

  • 基于骨骼的行为识别

  • 基于RGB视频的行为识别

  • 大模型应用

  • 网络架构

  • 视频生成

    • 视频生成
      • 背景介绍
      • 相关工作
        • VDM(2022 NeurIPS)
        • Cogvideo(2023 ICLR)
        • Make-A-Video(2023 ICLR)
        • Imagen video(2022)
        • Make-a-story(2023 CVPR)
        • AR-LDM(2022)
        • Visual Storytelling(2016 NAACL)
      • 参考资料
  • NLP

  • 多模态

  • 视频理解

  • 文档
  • 视频生成
xzhouzeng
2023-06-02
目录

视频生成

# 视频生成

包括视频生成及故事可视化(如漫画等有时间、符合逻辑的连续图片等)

# 背景介绍

# 相关工作

# VDM(2022 NeurIPS)

Video diffusion models

作者:Google

# Cogvideo(2023 ICLR)

Cogvideo: Large-scale pretraining for text-to-video generation via transformers

作者:Tsinghua University

# Make-A-Video(2023 ICLR)

Make-A-Video: Text-to-Video Generation without Text-Video Data

作者:Meta AI

# Imagen video(2022)

Imagen video: High definition video generation with diffusion models

作者:Google

# Make-a-story(2023 CVPR)

Make-a-story: Visual memory conditioned consistent story generation

# AR-LDM(2022)

Synthesizing coherent story with auto-regressive latent diffusion models

# Visual Storytelling(2016 NAACL)

Visual Storytelling(提出一个数据集)

作者:Microsoft Research

# 参考资料

  • [showlab/Awesome-Video-Diffusion(https://github.com/showlab/Awesome-Video-Diffusion#video-generation

编辑 (opens new window)
上次更新: 2023/06/22, 13:30:30
Diffusion Model
自然语言处理

← Diffusion Model 自然语言处理→

最近更新
01
VideoLLMs
03-20
02
Video2Script
12-07
03
多模态
11-09
更多文章>
Theme by Vdoing | Copyright © 2022-2024 xzhouzeng | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式