商汤秒画

4个月前发布 2,395 0 0

商汤自研作画大模型和便捷的LoRA训练能力

所在地:
中国
收录时间:
2024-12-16
商汤秒画商汤秒画
商汤秒画

商汤秒画生成算法的核心思想采用了基于扩散模型的方式训练生成大模型,使其能够实现文本输入指导对应语义的图像生成。在前向扩散阶段,图像被逐渐引入的噪声污染,直到图像成为完全随机噪声。在反向过程中,利用一系列马尔可夫链在每个时间步逐步去除预测噪声,从而从高斯噪声中恢复数据。在具体的训练中,通过采用图像多尺度分布式训练与一系列自研算法如hierarchical inference experts,mixture of token experts,imagequality-aware distributed training, texture-guidedcross-attentionlearming 等算法,使其具备更优的文本理解泛化性、图像生成风格广度以及图像高质量生成细节。

该算法落地在秒画WEB站点的文生图,图生图,魔改等功能上用户提供提交 Prompt+图片,利用商汤秒画内容生成算法将用户提交的内容进行理解与扩展后生成,最终以图片的形式展现给用户,用于提升内容生成效率。

数据统计

相关导航